Główny przypadek użycia
Klasyfikacja, regresja, prognozowanie, wykrywanie anomalii, rekomendacje
Czat, wyszukiwanie, podsumowanie, copiloty, generowanie treści, dokument Q&A
Język programowania
Python, R
Python, JavaScript / TypeScript
Podstawowy stos modeli
Scikit-learn, XGBoost, PyTorch, TensorFlow
PyTorch, TensorFlow, transformatory przytulonej twarzy
Warstwa danych
Pandas, NumPy, potoki funkcji
Pandas, NumPy, parsowanie dokumentów, chunking, embeddings
Obsługa/Warstwa API
FastAPI, Flask
FastAPI, Flask, vLLM, Ollama
App UI/prototypowanie
Jupyter Notebook, Streamlit, aplikacja internetowa
Gradio, Streamlit, aplikacja internetowa
Przechowywanie
PostgreSQL, MongoDB, obiektowa pamięć masowa
PostgreSQL, MongoDB, Pinecone, Qdrant, Milvus, pgvector
Warstwa pobierania
Zazwyczaj nie jest to konieczne
Magazyn wektorowy/indeks wektorowy, zagnieżdżanie, reranking
Orkiestracja modelu
Zadania wsadowe, punkty końcowe modelu i zaplanowane potoki
LangChain, LangGraph, LlamaIndex, jądro semantyczne
Śledzenie eksperymentu/ocena
MLflow, metryki offline, testy A/B
MLflow, szybka ocena, kontrole jakości odpowiedzi, śledzenie
Konteneryzacja
Docker
Docker
Orkiestracja/skalowanie
Kubernetes
Kubernetes
Platforma Cloud
AWS, Azure, Google Cloud
AWS, Azure, Google Cloud
Monitorowanie
Logi, opóźnienia, dokładność, dryft, wskaźniki infra
Logi, opóźnienia, wykorzystanie tokenów, jakość odpowiedzi, metryki infra
CI/CD
GitHub Actions, GitLab CI, Jenkins
GitHub Actions, GitLab CI, Jenkins
Testowanie
Testy jednostkowe, testy integracyjne, testy obciążeniowe
Testy jednostkowe, testy integracyjne, testy obciążeniowe, ocena podpowiedzi/wyników