Cas d'utilisation principal
Classification, régression, prévision, détection des anomalies, recommandation
Chat, recherche, résumé, copilotes, génération de contenu, document Q&A
Langage de programmation
Python, R
Python, JavaScript / TypeScript
Pile de modèles de base
Scikit-learn, XGBoost, PyTorch, TensorFlow
PyTorch, TensorFlow, Transformateurs de visages étreints
Couche de données
Pandas, NumPy, pipelines de fonctionnalités
Pandas, NumPy, analyse de documents, chunking, embeddings
Servir/Couche API
FastAPI, Flask
FastAPI, Flask, vLLM, Ollama
App UI/prototypage
Jupyter Notebook, Streamlit, application web
Gradio, Streamlit, application web
Stockage
PostgreSQL, MongoDB, stockage d'objets
PostgreSQL, MongoDB, Pinecone, Qdrant, Milvus, pgvector
Couche de récupération
Généralement pas nécessaire
Stockage vectoriel/index vectoriel, enchâssements, reranking
Orchestration de modèles
Travaux par lots, points d'extrémité de modèles et pipelines programmés
LangChain, LangGraph, LlamaIndex, Semantic Kernel (noyau sémantique)
Suivi des expériences/l'évaluation
MLflow, mesures hors ligne, tests A/B
MLflow, évaluation rapide, contrôle de la qualité des réponses, traçage
Containerisation
Docker
Docker
Orchestration/mise à l'échelle
Kubernetes
Kubernetes
Plate-forme Cloud
AWS, Azure, Google Cloud
AWS, Azure, Google Cloud
Surveillance
Journaux, latence, précision, dérive, métriques infra
Journaux, latence, utilisation de jetons, qualité des réponses, métriques d'infrastructure
CI/CD
Actions GitHub, GitLab CI, Jenkins
Actions GitHub, GitLab CI, Jenkins
Test
Tests unitaires, tests d'intégration, tests de charge
Tests unitaires, tests d'intégration, tests de charge, évaluation des résultats.