Caso de uso principal
Clasificación, regresión, previsión, detección de anomalías, recomendación
Chat, búsqueda, resumen, copilotos, generación de contenidos, preguntas y respuestas sobre documentos
Lenguaje de programación
Python, R
Python, JavaScript / TypeScript
Pila de modelos básicos
Scikit-learn, XGBoost, PyTorch, TensorFlow
PyTorch, TensorFlow, Transformadores de caras abrazadas
Capa de datos
Pandas, NumPy, canalización de funciones
Pandas, NumPy, análisis sintáctico de documentos, chunking, incrustaciones
ServicioCapa API
FastAPI, Flask
FastAPI, Flask, vLLM, Ollama
App UI/creación de prototipos
Jupyter Notebook, Streamlit, aplicación web
Gradio, Streamlit, aplicación web
Almacenamiento
PostgreSQL, MongoDB, almacenamiento de objetos
PostgreSQL, MongoDB, Pinecone, Qdrant, Milvus, pgvector
Capa de recuperación
Normalmente no es necesario
Almacenamiento vectorial/índice vectorial, incrustación, reordenación
Orquestación de modelos
Trabajos por lotes, puntos finales del modelo y canalizaciones programadas
LangChain, LangGraph, LlamaIndex, Núcleo semántico
Seguimiento de experimentos/evaluación
MLflow, métricas offline, pruebas A/B
MLflow, evaluación rápida, controles de calidad de la respuesta, rastreo
Containerización
Docker
Docker
Orquestación/escalado
Kubernetes
Kubernetes
Plataforma Cloud
AWS, Azure, Google Cloud
AWS, Azure, Google Cloud
Supervisión
Registros, latencia, precisión, deriva, métricas infra
Registros, latencia, uso de tokens, calidad de respuesta, métricas infra
CI/CD
Acciones de GitHub, GitLab CI, Jenkins
Acciones de GitHub, GitLab CI, Jenkins
Pruebas
Pruebas unitarias, pruebas de integración, pruebas de carga
Pruebas unitarias, pruebas de integración, pruebas de carga, evaluación de indicaciones y resultados