Caso de utilização principal
Classificação, regressão, previsão, deteção de anomalias, recomendação
Chat, pesquisa, resumo, copilotos, geração de conteúdos, perguntas e respostas sobre documentos
Linguagem de programação
Python, R
Python, JavaScript / TypeScript
Pilha de modelos principais
Scikit-learn, XGBoost, PyTorch, TensorFlow
PyTorch, TensorFlow, Transformadores de rostos abraçados
Camada de dados
Pandas, NumPy, pipelines de funcionalidades
Pandas, NumPy, análise de documentos, chunking, embeddings
Servir/Camada API
FastAPI, Flask
FastAPI, Flask, vLLM, Ollama
App UI/prototipagem
Jupyter Notebook, Streamlit, aplicação Web
Gradio, Streamlit, aplicação Web
Armazenamento
PostgreSQL, MongoDB, armazenamento de objectos
PostgreSQL, MongoDB, Pinecone, Qdrant, Milvus, pgvector
Camada de recuperação
Normalmente não é necessário
Armazenamento vetorial/índice vetorial, embeddings, reranking
Orquestração de modelos
Trabalhos em lote, pontos de extremidade de modelo e pipelines programados
LangChain, LangGraph, LlamaIndex, Semantic Kernel
Acompanhamento da experiência/avaliação
MLflow, métricas offline, testes A/B
MLflow, avaliação rápida, controlos de qualidade das respostas, rastreio
Contentorização
Docker
Docker
Orquestração/dimensionamento
Kubernetes
Kubernetes
Plataforma Cloud
AWS, Azure, Google Cloud
AWS, Azure, Google Cloud
Monitorização e manutenção
Registos, latência, precisão, desvio, métricas de infra
Registos, latência, utilização de tokens, qualidade da resposta, métricas de infraestrutura
CI/CD
GitHub Actions, GitLab CI, Jenkins
GitHub Actions, GitLab CI, Jenkins
Ensaios
Testes unitários, testes de integração, testes de carga
Testes unitários, testes de integração, testes de carga, avaliação de resultados