Proces ten obejmuje gromadzenie danych, czyszczenie, etykietowanie (ręczne lub wspomagane przez AI), zapewnienie jakości i ostateczne dostarczenie zestawu danych. W niektórych przypadkach dodawana jest ciągła adnotacja, aby modele były aktualizowane w miarę napływu nowych danych.