Il tuo messaggio è stato inviato.
Elaboreremo la vostra richiesta e vi ricontatteremo al più presto.
Il modulo è stato inviato con successo.
Ulteriori informazioni sono contenute nella vostra casella di posta elettronica.

Selezionare la lingua

Creazione del modulo di parsing di base per la piattaforma di gestione dei contratti di Leganta, che scompone i documenti legali complessi in dati strutturati e ricercabili e integra l'intelligenza artificiale per la classificazione automatica dei campi e l'analisi semantica dei contenuti (DORA / NIS2 ready).

LEGANTA® è un'azienda tecnologica con sede in Germania che sta costruendo una piattaforma di gestione dei documenti pensata per le organizzazioni che gestiscono grandi volumi di contratti, principalmente istituzioni finanziarie e imprese. L'idea di base del prodotto è semplice: invece di far scorrere le persone su PDF di 60 o 80 pagine alla ricerca di ciò che serve, il sistema converte questi documenti in oggetti strutturati e ricercabili che gli utenti possono filtrare, aggiornare e lavorare direttamente. Applicazioni importanti sono le trasformazioni semantiche dei contratti DORA / NIS2.
Leganta si è rivolta a Innowise per costruire il pezzo centrale di questo prodotto. Questo modulo è responsabile dell'acquisizione di un contratto PDF grezzo e della sua scomposizione in sezioni semantiche che possono essere elaborate dal sistema interno esistente.
Il team di Innowise ha assunto la responsabilità di una parte significativa del nuovo prodotto fin dall'inizio del nostro impegno. Ha lavorato a stretto contatto con il nostro responsabile tecnico per apprendere la base di codice attuale, assistere nella progettazione dell'architettura e partecipare alle decisioni architettoniche fin dal primo giorno del progetto. Nel corso dell'intera collaborazione, abbiamo goduto di una buona comunicazione, con frequenti riunioni giornaliere di standup e sessioni di sincronizzazione regolarmente programmate.

Leganta aveva bisogno di un modo affidabile e automatizzato per prendere un contratto PDF grezzo e trasformarlo in oggetti strutturati, in modo che gli esperti non dovessero farlo a mano. Costruire questo modulo da zero è stata la sfida principale di questo progetto.
Per affrontare queste sfide, Innowise ha costruito il modulo di analisi dei documenti da zero. Il lavoro ha riguardato la logica del backend, l'interfaccia del frontend e l'infrastruttura di distribuzione, con i due sviluppatori che si sono divisi le responsabilità sull'intero stack.
Il primo compito è stato quello di costruire il motore di parsing. Abbiamo iniziato integrando Apache POI per estrarre il contenuto testuale dai contratti PDF caricati, insieme ai metadati di formattazione incorporati in ogni file. Abbiamo usato questi metadati, gli stili delle intestazioni, le interruzioni di paragrafo e i pesi dei caratteri come segnali che guidano la logica di parsing.
Una volta che il parsing di base ha funzionato, abbiamo costruito un sistema di template su di esso. L'idea è nata da un'osservazione pratica: le organizzazioni che elaborano grandi volumi di contratti simili, come le banche che utilizzano contratti di prestito standardizzati, incontrano ripetutamente le stesse strutture documentali.
Parallelamente al nostro lavoro, gli esperti del cliente hanno sviluppato un livello di classificazione basato su GPT che si colloca sopra le sezioni analizzate. Il suo compito è quello di classificare ogni sezione rispetto ai tipi di entità interni alla piattaforma.
Intorno al motore di parsing, abbiamo costruito l'intero livello di gestione con cui gli utenti interagiscono quotidianamente.
Abbiamo scritto i file Docker per tutti i servizi, configurato le distribuzioni e i servizi Kubernetes, configurato l'ingress con i certificati TLS e costruito la pipeline CI su GitHub Actions per gestire le fasi di compilazione, push delle immagini e pubblicazione.
La collaborazione con il team di Leganta ha funzionato bene fin dall'inizio. Il responsabile tecnico del cliente era disponibile, chiaro su ciò di cui aveva bisogno e aperto quando avevamo una visione diversa di qualcosa. Siamo arrivati, abbiamo familiarizzato con quello che c'era già e da quel momento abbiamo progettato l'architettura insieme. All'inizio l'ambito era davvero aperto e l'unico requisito fondamentale era MongoDB, quindi molte decisioni tecniche sono state prese attraverso una discussione continua. Questo tipo di collaborazione è più facile quando l'altra parte conosce bene il proprio prodotto, e il team di Leganta lo conosceva. Lavoriamo a questo progetto dall'inizio del 2024 e il ritmo di lavoro è rimasto costante.

Java 17, avvio Spring
Vue.js, Vuetify, TypeScript, Pinia
MongoDB
H2
Apache POI
GitHub Actions
Test unitari, test di integrazione (backend), Selenium (frontend)
Docker, Kubernetes

Il modulo di parsing è attivo e in produzione. Leganta lo utilizza come punto di ingresso nel proprio flusso di lavoro di gestione dei contratti.
Il team ha consegnato tutto ciò che era stato pianificato e spedito con un ciclo di rilascio bisettimanale. Il modulo di parsing è diventato operativo e Leganta ha iniziato a utilizzarlo nel suo flusso di lavoro quotidiano.
Il tuo messaggio è stato inviato.
Elaboreremo la vostra richiesta e vi ricontatteremo al più presto.

Iscrivendosi si accetta il nostro Informativa sulla privacy, compreso l'uso dei cookie e il trasferimento dei vostri dati personali.