Wiadomość została wysłana.
Przetworzymy Twoją prośbę i skontaktujemy się z Tobą tak szybko, jak to możliwe.
Formularz został pomyślnie przesłany.
Więcej informacji można znaleźć w skrzynce pocztowej.


Zbudowanie podstawowego modułu parsowania dla platformy zarządzania umowami Leganta, który rozbija złożone dokumenty prawne na ustrukturyzowane, możliwe do przeszukiwania dane i integruje sztuczną inteligencję do automatycznej klasyfikacji pól i semantycznej analizy treści (gotowe do DORA / NIS2).

LEGANTA® to niemiecka firma technologiczna tworząca platformę do zarządzania dokumentami przeznaczoną dla organizacji obsługujących duże ilości umów, głównie instytucji finansowych i przedsiębiorstw. Główna idea produktu jest prosta: zamiast zmuszać ludzi do przewijania 60- lub 80-stronicowych plików PDF w poszukiwaniu tego, czego potrzebują, system konwertuje te dokumenty na ustrukturyzowane, przeszukiwalne obiekty, które użytkownicy mogą filtrować, aktualizować i pracować z nimi bezpośrednio. Ważnymi zastosowaniami są semantyczne transformacje umów DORA / NIS2.
Leganta zgłosiła się do Innowise, aby zbudować centralny element tego produktu. Moduł ten jest odpowiedzialny za pobieranie nieprzetworzonego pliku PDF z umową i dzielenie go na sekcje semantyczne, które mogą być następnie przetwarzane przez istniejący system wewnętrzny.
Zespół Innowise przejął odpowiedzialność za znaczną część nowego produktu od samego początku naszego zaangażowania. Bardzo ściśle współpracowali z naszym kierownikiem technicznym, aby poznać obecną bazę kodu, pomóc w projektowaniu architektury i byli zaangażowani w podejmowanie decyzji architektonicznych od pierwszego dnia projektu. Przez cały czas trwania tej współpracy cieszyliśmy się dobrą komunikacją, z częstymi codziennymi spotkaniami standup i regularnie zaplanowanymi sesjami synchronizacji.

Firma Leganta potrzebowała niezawodnego, zautomatyzowanego sposobu na pobranie surowego kontraktu PDF i przekształcenie go w ustrukturyzowane obiekty, aby eksperci nie musieli robić tego ręcznie. Zbudowanie tego modułu od podstaw było głównym wyzwaniem w tym projekcie.
Aby sprostać tym wyzwaniom, Innowise zbudował moduł parsowania dokumentów od podstaw. Prace obejmowały logikę backendu, interfejs frontendowy i infrastrukturę wdrożeniową, przy czym dwaj programiści podzielili się obowiązkami w całym stosie.
Pierwszym zadaniem było zbudowanie silnika parsującego. Zaczęliśmy od integracji Apache POI, aby wyodrębnić zawartość tekstową z przesłanych umów PDF, wraz z metadanymi formatowania osadzonymi w każdym pliku. Wykorzystaliśmy te metadane, style nagłówków, podziały akapitów i grubości czcionek jako sygnały sterujące logiką parsowania.
Gdy już podstawowe parsowanie działało, zbudowaliśmy na nim system szablonów. Pomysł zrodził się z praktycznej obserwacji: organizacje przetwarzające duże ilości podobnych umów, takie jak banki korzystające ze standardowych umów kredytowych, wielokrotnie napotykają te same struktury dokumentów.
Równolegle z naszą pracą, eksperci klienta opracowali warstwę klasyfikacji opartą na GPT, która znajduje się na szczycie analizowanych sekcji. Jej zadaniem jest klasyfikowanie każdej sekcji względem wewnętrznych typów jednostek platformy.
Wokół silnika parsującego zbudowaliśmy pełną warstwę zarządzania, z którą użytkownicy wchodzą w interakcję każdego dnia.
Napisaliśmy pliki Dockerfile dla wszystkich usług, skonfigurowaliśmy wdrożenia i usługi Kubernetes, skonfigurowaliśmy ingress z certyfikatami TLS i zbudowaliśmy potok CI na GitHub Actions, aby obsłużyć etapy kompilacji, wypychania obrazów i publikowania.
Współpraca z zespołem Leganta układała się dobrze od samego początku. Kierownik techniczny klienta był dostępny, miał jasność co do tego, czego potrzebuje i był otwarty, gdy mieliśmy inne podejście do czegoś. Weszliśmy, zapoznaliśmy się z tym, co już tam było i od tego momentu wspólnie opracowaliśmy architekturę. Na początku zakres był naprawdę otwarty, a jedynym twardym wymaganiem było MongoDB, więc wiele decyzji technicznych zapadło w wyniku ciągłej dyskusji. Ten rodzaj współpracy jest łatwiejszy, gdy druga strona dobrze zna swój produkt, a zespół Leganta tak właśnie zrobił. Pracujemy nad tym projektem od początku 2024 roku, a rytm pracy pozostał spójny przez cały czas.

Java 17, Spring Boot
Vue.js, Vuetify, TypeScript, Pinia
MongoDB
H2
Apache POI
GitHub Actions
Testy jednostkowe, testy integracyjne (backend), Selenium (frontend)
Docker, Kubernetes

Moduł parsowania działa i jest w fazie produkcyjnej. Leganta wykorzystuje go jako punkt wejścia do swojego przepływu pracy w zakresie zarządzania umowami.
Zespół dostarczył wszystko, co zostało zaplanowane i wysłane w spójnym, dwutygodniowym cyklu wydawniczym. Moduł parsowania został uruchomiony, a Leganta zaczęła go używać w codziennym obiegu umów.
Wiadomość została wysłana.
Przetworzymy Twoją prośbę i skontaktujemy się z Tobą tak szybko, jak to możliwe.