Ihre Nachricht wurde gesendet.
Wir werden Ihre Anfrage bearbeiten und uns so schnell wie möglich mit Ihnen in Verbindung setzen.
Das Formular wurde erfolgreich abgeschickt.
Weitere Informationen finden Sie in Ihrem Briefkasten.

Sprache auswählen

Aufbau des Kern-Parsing-Moduls für die Vertragsmanagement-Plattform von Leganta, das komplexe juristische Dokumente in strukturierte, durchsuchbare Daten zerlegt und KI für die automatische Feldklassifizierung und semantische Inhaltsanalyse integriert (DORA / NIS2 ready).

LEGANTA® ist ein in Deutschland ansässiges Technologieunternehmen, das eine Dokumentenmanagement-Plattform für Organisationen entwickelt, die große Mengen an Verträgen bearbeiten, vor allem für Finanzinstitute und Unternehmen. Die Kernidee des Produkts ist einfach: Anstatt die Mitarbeiter durch 60- oder 80-seitige PDFs blättern zu lassen, um das zu finden, was sie brauchen, konvertiert das System diese Dokumente in strukturierte, durchsuchbare Objekte, die die Benutzer filtern, aktualisieren und direkt bearbeiten können. Wichtige Anwendungen sind semantische DORA / NIS2-Vertragstransformationen.
Leganta wandte sich an Innowise, um das Kernstück dieses Produkts zu entwickeln. Dieses Modul ist dafür verantwortlich, ein rohes Vertrags-PDF in semantische Abschnitte zu zerlegen, die das bestehende interne System dann verarbeiten kann.
Das Innowise-Team hat von Anfang an einen großen Teil des neuen Produkts übernommen. Sie haben sehr eng mit unserem technischen Leiter zusammengearbeitet, um die aktuelle Codebasis kennenzulernen, bei der Gestaltung der Architektur zu helfen und waren vom ersten Tag des Projekts an in architektonische Entscheidungen eingebunden. Während der gesamten Zusammenarbeit haben wir eine gute Kommunikation genossen, mit häufigen täglichen Standup-Meetings und regelmäßig angesetzten Synchronisierungssitzungen.

Leganta benötigte eine zuverlässige, automatisierte Methode, um einen PDF-Rohvertrag in strukturierte Objekte umzuwandeln, damit die Experten dies nicht von Hand tun mussten. Dieses Modul von Grund auf zu entwickeln, war die größte Herausforderung bei diesem Projekt.
Um diese Herausforderungen zu bewältigen, entwickelte Innowise das Modul für die Dokumentenanalyse von Grund auf neu. Die Arbeit umfasste die Backend-Logik, die Frontend-Schnittstelle und die Bereitstellungsinfrastruktur, wobei sich die beiden Entwickler die Verantwortung für den gesamten Stack teilten.
Die erste Aufgabe war der Aufbau der Parsing-Engine. Wir begannen mit der Integration von Apache POI, um Textinhalte aus hochgeladenen PDF-Verträgen zu extrahieren, zusammen mit den in jeder Datei eingebetteten Formatierungsmetadaten. Wir verwendeten diese Metadaten, Überschriftenstile, Absatzumbrüche und Schriftschnitte als Signale, die die Parsing-Logik steuern.
Sobald das Kernparsing funktionierte, bauten wir darauf ein Vorlagensystem auf. Die Idee entstand aus einer praktischen Beobachtung: Organisationen, die große Mengen ähnlicher Verträge verarbeiten, wie z. B. Banken, die standardisierte Darlehensverträge verwenden, stoßen immer wieder auf die gleichen Dokumentenstrukturen.
Parallel zu unserer Arbeit entwickelten die Experten des Kunden eine GPT-basierte Klassifizierungsschicht, die auf die geparsten Abschnitte aufgesetzt wird. Ihre Aufgabe ist es, jeden Abschnitt anhand der internen Entitätstypen der Plattform zu klassifizieren.
Um die Parsing-Engine herum haben wir die komplette Verwaltungsschicht aufgebaut, mit der die Benutzer täglich interagieren.
Wir schrieben Dockerfiles für alle Dienste, konfigurierten Kubernetes-Bereitstellungen und -Dienste, richteten Ingress mit TLS-Zertifikaten ein und bauten die CI-Pipeline auf GitHub Actions auf, um die Schritte Build, Image-Push und Veröffentlichung durchzuführen.
Die Zusammenarbeit mit dem Leganta-Team hat von Anfang an gut funktioniert. Der technische Leiter des Kunden war verfügbar, wusste genau, was er brauchte, und war offen, wenn wir eine andere Sichtweise auf etwas hatten. Wir kamen, machten uns mit dem Vorhandenen vertraut und erarbeiteten von da an gemeinsam die Architektur. Der Umfang war zu Beginn wirklich offen, und die einzige feste Vorgabe war MongoDB, so dass viele der technischen Entscheidungen durch laufende Diskussionen getroffen wurden. Diese Art der Zusammenarbeit ist einfacher, wenn die andere Seite ihr Produkt gut kennt, und das tat das Leganta-Team. Wir arbeiten seit Anfang 2024 an diesem Projekt, und der Arbeitsrhythmus ist immer gleich geblieben.

Java 17, Spring Stiefel
Vue.js, Vuetify, TypeScript, Pinia
MongoDB
H2
Apache POI
GitHub Actions
Unit-Tests, Integrationstests (Backend), Selenium (Frontend)
Docker, Kubernetes

Das Parsing-Modul ist im Einsatz und in Produktion. Leganta nutzt es als Einstiegspunkt in ihren Vertragsmanagement-Workflow.
Das Team lieferte alles, was geplant war, in einem konsistenten zweiwöchentlichen Release-Zyklus aus. Das Parsing-Modul wurde in Betrieb genommen, und Leganta begann, es im täglichen Vertragsablauf zu verwenden.
Ihre Nachricht wurde gesendet.
Wir werden Ihre Anfrage bearbeiten und uns so schnell wie möglich mit Ihnen in Verbindung setzen.

Mit der Anmeldung erklären Sie sich mit unseren Datenschutzerklärung