Su mensaje ha sido enviado.
Procesaremos su solicitud y nos pondremos en contacto con usted lo antes posible.
El formulario se ha enviado correctamente.
Encontrará más información en su buzón.

Seleccionar idioma

Creación del módulo principal de análisis sintáctico para la plataforma de gestión de contratos de Leganta, que descompone documentos jurídicos complejos en datos estructurados que permiten búsquedas e integra IA para la clasificación automatizada de campos y el análisis semántico de contenidos (preparado para DORA / NIS2).

LEGANTA® es una empresa tecnológica con sede en Alemania que crea una plataforma de gestión de documentos diseñada para organizaciones que manejan grandes volúmenes de contratos, principalmente instituciones financieras y empresas. La idea central del producto es sencilla: en lugar de hacer que los usuarios se desplacen por documentos PDF de 60 u 80 páginas en busca de lo que necesitan, el sistema convierte esos documentos en objetos estructurados con capacidad de búsqueda que los usuarios pueden filtrar, actualizar y con los que pueden trabajar directamente. Aplicaciones importantes son las transformaciones semánticas de contratos DORA / NIS2.
Leganta acudió a Innowise para construir la pieza central de ese producto. Este módulo se encarga de tomar un PDF de contrato sin procesar y descomponerlo en secciones semánticas que su sistema interno puede procesar.
El equipo de Innowise se hizo cargo de una parte importante del nuevo producto desde el principio. Han trabajado muy estrechamente con nuestro jefe técnico para aprender el código base actual, ayudar a diseñar su arquitectura y han participado en la toma de decisiones arquitectónicas desde el primer día del proyecto. A lo largo de toda esta colaboración, hemos disfrutado de una buena comunicación, con frecuentes reuniones diarias y sesiones de sincronización programadas con regularidad.

Leganta necesitaba una forma fiable y automatizada de tomar un contrato PDF sin procesar y transformarlo en objetos estructurados, para que los expertos no tuvieran que hacerlo a mano. Crear ese módulo desde cero fue el principal reto de este proyecto.
Para hacer frente a estos retos, Innowise creó desde cero el módulo de análisis sintáctico de documentos. El trabajo abarcó la lógica del backend, la interfaz del frontend y la infraestructura de despliegue, y los dos desarrolladores se repartieron las responsabilidades entre toda la pila.
La primera tarea fue construir el motor de análisis sintáctico. Empezamos integrando Apache POI para extraer el contenido de texto de los contratos PDF cargados, junto con los metadatos de formato incrustados en cada archivo. Utilizamos esos metadatos, los estilos de los encabezados, los saltos de párrafo y los pesos de las fuentes como señales que dirigen la lógica de análisis.
Una vez que funcionó el núcleo del análisis sintáctico, construimos un sistema de plantillas sobre él. La idea surgió de una observación práctica: las organizaciones que procesan grandes volúmenes de contratos similares, como los bancos que utilizan acuerdos de préstamo estandarizados, se encuentran repetidamente con las mismas estructuras de documentos.
Paralelamente a nuestro trabajo, los expertos del cliente desarrollaron una capa de clasificación basada en GPT que se asienta sobre las secciones analizadas. Su función es clasificar cada sección en función de los tipos de entidad internos de la plataforma.
Alrededor del motor de análisis sintáctico, construimos toda la capa de gestión con la que los usuarios interactúan día a día.
Escribimos Dockerfiles para todos los servicios, configuramos despliegues y servicios Kubernetes, configuramos ingress con certificados TLS, y construimos el CI pipeline en GitHub Actions para manejar los pasos de build, image push, y publish.
La colaboración con el equipo de Leganta funcionó bien desde el principio. El responsable técnico del cliente estaba disponible, tenía claro lo que necesitaba y se mostraba abierto cuando teníamos una visión diferente de algo. Llegamos, nos familiarizamos con lo que ya existía y, a partir de ahí, diseñamos juntos la arquitectura. El alcance era realmente abierto al principio, y el único requisito estricto era MongoDB, por lo que muchas de las decisiones técnicas se tomaron a través de discusiones continuas. Este tipo de colaboración es más fácil cuando la otra parte conoce bien su producto, y el equipo de Leganta lo conocía. Llevamos en este proyecto desde principios de 2024, y el ritmo de trabajo se ha mantenido constante en todo momento.

Java 17, Spring Bota
Vue.js, Vuetify, TypeScript, Pinia
MongoDB
H2
PDI Apache
GitHub Actions
Pruebas unitarias, pruebas de integración (backend), Selenium (frontend)
Docker, Kubernetes

El módulo de análisis sintáctico ya está en funcionamiento. Leganta lo utiliza como punto de entrada a su flujo de trabajo de gestión de contratos.
El equipo cumplió todo lo previsto y realizó los envíos en un ciclo de publicación quincenal coherente. El módulo de análisis sintáctico se puso en marcha y Leganta empezó a utilizarlo en su flujo de trabajo diario.
Su mensaje ha sido enviado.
Procesaremos su solicitud y nos pondremos en contacto con usted lo antes posible.

Al registrarse, acepta nuestra Política de privacidadincluyendo el uso de cookies y la transferencia de su información personal.