Leganta Logо

Plataforma de processamento de documentos rica em funcionalidades para bancos e empresas

Construção do módulo de análise principal para a plataforma de gestão de contratos da Leganta, que decompõe documentos jurídicos complexos em dados estruturados e pesquisáveis e integra IA para classificação automática de campos e análise de conteúdo semântico (preparado para DORA / NIS2).

airplane in the sky image
Empregados <50
Região Alemanha
Cliente desde 2024

Visão geral do cliente

Resumo por IA

A LEGANTA® é uma empresa tecnológica sediada na Alemanha que está a desenvolver uma plataforma de gestão de documentos concebida para organizações que lidam com grandes volumes de contratos, principalmente instituições financeiras e empresas. A ideia central do produto é simples: em vez de obrigar as pessoas a percorrerem PDFs de 60 ou 80 páginas à procura do que precisam, o sistema converte esses documentos em objectos estruturados e pesquisáveis que os utilizadores podem filtrar, atualizar e trabalhar diretamente. Aplicações importantes são as transformações semânticas de contratos DORA / NIS2.

A Leganta procurou o Innowise para construir a peça central desse produto. Este módulo é responsável por pegar num PDF de contrato em bruto e dividi-lo em secções semânticas que o seu sistema interno existente pode depois processar.

Quote icon

A equipa Innowise assumiu a responsabilidade por uma parte significativa do novo produto desde o início do nosso compromisso. Trabalharam em estreita colaboração com o nosso líder técnico para conhecer a base de código atual, ajudar a conceber a sua arquitetura e estiveram envolvidos na tomada de decisões de arquitetura desde o primeiro dia do projeto. Ao longo de toda esta colaboração, desfrutámos de uma boa comunicação, com reuniões diárias frequentes e sessões de sincronização regularmente agendadas.

Flyyo logo
Hugo Christian Rieß DIRECTOR EXECUTIVO, LEGANTA
Letter of recommendation, Page 1

Desafio

A Leganta precisava de uma forma fiável e automatizada de pegar num contrato PDF em bruto e transformá-lo em objectos estruturados, para que os especialistas não tivessem de o fazer à mão. Construir esse módulo de raiz foi o principal desafio deste projeto.

  • Processamento manual moroso. Anteriormente, os funcionários liam manualmente contratos enormes para extrair entidades específicas. Esta rotina manual tornava as operações mais lentas e aumentava o risco de erro humano.
  • Sobrecarga de informação. Os acordos empresariais contêm quantidades excessivas de texto. Os utilizadores necessitam de um método para isolar objectos de dados cruciais para preparar documentos para integrações ERP ou assinaturas electrónicas de forma eficiente.
  • Conformidade legal. A modificação automatizada de textos apresenta riscos jurídicos graves. O sistema deve preservar a redação original exacta das cláusulas jurídicas para evitar qualquer má interpretação ou litígio contratual.
  • Não existe uma base de dados ou lógica de análise. O cliente não tinha uma base existente para a análise de contratos, mas sabia que queria utilizar o MongoDB. O projeto exigia a criação de uma base de dados a partir do zero e a construção de toda a lógica central sobre ela para suportar a nova funcionalidade.
  • Formatos de documentos imprevisíveis. Os contratos corporativos vêm com estilos variados, layouts irregulares e tabelas de conteúdo complexas. O Leganta precisava de um algoritmo fiável para extrair com precisão o texto destes ficheiros PDF imprevisíveis.
  • Cloud e implantação no local. A Leganta exigia que a plataforma operasse perfeitamente como uma solução hospedada na nuvem e uma instalação local no local para satisfazer vários clientes corporativos. A arquitetura de base tinha de aproveitar ferramentas de contentorização versáteis, como o Docker e o Kubernetes, para suportar estes ambientes de alojamento duplo desde o início.

Solução

Para responder a estes desafios, o Innowise construiu o módulo de análise de documentos de raiz. O trabalho abrangeu a lógica de backend, a interface de frontend e a infraestrutura de implementação, com os dois programadores a dividirem as responsabilidades por toda a pilha.

Análise de documentos e segmentação semântica

A primeira tarefa foi construir o motor de análise. Começámos por integrar o Apache POI para extrair o conteúdo de texto dos contratos PDF carregados, juntamente com os metadados de formatação incorporados em cada ficheiro. Utilizámos esses metadados, estilos de título, quebras de parágrafo e pesos de letra como sinais que orientam a lógica de análise.

  • A nossa equipa desenvolveu um algoritmo de segmentação personalizado que divide o texto extraído em unidades semânticas: cláusulas individuais, secções e campos de dados que os utilizadores podem visualizar, editar e trabalhar diretamente.
  • Desenvolvemos as regras de segmentação e testámo-las com amostras reais de contratos até os resultados serem consistentes e significativos. Armazenamos todas as secções analisadas como objectos estruturados em MongoDB.
  • No frontend, criámos uma interface de dois painéis. Colocámos o PDF original à esquerda, para que os utilizadores tenham sempre o documento de origem à vista, e criámos uma tabela editável de secções analisadas à direita. Desta forma, os utilizadores podem comparar a fonte com os dados extraídos em qualquer altura.
  • Os nossos especialistas também alargaram uma biblioteca de renderização de PDF de código aberto, porque a versão gratuita não tratava de determinados casos extremos, pelo que a colocámos manualmente ao nível das alternativas pagas.
  • Também criámos um conjunto de ferramentas de edição para que os utilizadores possam corrigir o resultado sempre que necessário. Podem juntar secções que o algoritmo dividiu incorretamente, ajustar títulos, preencher campos e alterar qualquer parte da estrutura antes de guardar. Concebemos o fluxo para ser rápido, uma vez que a precisão da análise depende da qualidade do documento e os utilizadores precisam frequentemente de fazer correcções.

Sistema de modelos para tipos de documentos recorrentes

Uma vez que o núcleo de análise estava a funcionar, construímos um sistema de modelos em cima dele. A ideia surgiu de uma observação prática: as organizações que processam grandes volumes de contratos semelhantes, como os bancos que utilizam contratos de empréstimo normalizados, deparam-se repetidamente com as mesmas estruturas de documentos.

  • Criámos uma função de guardar como modelo que permite aos utilizadores capturar um documento totalmente estruturado e corrigido como um padrão reutilizável. Quando chega um novo contrato com uma estrutura semelhante, o sistema aplica automaticamente esse padrão durante a análise.
  • Para documentos com modelos correspondentes, a precisão na primeira passagem é substancialmente maior e o tempo que os utilizadores gastam na revisão manual diminui em conformidade.

Integração da IA para classificação no terreno

Em paralelo com o nosso trabalho, os especialistas do cliente desenvolveram uma camada de classificação baseada em GPT que se encontra no topo das secções analisadas. A sua função é classificar cada secção em relação aos tipos de entidades internas da plataforma.

  • A nossa responsabilidade era garantir que a saída analisada alimentava essa camada de forma limpa. Dito isto, estruturámos as secções de forma a serem consistentemente delimitadas e bem formadas para que a classificação da IA pudesse funcionar de forma fiável em cima delas.
  • Coordenámos de perto com a equipa do cliente o formato de transferência entre as duas camadas. A equipa do cliente construiu a camada de IA no seu lado. E a nossa função era garantir que as secções analisadas eram alimentadas de forma limpa.

Camada de gestão de projectos e documentos

Em torno do motor de análise, construímos toda a camada de gestão com a qual os utilizadores interagem no dia a dia.

  • A nossa equipa criou a estrutura do projeto, que permite aos utilizadores agrupar documentos relacionados no âmbito de uma única negociação de contrato ou negócio. Também criámos o fluxo de carregamento e ciclo de vida dos documentos, bem como a camada CRUD completa para gerir projectos e documentos.
  • Configurámos o H2 como um armazenamento leve e autónomo para credenciais e funções, mantendo-o separado dos dados do documento principal no MongoDB.

Infraestrutura e implantação

Escrevemos Dockerfiles para todos os serviços, configuramos implantações e serviços do Kubernetes, configuramos o ingress com certificados TLS e criamos o pipeline de CI no GitHub Actions para lidar com as etapas de criação, envio de imagem e publicação.

  • Implementámos a plataforma na infraestrutura fornecida pela Syseleven, o parceiro alemão da Leganta na nuvem.
  • Estruturámos a configuração em contentor para também suportar a implementação no local nos locais do cliente, o que a Leganta exige para alguns dos seus clientes empresariais.
Quote icon

A colaboração com a equipa Leganta funcionou bem desde o início. O responsável técnico do cliente estava disponível, era claro quanto às suas necessidades e estava aberto quando tínhamos uma visão diferente de algo. Chegámos, familiarizámo-nos com o que já existia e, a partir daí, definimos a arquitetura em conjunto. O âmbito era genuinamente aberto no início, e o único requisito rígido era o MongoDB, pelo que muitas das decisões técnicas aconteceram através de uma discussão contínua. Este tipo de colaboração de trabalho é mais fácil quando a outra parte conhece bem o seu produto, e a equipa da Leganta conhecia. Estamos neste projeto desde o início de 2024, e o ritmo de trabalho tem-se mantido consistente.

Dmitry Nazarevich
Dmitry Nazarevich Director de Tecnologia

Tecnologias

Backend

Java 17, Spring Boot

Frontend

Vue.js, Vuetify, TypeScript, Pinia

Base de dados (principal)

MongoDB

Base de dados (autenticação)

H2

Processamento de PDF

POI Apache

IC

GitHub Actions

Ensaios

Testes unitários, testes de integração (backend), Selenium (frontend)

Contentores

Docker, Kubernetes

Equipa

Icon 1
Programador Back-End
Icon 1
Programador Full-Stack
Innowise team

Resultados

Duração do projecto
fevereiro de 2024 - 2025

O módulo de análise está ativo e em produção. A Leganta utiliza-o como ponto de entrada no seu fluxo de trabalho de gestão de contratos.

  • O tempo de estruturação dos contratos foi reduzido de horas para segundos. Atualmente, o sistema produz uma estrutura inicial analisada em cerca de 10 segundos. Durante as demonstrações, um contrato completo, revisto, corrigido quando necessário e completamente preenchido, ficou pronto numa hora. Para os documentos que correspondem a um modelo existente, a análise inicial aproxima-se da versão final, com um mínimo de correcções.
  • Os modelos tornam o trabalho repetitivo mais rápido de cada vez. Depois de um contrato ter sido estruturado e guardado como modelo, os documentos subsequentes do mesmo tipo reutilizam automaticamente essa estrutura. As organizações que lidam com grandes volumes de contratos semelhantes, sendo os bancos o principal alvo, vêem o benefício composto em todos os contratos processados.
  • Plataforma implantada e em funcionamento na produção. A plataforma suporta tanto a infraestrutura de nuvem como a implementação no local para clientes empresariais que necessitem. A equipa tem mantido um ciclo de lançamento quinzenal consistente desde o início do projeto.
  • Motor de transformação semântica. A LEGANTA® oferece uma capacidade de transformação semântica que converte qualquer documento em estruturas de destino livremente selecionáveis. Isto permite um alinhamento preciso com os objectivos específicos do cliente e uma integração perfeita nas paisagens IT existentes. Em sua essência, o mecanismo interpreta documentos como espaços de informação semântica. Reestrutura-os e enriquece-os para que as organizações possam incorporar os dados resultantes diretamente nos seus sistemas operacionais, de conformidade, de risco ou analíticos, sem remodelação manual.
  • Integração perfeita do sistema. A solução sintetiza-se perfeitamente com os módulos de autenticação e outros módulos existentes no cliente e permite exportações de dados sem problemas para outros sistemas internos.

A equipa cumpriu tudo o que estava planeado e foi enviada num ciclo de lançamento quinzenal consistente. O módulo de análise foi ativado e a Leganta começou a utilizá-lo no seu fluxo de trabalho diário de contratos.

Índice

Construa e melhore a sua plataforma com o Innowise

    Contactar-nos

    Marcar uma chamada ou preencha o formulário abaixo e entraremos em contacto consigo assim que tivermos processado o seu pedido.

    Envie-nos uma mensagem de voz
    Anexar documentos
    Enviar ficheiro

    Pode anexar um ficheiro com um máximo de 2MB. Formatos de ficheiro válidos: pdf, jpg, jpeg, png.

    Ao clicar em Enviar, o utilizador autoriza a Innowise a processar os seus dados pessoais de acordo com a nossa Política de privacidade para lhe fornecer informações relevantes. Ao enviar o seu número de telefone, o utilizador aceita que o possamos contactar através de chamadas de voz, SMS e aplicações de mensagens. Poderão ser aplicadas tarifas de chamadas, mensagens e dados.

    Pode também enviar-nos o seu pedido
    para contact@innowise.com
    O que é que acontece a seguir?
    1

    Assim que recebermos e processarmos o seu pedido, entraremos em contacto consigo para necessidades do seu projeto e assinar um NDA para garantir a confidencialidade.

    2

    Depois de analisarmos os seus desejos, necessidades e expectativas, a nossa equipa elaborará uma proposta de projeto proposta de projeto com o âmbito do trabalho, dimensão da equipa, tempo e estimativas de custos.

    3

    Marcaremos uma reunião consigo para discutir a oferta e acertar os pormenores.

    4

    Por fim, assinaremos um contrato e começaremos a trabalhar no seu projeto imediatamente.

    arrow