Medicinsk forskningssoftware: 60% reduktion i manuel datahåndtering

Innowise udførte en mangefacetteret software til medicinsk forskning opgradering for en ontologileverandør, der inkorporerer AI-drevet søgning, brugerdefinerede datadashboards og ontologiintegration i en kemisk forskningsvirksomheds infrastruktur.

Kunde

Region
EU
Kunde siden
2022

Vores klient, en førende enhed inden for ontologidomænet, opererer i Tyskland. Virksomheden har specialiseret sig i udvikling af teknologier, der udtrækker information fra strukturerede og ustrukturerede data og omdanner dem til viden til forskning, opdagelser og beslutningstagning. Deres ekspertise spænder over kemi, biologi og beslægtede videnskabelige områder. De ejer et stort ontologisystem, en struktureret ramme af indbyrdes forbundne videnskabelige termer og begreber.

Detaljerede oplysninger om klienten kan ikke videregives i henhold til vilkårene i NDA'en.

Udfordring

Begrænsede søge- og annotationsfunktioner, kompleksitet i oprettelsen af dashboards og det gamle systems manuelle dokumenthåndtering

De primære udfordringer, vores kunde stod over for, drejede sig om tre hovedområder: udvikling af en frontend til deres AI-drevne søgesystem, der automatiserer Datavisualisering i medicinsk forskningssoftware og integrere deres ontologier i en eksisterende kemisk forskningsvirksomheds system:

  • Udvikling af AI-drevet søgesystems front-end: Kundens primære udfordring var at forbedre frontenden af deres ontologibaserede søgesystem, der var skræddersyet til web- og mobilplatforme. Dette system var afgørende for håndteringen af en omfattende samling af videnskabelige artikler. Opgraderingen skulle gøre det lettere at søge, se kilder og kommentere videnskabelige begreber og termer i forskellige dokumentformater. Det tidligere systems begrænsninger, især manglen på søgefiltre og annoteringsfunktioner, forhindrede den fulde udnyttelse af deres videnskabelige database.
  • Automatisering af datavisualisering til videnskabelig forskning:< Kunden stod over for en udfordring med at automatisere datavisualisering til deres videnskabelige dataanalyse. Det krævede system skulle støtte dataforskere i at identificere, forberede og validere data samt i at skabe informative dashboards. Dette var afgørende for at kunne klassificere og forbinde medicinske enheder, identificere molekylære mål for nye lægemidler og lette forskningen i sygdomme.
  • Integration af ontologisystemer i kemisk forskning: Det var en unik udfordring at integrere kundens ontologier i en kemisk forskningsvirksomheds eksisterende system. Virksomhedens gamle system var stærkt afhængigt af manuelle processer til dokumenthåndtering og dataindtastning. Vores opgave var at modernisere dette system ved at automatisere dokumentanalyse og databaseuploads, udvikle en ny grænseflade og etablere en back-end-system. Systemet skulle understøtte to forskellige brugerroller: personer, der var ansvarlige for at uploade og redigere dokumenter, og administratorer, der skulle gennemgå og bekræfte disse indtastninger.

Løsning

AI-drevet søgesystem, automatiserede dashboards og problemfri ontologi-integration i kemisk forskning

Innowise's team fokuserede på tre centrale aspekter af projektet:

Forbedring af søgesystemet i medicinsk forskningssoftware

Vores team fokuserede på at udvikle og forbedre et specialiseret AI-drevet søgesystem - et vigtigt delsystem inden for en større ramme, der er designet til web- og mobilgrænseflader. Denne opgave involverede flere tekniske og funktionelle forbedringer:

  • Avanceret dokumentsøgning: Vi gjorde det muligt for systemet at foretage dybtgående søgninger på tværs af forskellige dokumentformater fra et stort dokumentarkiv. Systemet gav brugerne mulighed for at finde dokumenter, se interne og eksterne kilder og identificere vigtige videnskabelige begreber og kommentarer, der er fremhævet i disse dokumenter.
  • Annotation og kategorisering: En kritisk funktion var brugernes mulighed for at vælge specifikke ord eller billetter i dokumenter og tildele dem til relevante domæner til annotation. Vi integrerede GPT-baserede AI-funktioner for at vejlede brugerne i korrekt annotation og kategorisering af hver term eller enhed.
  • Indsendelses- og gennemgangsproces: Når der blev foretaget ændringer eller tilføjet nye oplysninger til et dokument, faciliterede systemet en gennemgangsproces. Brugerne kunne indsende disse ændringer, som derefter blev sendt til en administrator, der tildelte status og godkendte de nye annoteringer, kommentarer eller kategoriseringer.
  • Forespørgsels- og analysefunktioner: Brugerne kan nu vælge dokumenter fra en stor database og tilføje dem til en samlet kurv. De kan derefter søge i disse dokumenter ved hjælp af søgefeltet i Analyzer og stille specifikke spørgsmål eller anmode om resuméer og analyser baseret på GPT-teknologi.
  • Udvikling af brugerdefinerede filtre: Vores udvikler skabte sofistikerede filtre til dokumentsøgning, skræddersyet til forskellige kildetyper.
  • Udfordringer med dokumentvisning: En af de komplekse opgaver var at udvikle en dokumentfremviser, der kunne vise markerede anmærkninger på PDF-dokumenter. Det krævede indviklet back-end-koordinering for at overlejre annotationer korrekt.
  • Overhaling af ældre kode og arkitektur: Vi tog fat på udfordringerne med gammel kode og manglende arkitektonisk struktur og sikrede, at systemet blev bygget på et solidt, moderne teknologisk fundament.
  • Integration af flere GPT-versioner: Vores team forbedrede systemet med flere versioner af GPT (3.5, 4, Davinci), hvilket muliggjorde en mere alsidig dokumentanalyse.
  • LLM-integration: Innowise fokuserede på brugerdefineret LLM-udvikling, der giver brugerne mulighed for at indtaste forespørgsler i naturligt sprog. Når forespørgslerne er blevet konverteret til back-end-anmodninger, kan de sendes til serveren.

Automatisering af datavidenskabelige dashboards

Vores data science team fokuserede på at automatisere datavisualisering gennem dashboards, en afgørende komponent for kundens forskning i at identificere molekylære mål for nye farmaceutiske behandlinger. De primære sygdomme, der blev undersøgt, omfattede fedme og muskelsygdomme.

  • Oprettelse af dashboard: Teamets mål var at skabe dashboards til visualisering af farmaceutiske data. Det indebar behandling af store datasæt, som er et stort antal kommenterede medicinske artikler med unikt ID og metadata, for at danne store GBQ-tabeller. 

  • Visualisering af data: Brug af Looker StudioVi omdannede disse store datatabeller til mindre, mere håndterbare formater til oprettelse af dashboards. Dette visualiseringstrin var nødvendigt for, at eksperterne bedre kunne gennemgå og filtrere data.

  • Automatisering af dashboard: Efter godkendelse fra medicinske eksperter automatiserede vi oprettelsen af dashboardet ved hjælp af datatekniske teknikker. Det indebar brug af repositories med SQL-scripts til at hente de nødvendige oplysninger. Disse scripts blev planlagt til at køre med bestemte intervaller, hvilket sikrede, at dashboardet forblev opdateret med de seneste forskningsresultater.

  • Kontinuerlige opdateringer og integration: Vores løsning gjorde det muligt løbende at integrere nye relevante publikationer i dashboardet. Denne dynamiske opdateringsproces blev lettet af Google Cloud Functions. Det holdt dashboards opdateret med de nyeste data.

  • Håndtering af forespørgsler: Vi håndterede forespørgsler gennem store tabeller og trak specifikke oplysninger ud baseret på søgeforespørgsler. Teamet visualiserede derefter disse statistikker i dashboards og identificerede eventuelle problemer i søgeforespørgslerne.

Ontologiintegration i kemisk forskning

Vores projekt fokuserede på at integrere vores kundes ontologier i en etableret laboratorieadministrationssoftware hos en kemisk forskningsvirksomhed. Denne opgave involverede flere vigtige trin for at modernisere og automatisere deres forældede system:

  • Systemanalyse og forskning: Vi begyndte med en grundig analyse og undersøgelse af kundens gamle system. Dette software til laboratorieadministration, der primært bruges til at gemme rapporter og forskningsresultater, var baseret på ældre Java versioner og JSP-teknologier.
  • Udvikling af nyt interface og backend: Vores tilgang omfattede udvikling af en ny grænseflade og et nyt backend-system til at automatisere processen med dokumentanalyse og databaseopdatering, som tidligere blev udført manuelt.
  • Brugertyper og funktionaliteter: Vi har designet systemet til at imødekomme to forskellige brugertyper:
  • Dokumentoploader: Forskere, der tilføjer dokumenter til systemet. Når et dokument er kommenteret, vises det på en særlig side, hvor uploaderen kan gennemgå resultaterne, foretage ændringer og bekræfte indsendelsen til databasen.
  • Administrator: Ansvarlig for at gennemgå og bekræfte dokumenttilføjelser. Denne rolle indebærer en omfattende gennemgang af dokumenter med mulighed for at redigere, godkende eller foretage ændringer før endelig indtastning i databasen.
  • Backend-udvikling og revision af ældre kode: Vores udvikler påtog sig opgaven med at revidere den eksisterende legacy-kode. Det indebar at skrive JSP-sider i henhold til kundens specifikationer og udvikle back-end-funktionaliteter (anmodninger, svar, databehandling og databaseindtastning).
  • Udvikling af administrationsgrænseflade: Vi udviklede også en administratordel af systemet, hvor administratoren (typisk lederen af forskningsafdelingen) modtager en meddelelse med et link til grænsefladen, der viser oplysninger fra databasen.
  • Integration af ontologi-API: Kernen i vores løsning var at integrere Ontology API'en i kundens laboratorieadministrationssoftware. Denne API fungerede som et punkt for afsendelse af dokumentrelaterede forespørgsler og modtagelse af svar, som derefter blev behandlet og vist via frontend, før de blev sendt til kundens database.
  • Håndtering af dokumenter og data: I dette system blev dokumenter, der blev uploadet til det ontologiske system, behandlet, og de resulterende data blev gemt i virksomhedens kemiske forskningsdatabase. Dette muliggjorde automatisk analyse af dokumenter og hentning af vigtige oplysninger om kemiske forbindelser.
  • Full-stack-udvikling: Vores udvikler arbejdede som full-stack-ingeniør og tog sig af både frontend- og backend-aspekter og sørgede for problemfri integration af alle systemkomponenter.

Teknologier

Programmeringssprog

JavaScript, TypeScript, Java
React, react-pdf, Redux, Redux-thunk, React-redux, Primereact, SASS, Lodash, Axios, FileSaver, GPT-Tokenizer
Spring støvle, Java med Lucene-biblioteker, Stardog
Python (Pandas, Numpy, Plotly, Matplotlib), GCP (Google Big Query, Google Cloud Storage, Cloud Run), Looker, Data Studio, Apache Solr, brugerdefinerede værktøjer til databehandling og visualisering

Proces

Vores tilgang til udviklingsprocessen var metodisk og fulgte de agile principper, hvilket sikrede fleksibilitet og løbende forbedringer.

I begyndelsen udførte vi grundig research for at forstå kundens behov og eksisterende systemer for at kunne levere et detaljeret "Vision and Scope"-dokument. Baseret på de første resultater gik vi i gang med at designe og udvikle de nødvendige funktioner til hver stream. Vores team holdt regelmæssige sprintmøder for at bekræfte, at vores arbejde var i overensstemmelse med kundens forventninger. Alle funktioner blev implementeret og udsat for grundig test af ydeevne og nøjagtighed, og kunden gav løbende feedback.

Til effektiv kommunikation og projektsporing brugte vi Microsoft-værktøjer og Monday.com, hvilket sikrede en gennemsigtig proces og opdateringer i realtid.

Hold

1

Projektleder

3

React Udviklere

3

Java-udviklere

1

ML/Python Udvikler

2

Data Engineers

Resultater

50% hurtigere annotationsproces, 60% reduktion i manuel datahåndtering og 3x hurtigere datasøgning for forskere

I vores samarbejde med kunden, der spænder over tre hovedstrømme, har vi gjort betydelige fremskridt med hensyn til at fremme deres videnskabelige forskningskapacitet. Her er et øjebliksbillede af de faktiske resultater:

  • Strømlinede søgeoperationer: Vores teams indsats for at forfine søgesystemet førte til en fordobling af søgehastigheden, hvilket gavner forskere i deres søgen efter hurtig adgang til videnskabelige data.
  • Præcision i annotationer: Indførelsen af det automatiserede annotationssystem resulterede i øget annotationsnøjagtighed, en kritisk faktor for dybdegående videnskabelige studier.
  • Øget effektivitet i datahåndteringen: Ved at automatisere datavisualiseringsprocesser har vi effektivt halveret den tid, forskerne bruger på manuel datahåndtering, hvilket giver mere tid til kerneforskningsaktiviteter.
  • Forbedret databehandlingshastighed: Databehandlings- og visualiseringshastighederne blev tredoblet, hvilket markerede et spring i håndteringen af komplekse datasæt.
  • Optimeret brugeroplevelse: Den moderniserede brugergrænseflade i vores systemer har ført til en bemærkelsesværdig stigning i brugertilfredsheden, hvilket fremmer et bedre engagement i det videnskabelige samfund.
  • Frigjort forskningstid: Automatisering af rutineopgaver har ført til en 60% reduktion i manuel datahåndtering, hvilket har frigjort forskernes tid, som tidligere blev brugt på manuelt arbejde.
I øjeblikket fortsætter vores dedikerede team med at arbejde flittigt på systemet med fokus på udvikling af LLM'er for yderligere at forfine og forbedre kundens system. 
Projektets varighed
  • Juli 2022 - Løbende

60%

Reduktion af manuel datahåndtering

3x

øget hastighed i datasøgning

50%

hurtigere annotationsproces

    Kontakt os

    Book et opkald eller udfyld formularen nedenfor, så vender vi tilbage til dig, når vi har behandlet din anmodning.

    Send os en talebesked
    Vedhæft dokumenter
    Upload fil

    Du kan vedhæfte 1 fil på op til 2 MB. Gyldige filformater: pdf, jpg, jpeg, png.

    Ved at klikke på Send accepterer du, at Innowise behandler dine personlige data i henhold til vores Politik for beskyttelse af personlige oplysninger for at give dig relevante oplysninger. Ved at indsende dit telefonnummer accepterer du, at vi kan kontakte dig via taleopkald, sms og beskedapps. Opkalds-, besked- og datatakster kan være gældende.

    Du kan også sende os din anmodning
    til contact@innowise.com

    Hvad sker der nu?

    1

    Når vi har modtaget og behandlet din anmodning, vender vi tilbage til dig for at beskrive dine projektbehov og underskriver en NDA for at sikre fortrolighed.

    2

    Når vi har undersøgt dine ønsker, behov og forventninger, udarbejder vores team et projektforslag med forslag med arbejdets omfang, teamstørrelse, tids- og omkostningsoverslag.

    3

    Vi arrangerer et møde med dig for at diskutere tilbuddet og få detaljerne på plads.

    4

    Til sidst underskriver vi en kontrakt og begynder at arbejde på dit projekt med det samme.

    pil