Optimizing data processing for precision medicine diagnostics

Innowise ulepszyło zaawansowaną platformę zarządzania danymi dla diagnostyki medycyny precyzyjnej, usprawniając analizę różnorodnych zbiorów danych opieki zdrowotnej w celu przyspieszenia dopasowania pacjenta do leczenia i zapewnienia krytycznych informacji dla rozwoju leków.

Wyzwanie

The precision medicine company faced significant  inefficiencies in its data processing pipelines and environment setup, hampering its ability to effectively aggregate, process, and analyze critical diagnostic test data from multiple sources. These inefficiencies led to delays in data availability for both inżynierów danych and end-users, potential data quality issues, and suboptimal AWS infrastructure resource utilization.

 The client also experienced challenges with adding new users and managing permissions for existing users within the AWS environment. Innowise’s team, consisting of DevOps engineers and data scientists, powierzono te zadania.

Rozwiązanie

Our experts led a comprehensive overhaul of the client’s software to implement a multifaceted solution.

Optymalizacja potoków CI/CD

Nasz DevOps engineers redesigned the infrastructure workflows to improve their efficiency and scalability. We performed profiling of the existing data pipelines to identify gaps and then optimized data structures and formats to reduce redundancy and improve processing efficiency. To further speed up data transformation and analysis, the experts implemented parallel processing techniques. We also improved and refactored code to enhance its maintainability. These efforts resulted in a streamlined, high-performance data pipeline system.

Optymalizacja i wdrażanie środowiska

Optymalizujemy wykorzystanie Infrastruktura chmury AWS poprzez dostosowanie rozmiaru instancji i wdrożenie automatycznego skalowania. Zastosowaliśmy również zasady Infrastructure-as-Code przy użyciu Terraform, aby zautomatyzować udostępnianie zasobów w chmurze i zarządzanie nimi. Docker pomógł w konteneryzacji środowiska przetwarzania danych w celu zapewnienia spójności między programowaniem, testowaniem i produkcją. Utworzono potok CI/CD w celu zautomatyzowania integracji kodu, testowania i wdrożeń. Skonfigurowaliśmy również automated environment testing to catch configuration issues early.

Optymalizacja zarządzania użytkownikami i uprawnieniami

Wdrożyliśmy najlepsze praktyki AWS IAM, aby usprawnić zarządzanie użytkownikami i uprawnieniami. Obejmowało to tworzenie zasad opartych na zasadzie najmniejszych uprawnień i konfigurowanie uwierzytelniania wieloskładnikowego (MFA) dla wszystkich użytkowników IAM. Zoptymalizowaliśmy typy instancji EC2 w oparciu o analizę obciążenia i skonfigurowaliśmy alarmy CloudWatch do proaktywnego monitorowania. Ponadto, aby ograniczyć zagrożenia bezpieczeństwa, opracowaliśmy zautomatyzowane skrypty do zarządzania użytkownikami i uprawnieniami.

Technologie

AWS

Infrastruktura jako kod

Terraform

Konteneryzacja

Docker, Amazon EKS

AWS RDS

Zabezpieczenia i zarządzanie dostępem

AWS IAM, AWS Secrets Manager

Monitorowanie i rejestrowanie

AWS Cloudwatch, Grafana, Prometheus

CI/CD

GitHub Actions

Usługa obliczeniowa

AWS EC2

Proces

To enhance the precision medicine data management platform, we followed a structured approach, ensuring each aspect of the solution was aligned with the client’s needs.

Zrozumienie wymagań

Zbadaliśmy potoki przetwarzania danych klienta i infrastrukturę AWS, wskazując nieefektywności i obszary wymagające poprawy.

Przeprojektowanie architektury

Zrestrukturyzowaliśmy system, aby usprawnić obsługę danych, skalowalność i bezpieczeństwo w ramach AWS.

Rozwój w metodyce Agile

Korzystając z Python i powiązanych narzędzi, ulepszyliśmy procesy zaplecza, struktury danych i wdrożyliśmy techniki przetwarzania równoległego.

Automatyzacja infrastruktury

Stworzyliśmy skrypty Terraform, aby usprawnić zarządzanie zasobami AWS.

Konteneryzacja i CI/CD

Skonteneryzowaliśmy środowisko przetwarzania danych za pomocą Dockera i skonfigurowaliśmy zautomatyzowane potoki integracji, testowania i wdrażania.

Testowanie

Oceniliśmy szybkość przetwarzania danych, dokładność, niezawodność systemu i środki bezpieczeństwa IAM.

Team required

1

Kierownik projektu

2

Inżynierowie DevOps

2

Analitycy danych

1

QA Engineer

Wyniki

Wdrożenie naszego rozwiązania doprowadziło do znacznej poprawy możliwości zarządzania danymi przez naszego klienta.

  • Szybkość przetwarzania danych: the optimized pipelines reduced data loading times, allowing faster access to processed data.
  • Efektywność zasobów: the reconfigured AWS environment led to a reduction in cloud computing costs.
  • Wymiana danychPłynny proces wymiany danych umożliwia teraz firmom farmaceutycznym szybszy dostęp do odpowiednich danych pacjentów.

    Skontaktuj się z nami

    Umów się na rozmowę lub wypełnij poniższy formularz, a my odezwiemy się do Ciebie po przetworzeniu Twojego zgłoszenia.

    Wyślij nam wiadomość głosową
    Załącz dokumenty
    Prześlij plik

    Można załączyć 1 plik o rozmiarze do 2 MB. Prawidłowe formaty plików: pdf, jpg, jpeg, png.

    Klikając "Wyślij", wyrażasz zgodę na przetwarzanie Twoich danych osobowych przez Innowise zgodnie z naszą Polityką Prywatności w celu przekazania Ci odpowiednich informacji. Podając numer telefonu, zgadzasz się na kontakt za pośrednictwem połączeń głosowych, SMS-ów lub komunikatorów. Mogą obowiązywać opłaty za połączenia, wiadomości i transmisję danych.

    Możesz także wysłać swoje zapytanie
    na contact@innowise.com
    Co dalej?
    1

    Po otrzymaniu i przetworzeniu zgłoszenia skontaktujemy się z Tobą, aby szczegółowo opisać projekt i podpisać umowę NDA w celu zapewnienia poufności.

    2

    Po zapoznaniu się z Twoimi potrzebami i oczekiwaniami, nasz zespół opracuje projekt wraz z zakresem prac, wielkością zespołu, wymaganym czasem i szacunkowymi kosztami.

    3

    Zorganizujemy spotkanie w celu omówienia oferty i ustalenia szczegółów.

    4

    Na koniec podpiszemy umowę, błyskawicznie rozpoczynając pracę nad projektem.

    strzałka