Formularz został pomyślnie przesłany.
Więcej informacji można znaleźć w skrzynce pocztowej.
Wyobraź sobie taką sytuację: poświęcasz tygodnie (i gruby kawałek budżetu) na inicjatywę AI, tylko po to, by w połowie odkryć, że twoje dane są bezużyteczne, prognozy modelu są niewiarygodne lub twoje rozwiązanie nie zintegruje się płynnie z istniejącymi przepływami pracy. Bolesne, kosztowne i całkowicie frustrujące.
Wyobraźmy sobie, że przebiega to inaczej: z ostrym jak brzytwa Sprawdzona koncepcja sztucznej inteligencji. Zamiast stawiać na przeczucia, testujesz każdy pomysł z wyprzedzeniem, eliminujesz ryzyko i unikasz tych drenujących portfel niespodzianek. PoC to twoja siatka bezpieczeństwa, udowadniająca, czy twój projekt AI jest naprawdę gotowy na prawdziwy świat.
W tym przewodniku omówię dokładnie, co to jest AI PoC czym jest, dlaczego ma kluczowe znaczenie dla zarządzania ryzykiem i jak wypada w porównaniu z prototypami lub MVP. Poznasz podejście krok po kroku, którego używamy w Innowise, zobacz Przykłady AI PoC, i zrozumieć typowe pułapki. Do dzieła!
"Uruchom PoC, aby wcześnie wykryć trudne rzeczy. Luki w danych i przeszkody integracyjne mogą zepsuć nawet najsilniejsze modele, a ich naprawa jest znacznie tańsza w małym projekcie pilotażowym niż po pełnym wdrożeniu. Pomiń ten punkt kontrolny, a projekt może wyglądać świetnie na papierze, ale potknie się w momencie, gdy spróbujesz go skalować".
Szef działu dużych zbiorów danych
Dowód koncepcji w sztucznej inteligencji to mały, laserowo skoncentrowany projekt, który sprawdza, czy rozwiązanie AI rozwiązuje konkretny problem biznesowy. Niezależnie od tego, czy weryfikujesz klasyczny przepływ pracy ML, czy też badasz gen AI PoC W przypadku generowania tekstu lub obrazu idea jest taka sama: najpierw przetestuj najważniejsze elementy. Czy dane są użyteczne? Czy algorytmy się sprawdzają? Czy można je zintegrować z obecnymi systemami bez wysadzania ich w powietrze?
Lubię nazywać PoC systemem wczesnego ostrzegania. Jeśli fundamenty się sprawdzą, świetnie, idź na całość. Jeśli nie, zmieniasz kierunek, zanim przepalisz swój bankroll.
Weźmy ten przykład. Nasz zespół współpracował z producentem borykającym się z przypadkowymi awariami sprzętu. Mieli mnóstwo danych z czujników, ale nie byli pewni, jak je efektywnie wykorzystać. Zaczęliśmy więc od PoC.
Okazało się, że prawie połowa danych była błędnie oznaczona, co jest natychmiastową przeszkodą dla każdego modelu sztucznej inteligencji. Gdy to rozwiązaliśmy, przetestowaliśmy kilka algorytmów (Random Forest, XGBoost) i zintegrowaliśmy najlepszą opcję z ich oprogramowaniem serwisowym. Wynik był następujący 30% redukcja czasu przestojówpokazując, że koncepcja działa. Wtedy wiedzieli, że nadszedł czas na skalowanie.
Zanim przejdziemy do podstaw budowania aplikacji AI PoC, Wyjaśnijmy jedną rzecz, o którą ciągle jestem pytany: jaka jest różnica między PoC, prototypem i MVP?
Ludzie rzucają tymi terminami, jakby były wymienne. nie są. Pomieszanie ich grozi zbudowaniem niewłaściwej rzeczy z niewłaściwego powodu. Oto więc szybki, prosty podział, aby wszystko było jasne.
PoC | Prototyp | MVP | |
Główny cel | Udowodnienie wykonalności | Pokaż surowy wygląd i działanie | Uruchom coś realnego, co użytkownicy mogą wypróbować |
Kluczowe pytanie | Czy to w ogóle działa z naszymi danymi/systemami? | Czy ludzie zrozumieją lub będą chcieli ten projekt? | Czy jest to wystarczająco dobre, aby wysłać i udoskonalić? |
Co testuje | Podstawowa technologia + wykonalność danych | Przepływ UX, układ, reakcje użytkowników | Użyteczność w świecie rzeczywistym + wczesne dopasowanie produktu do rynku |
Wyjście | Funkcjonalny fragment kodu lub podstawowa integracja | Interaktywna makieta lub aplikacja o niskiej wierności symulująca przepływ użytkowników | Działająca aplikacja z podstawowymi funkcjami dla pierwszych użytkowników |
Poziom polerowania | Niski - wystarczy udowodnić, że koncepcja działa | Średni - wygląda przyzwoicie, może być częściowo makietą | Wystarczająco wysoka do uruchomienia, ale nie oczekuj wymyślnych funkcji |
Dla kogo | Programiści, analitycy danych, CTO | Projektanci, liderzy produktu, interesariusze | Prawdziwi użytkownicy, pierwsi użytkownicy, zespoły biznesowe |
Czas/wysiłek | Najkrótszy, najmniejszy wysiłek | Średni czas trwania i wysiłek | Dłuższy czas trwania i większy wysiłek |
Poziom ryzyka | Najniższy (skoncentrowany na konkretnej przeszkodzie technicznej) | Średnie (ryzyko problemów z użytecznością lub braku akceptacji ze strony interesariuszy) | Wyższe (ryzyko odrzucenia przez rynek lub problemy ze skalowalnością techniczną) |
Następny krok | Jeśli to zadziała, zbuduj prototyp lub pilotaż. | Dopracowanie na podstawie informacji zwrotnych, przejście do MVP | Dodawanie funkcji, skalowanie i dążenie do pełnego wdrożenia |
Przeskoczenie od razu do pełnego rozwoju sztucznej inteligencji bez wcześniejszego przetestowania wód to pewny sposób na przepalenie budżetu. An AI PoC to mało ryzykowny sposób na sprawdzenie, czy Twój pomysł na sztuczną inteligencję rzeczywiście działa, zanim poświęcisz na to dużo czasu i pieniędzy.
Z mojego doświadczenia wynika, że istnieją pewne scenariusze, w których AI PoC nie jest opcjonalne. Jeśli którykolwiek z nich brzmi znajomo, nadszedł czas, aby zahamować i uruchomić PoC:
Nawet najfajniejszy pomysł na sztuczną inteligencję może napotkać przeszkody, gdy spróbuje się go zastosować w praktyce. Dane mogą być zaśmiecone, modele mogą osiągać gorsze wyniki, a integracja z obecnymi systemami może być trudniejsza niż sądzono.
Weźmy na przykład narzędzie sztucznej inteligencji przeznaczone do wykrywania wad jakościowych na linii produkcyjnej. Na pierwszy rzut oka brzmi to prosto, ale wady mogą się znacznie różnić, od subtelnych różnic kolorystycznych po mikroskopijne pęknięcia. PoC szybko pokazuje, czy kamery rejestrują wystarczająco dużo szczegółów, czy etykiety są trafne i czy model dobrze dostosowuje się do zmian oświetlenia lub materiałów.
Pominięcie PoC może oznaczać zmarnowanie miesięcy i wydrenowanie budżetu na system, który po prostu nie działa po wdrożeniu. Wczesne zidentyfikowanie i złagodzenie tych zagrożeń jest kluczem do zaoszczędzenia czasu, pieniędzy i uniknięcia przyszłych bólów głowy.
Ominięcie PoC zwykle brzmi szybciej, dopóki tak nie jest. Bez PoC zespoły często napotykają nieoczekiwane problemy w połowie procesu rozwoju. A naprawianie ich później? O wiele droższe niż ich wczesne wykrycie.
Załóżmy, że tworzysz chatbota AI do obsługi pytań klientów. Brzmi dość prosto. Ale twoje PoC pokazuje coś, czego nie planowałeś: klienci używają mnóstwa slangu, błędów w zamianie głosu na tekst i dziwacznych sformułowań. To duża wskazówka, że będziesz potrzebować dodatkowego dostrojenia NLP. I lepiej dowiedzieć się tego przed uruchomieniem i przepaleniem budżetu w połowie.
Dyrektorzy generalni, inwestorzy i wszyscy, którzy trzymają w garści pieniądze, nie zaufają projektowi AI tylko dlatego, że brzmi fajnie. Chcą czegoś konkretnego, na czym mogą polegać. W tym miejscu PoC staje się najlepszym przyjacielem. Rzeczywiste wskaźniki, takie jak redukcja błędów lub przyspieszenie procesów, z pewnością pokonają każdy błyszczący pitch deck.
Wyobraźmy sobie średniej wielkości sklep e-commerce testujący rekomendacje produktów oparte na sztucznej inteligencji. Szybki test PoC może wykazać wzrost średniej wartości koszyka o 15% wśród użytkowników testowych. Tego rodzaju twarde dane mówią wiele i robią więcej, aby uzyskać wsparcie niż tuzin slajdów strategicznych.
Sztuczna inteligencja nie działa w próżni. Wpływa na przepływy pracy, zespoły, a nawet sposób podejmowania decyzji. PoC pozwala zobaczyć, jak ludzie naprawdę wchodzą w interakcje z nową technologią i sygnalizuje zmiany potrzebne do płynnego wdrożenia.
Na przykład, być może wdrażasz sztuczną inteligencję do optymalizacji tras dostaw. Podczas PoC okazuje się, że pracownicy magazynu zastępują niektóre trasy wygenerowane przez AI, ponieważ kierowcy znają pewne dzielnice od podszewki. To kluczowe spostrzeżenie, którego nigdy byś nie wychwycił, gdybyś przeszedł od razu do wdrożenia na pełną skalę.
Twój model może błyszczeć w zgrabnej małej piaskownicy, ale czy poradzi sobie z zasilaniem danymi w czasie rzeczywistym, tysiącami zapytań na sekundę i przeszkodami regulacyjnymi? Testy PoC pozwalają zidentyfikować wąskie gardła na długo przed ich pojawieniem się w środowisku produkcyjnym.
Wyobraź sobie, że uruchamiasz wykrywanie oszustw w czasie rzeczywistym dla transakcji online. PoC może ujawnić, że potok danych ma trudności z aktualizacją modelu w czasie zbliżonym do rzeczywistego lub że zakupy transgraniczne powodują wysyp fałszywych alarmów. Wczesne zidentyfikowanie tych pułapek to różnica między odpornym rozwiązaniem AI a takim, które upada, gdy jest najbardziej potrzebne.
Tak bardzo, jak opowiadam się za AI PoCNie zamierzam jednak udawać, że zawsze jest to konieczne. Istnieją przypadki, w których uruchomienie dowód koncepcji jest jak budowanie rusztowania w celu wymiany żarówki - przesadna inżynieria i strata czasu.
Oto, kiedy lepiej jest pominąć PoC i przejść od razu do działania lub przemyśleć, czy sztuczna inteligencja jest w ogóle odpowiednim narzędziem.
Nie każdy problem wymaga uczenia maszynowego. Gdy prosta reguła lub skrypt wykona zadanie, dodanie sztucznej inteligencji tylko spowolni pracę, uczyni ją bardziej złożoną i trudniejszą w utrzymaniu.
Załóżmy, że chcesz wysłać alert, gdy stan zapasów spadnie poniżej określonego poziomu. To jasny przypadek dla konfiguracji opartej na regułach - nie ma potrzeby przeciągania sieci neuronowej.
Celem sztucznej inteligencji jest rozwiązywanie problemów, z którymi nie radzi sobie tradycyjna logika. Jeśli nie ma prawdziwego wyzwania do rozwiązania, sztuczna inteligencja może bardziej rozpraszać uwagę niż stanowić rozwiązanie. A jeśli używasz jej tylko po to, by zaznaczyć pole wyboru, jest to wyraźny znak, by przemyśleć swoje podejście.
Dostępnych jest mnóstwo wstępnie wyszkolonych usług AI - rozpoznawanie obrazu, zamiana mowy na tekst, tłumaczenie, można wymieniać bez końca. Często taniej i szybciej jest zaadoptować te sprawdzone w boju narzędzia niż budować własne od podstaw.
Na przykład, jeśli potrzebujesz narzędzia OCR do skanowania paragonów, a rozwiązanie innej firmy jest już bardzo dokładne, po co spędzać tygodnie na tworzeniu niestandardowego prototypu? Uważam, że gdy na rynku jest już sprawdzona opcja, nie ma sensu wymyślać koła na nowo. Lepiej zarezerwować energię na wyzwania, które naprawdę wymagają niestandardowego rozwiązania.
Zdarza się, że zespoły podchodzą z entuzjazmem do sztucznej inteligencji, zanim określą rzeczywisty problem, z którym próbują się zmierzyć. Gdy na stole nie ma wyraźnej wartości, AI PoC może szybko przekształcić się w ogromny pochłaniacz czasu i budżetu.
Wyobraź sobie, że Twój zespół chce zbudować chatbota AI tylko dlatego, że wszyscy inni to robią. Jeśli nie potrafisz wyartykułować, w jaki sposób obniży to koszty lub poprawi obsługę klienta, jedyną rzeczą, którą udowodni PoC, jest to, że potrafisz zbudować chatbota. W tym momencie rozsądniej jest przeprowadzić szybką kontrolę wykonalności i najpierw ustalić rzeczywiste cele.
Czasami po prostu nie ma miejsca na pełny cykl PoC. Może potrzebujesz chatbota AI do sezonowej kampanii marketingowej i masz najwyżej dwa miesiące. Zanim skończyłbyś PoC, sezon już by się skończył.
W takich sytuacjach rozsądniej jest stworzyć odchudzony prototyp, uzyskać natychmiastową informację zwrotną i udoskonalać go w locie. Oczywiście, dogłębne PoC jest idealne dla dużych lub złożonych projektów, ale jeśli masz do czynienia z czasem, najlepszym rozwiązaniem może być zwinne podejście testowo-iteracyjne.
Jeśli pracujesz nad rozwiązaniem AI, które zostało przetestowane w Twojej branży, PoC może po prostu spowolnić pracę. Nie ma potrzeby ponownego sprawdzania tego, o czym wszyscy już wiedzą, że działa.
Rozważmy na przykład wykrywanie spamu oparte na sztucznej inteligencji dla platformy e-mail. Istnieje mnóstwo danych, wzorce są dobrze rozumiane, a gotowe modele wykonują solidną pracę. O ile nie zajmujesz się czymś naprawdę niezwykłym, jak wykrywanie ukrytych linków lub analizowanie osadzonych obrazów, PoC nie zapewni wglądu, którego już nie masz.
Wszyscy chcą przekształcić surowe dane w spostrzeżenia, zautomatyzować decyzje i pokonać konkurencję. Rozumiem to. Ale porzucenie dowód koncepcji by działać szybciej, zwykle przynosi odwrotny skutek i kończy się znacznie wyższymi kosztami.
W tej sekcji omówię kilka typowych pułapek, które widziałem, gdy zespoły pomijały PoC i dlaczego zrobienie tego małego kroku na wczesnym etapie może zepsuć lub zepsuć projekt AI.
Z mojego doświadczenia wynika, że model sztucznej inteligencji jest tak silny, jak dane, które za nim stoją. Jednak wiele PoC uruchamia się z zestawami danych, które są zbyt małe, nieczyste lub ledwo istotne, co zwiększa koszty i wydłuża harmonogramy.
Nawet "dobre" dane mogą się nie sprawdzić, jeśli nie odzwierciedlają rzeczywistych warunków. Na przykład, użycie ogólnych klipów wideo zamiast faktycznych nagrań z fabrycznego monitoringu może przynieść duże korzyści w laboratorium, ale może się nie sprawdzić w rzeczywistej produkcji. Krótko mówiąc, jeśli dane nie są zarówno wysokiej jakości, jak i prawdziwie reprezentatywne dla środowiska, wszystkie obietnice zawarte w PoC nie przełożą się na sukces operacyjny.
Często istnieje fałszywe przekonanie, że ponieważ PoC jest tylko testem lub prototypem, wszystko powinno być zrobione szybko. W rzeczywistości jednak oczekiwanie zbudowania wydajnego modelu AI w bardzo krótkim czasie może być poważną pułapką. W przeciwieństwie do tradycyjnego tworzenia oprogramowania, praca nad sztuczną inteligencją wymaga kilku iteracyjnych kroków - gromadzenia danych, czyszczenia, szkolenia modeli i szeroko zakrojonej walidacji. Pośpiech w tych procesach zwykle prowadzi do powstania modelu, który nie jest wystarczająco solidny dla rzeczywistych zastosowań.
Co więcej, to, co na papierze wydaje się być prostym prototypem, często kryje w sobie wiele technicznych zawiłości. Przyspieszone harmonogramy mogą zapewnić powierzchowny dowód, ale bez rygoru potrzebnego do przekształcenia go w system gotowy do produkcji, skończysz z nierozwiązanymi wyzwaniami w zakresie integracji i długoterminowej konserwacji.
Bez wyraźnych, mierzalnych celów trudno jest stwierdzić, czy PoC naprawdę działa, czy tylko dobrze wygląda w wersji demonstracyjnej. Sugeruję zdefiniowanie z góry wskaźników takich jak precyzja, wycofanie, wskaźnik błędów lub progi ROI, aby wydajność była bezpośrednio powiązana z wartością biznesową.
A jeśli inżynierowie i interesariusze nie są zgodni co do tego, co oznacza sukces, ryzykujesz zbudowanie czegoś, co spełnia specyfikację, ale nie spełnia wymagań operacyjnych. Zsynchronizuj wskaźniki KPI, wpływ operacyjny i oczekiwania decydentów od pierwszego dnia, aby uniknąć modelu, który błyszczy na papierze, ale zawodzi w produkcji.
Jednym z najczęstszych błędów, z jakimi się spotykam, jest traktowanie AI PoC jak szybki sprint kodowania. Ale w sztucznej inteligencji nie chodzi o napisanie kodu i zakończenie pracy. Masz do czynienia z nieuporządkowanymi danymi, poprawkami modelu i walidacją w świecie rzeczywistym.
Wyobraź sobie, że dajesz swojemu zespołowi trzy tygodnie na udowodnienie, że model AI może przewidzieć awarie sprzętu. Na papierze może się to wydawać wykonalne. Ale kiedy zaczynasz kopać, znajdujesz luki w danych, zdajesz sobie sprawę, że funkcje wymagają przeglądu i odkrywasz, że potrzebujesz wielu rund dostrajania, aby uzyskać nawet podstawową dokładność. Jeśli się pospieszysz, otrzymasz demo, które wygląda dobrze w próżni, ale rozpada się w produkcji.
Nawet podstawowe zadania związane ze sztuczną inteligencją często kryją w sobie więcej złożoności niż oczekiwano. Mogą one szybko przerodzić się w miesiące obsługi przypadków brzegowych, udoskonalania potoków danych i przygotowań do integracji. Jeśli twój harmonogram jest zbyt napięty lub zakres jest zbyt szeroki, PoC nie pokaże ci, czy twoja sztuczna inteligencja działa. Dowiesz się tylko, ile zakrętów musiałeś skrócić, aby dotrzymać terminu.
PoC może działać doskonale w kontrolowanym środowisku, ale po podłączeniu go do rzeczywistych systemów z danymi w czasie rzeczywistym i rzeczywistymi użytkownikami wszystko staje się trudniejsze.
Na przykład, być może masz PoC do wykrywania awarii sprzętu w jednej fabryce. Działa to doskonale w laboratorium. Ale w momencie, gdy wdrażasz go w wielu lokalizacjach, odkrywasz, że każda lokalizacja używa innych czujników, ma inne formaty danych lub zależy od unikalnych konfiguracji sprzętowych. Nagle okazuje się, że PoC napotyka na problemy, z którymi nigdy nie miał do czynienia podczas testów.
To tylko integracja. Teraz dodaj skalę: Twój PoC obsługiwał 10 000 rekordów podczas testów, ale rzeczywiste operacje rzucają na niego miliony każdego dnia. Bez solidnych potoków danych, modułowej konstrukcji i gotowości do pracy w chmurze, obiecujący PoC może się zatrzymać.
Innymi słowy, jeśli integracja i skalowalność nie znajdują się na twoim radarze od pierwszego dnia, opóźniasz tylko moment, w którym te kwestie przerodzą się w pełnowymiarowe kryzysy.
Sztuczna inteligencja nie jest czymś, co pojedynczy programista może po prostu zrobić w weekend. Potrzebni są naukowcy zajmujący się danymi, inżynierowie ML i eksperci domeny, którzy będą działać w tym samym kierunku.
Załóżmy, że zlecasz projekt NLP świetnemu zespołowi Java z zerowym doświadczeniem w szkoleniu lub dostrajaniu modeli. Co otrzymasz? Opóźnione sprinty, stos długu technicznego i demo, które nigdy nie opuszcza placu zabaw.
Jeśli odpowiednie zestawy umiejętności nie są na pokładzie od pierwszego dnia lub przynajmniej gotowe do wskoczenia w razie potrzeby, zapisujesz się na blokady drogowe, przeróbki i PoC, który szybko zmierza donikąd.
Weryfikacja koncepcji może wydawać się niską stawką, ale bezpieczeństwo, zgodność i realistyczne oczekiwania nadal mają znaczenie. Używanie prawdziwych rekordów użytkowników w AI PoC bez ich anonimizacji, co może naruszyć przepisy dotyczące prywatności, zanim jeszcze zaczniesz.
Nadmierne obietnice są równie ryzykowne. Przedstaw PoC jako prawie gotowy do produkcji, a jeśli model ugnie się pod presją rzeczywistego świata, podważysz zaufanie interesariuszy. Pomijanie kontroli zgodności lub zawyżanie wyników może przyspieszyć działania, ale skutki uboczne - problemy prawne, utrata reputacji, opóźnione wdrożenia - kosztują znacznie więcej.
Prawidłowo obsługuj wrażliwe dane, utrzymuj swoje roszczenia w ryzach i rejestruj ryzyko od pierwszego dnia. W ten sposób można uniknąć późniejszych bolesnych niespodzianek.
W jednej chwili masz efektowne demo - może przewiduje różne rzeczy, może automatyzuje kilka kliknięć - i wszyscy tracą rozum. Po kilku tygodniach model jest chwiejny, wyniki są wszędzie, a ten błyszczący PoC zbiera kurz w jakimś zapomnianym wątku na Slacku.
To zbyt dobrze znana historia. W Innowise działamy inaczej. Nasz zespół traktuje każdego AI PoC jak prawdziwy produkt od pierwszego dnia - nie zabawka, nie jednorazowy eksperyment. Prawdziwe cele. Prawdziwe pętle walidacyjne. Prawdziwa strategia na to, co nadejdzie po tym, jak szum demo zniknie.
Oto jak wygląda nasza rzeczywistość Rozwój PoS proces wygląda następująco.
Pierwszą rzeczą, o którą pytamy każdego klienta, jest: "Jaki jest rzeczywisty problem, który mamy rozwiązać?". Nie jesteśmy tu po to, by tworzyć sztuczną inteligencję dla samej sztucznej inteligencji. Być może chcesz zautomatyzować 30% swojego obciążenia związanego z pomocą techniczną. A może chcesz wychwycić wady produkcyjne, zanim rozsadzą Twój budżet. Tak czy inaczej, jeśli nie możesz wskazać wyraźnego celu, po prostu rzucasz technologią w ścianę i masz nadzieję, że coś się przyklei.
A oto drugi warunek nienegocjowalny: zebrać wszystkich do stołu wcześniej. Nie tylko dział IT. Mówimy o liderach biznesowych, zespołach operacyjnych, personelu pomocniczym, pracownikach zajmujących się danymi - każdym, kto codziennie odczuwa ból. Widziałem genialne modele, które nie były wykorzystywane, ponieważ ludzie, którzy faktycznie ich potrzebowali, nie byli w pętli. Nie bądź tym projektem.
Jakość sztucznej inteligencji zawsze sprowadza się do jakości danych. Jeśli dane są rozproszone, nieaktualne lub pełne luk, żaden wymyślny model ich nie uratuje. Zaczynamy od dokładnego przyjrzenia się temu, co już masz - pomyśl o dziennikach transakcji, zachowaniu użytkowników, kanałach czujników - i wyczyszczenia ich za pomocą narzędzi takich jak Pandas lub NumPy.
Jeśli dane są niekompletne, przyjrzymy się sposobom wypełnienia luk. Czasami oznacza to generowanie syntetycznych rekordów za pomocą narzędzi takich jak DataSynthesizer lub Synthpop, zwłaszcza w przypadku wrażliwych informacji lub rzadkich zdarzeń.
Na przykład, pracowaliśmy kiedyś z globalną firmą spedycyjną, która posiadała terabajty danych śledzenia. Na papierze wyglądało to znakomicie, dopóki nasz zespół nie zagłębił się w dane. W ponad 30% rekordów brakowało znaczników czasu, a niektóre odczyty czujników były całkowicie błędne z powodu problemów z kalibracją. Gdybyśmy od razu przeszli do modelowania, PoC uległby awarii z niewłaściwych powodów. Zamiast tego wyczyściliśmy dane, wypełniliśmy puste miejsca, a następnie przeszliśmy do modelowania.
Lekcja? Nie buduj sztucznej inteligencji na ruchomych piaskach. Najpierw zdobądź solidne podstawy danych.
Naszym celem jest wybranie odpowiedniego narzędzia dla danego użytkownika. innowacyjne projekty typu proof-of-concept. Jeśli prosty model scikit-learn pozwala wykonać zadanie szybciej i taniej, to jest to nasz wybór. Zbudowaliśmy solidne systemy rozpoznawania obrazów przy użyciu YOLO lub Detectron2, ale nasi eksperci kierowali również klientów w stronę klasycznego ML, gdy osiągał on cele biznesowe bez dodatkowego bagażu.
W przypadku infrastruktury wszystko zależy od tego, co najlepiej pasuje do danej konfiguracji. Nasz zespół może wybrać Amazon SageMaker, platformę AI Google Cloud lub uczenie maszynowe Azure. A jeśli potrzebujesz skalować się na dużą skalę, Docker i Kubernetes to nasz najlepszy wybór.
Nic nie zabija PoC szybciej niż nadmierna inżynieria. Widziałem, jak zespoły poświęcały miesiące na budowanie rozdętych, idealnych modeli, tylko po to, by odkryć, że rozwiązują one niewłaściwy problem lub nikt ich nawet nie potrzebuje.
Dlatego nasz zespół od samego początku stawia na minimalizm. Bez dzwonków, bez gwizdków, bez ogromnej infrastruktury. Tylko model bare-bones, który odpowiada na jedno pytanie: Czy ten pomysł rzeczywiście działa? Zazwyczaj ta pierwsza wersja znajduje się w Jupyter Notebook lub Google Colab. Szybka w konfiguracji, łatwa do eksperymentowania i idealna do uzyskiwania wczesnych wyników bez konieczności podnoszenia ciężarów. Jeśli zależy nam na szybkiej demonstracji, sięgamy po narzędzie typu low-code, takie jak Azure ML Studio. Czasami jest to najmądrzejszy sposób na przedstawienie działającego PoC decydentom bez spalania mnóstwa godzin pracy programistów.
Zbudowałem całe PoC w ten sposób: małe, nieudolne, skupione na laserze. A jeśli ten model bazowy zwiększy dokładność o 15% lub wyeliminuje 20% zadań ręcznych, będzie to dla nas zielone światło do skalowania. Reszta może przyjść później.
Gdy model bazowy wygląda obiecująco, nasz zespół poddaje go prawdziwej próbie. Trenujemy, testujemy, poprawiamy, powtarzamy w kółko, aż albo zobaczymy stabilne wyniki, albo natrafimy na ścianę. W tym miejscu pojawiają się takie rzeczy jak walidacja krzyżowa i dostrajanie hiperparametrów (GridSearchCV, Keras Tuner, Optuna).
A jeśli chodzi o walidację, nie ograniczamy się tylko do sprawdzania na oko i liczenia na najlepsze wyniki. Nasi eksperci zagłębiają się w metryki, które faktycznie mówią nam, jak dobrze (lub źle) radzi sobie model - macierze pomyłek i krzywe ROC dla klasyfikacji, MSE i R-kwadrat dla regresji.
Ponadto rejestrujemy wszystko w MLflow: każdy eksperyment, każdy parametr i każdą wersję. Jeśli więc ktoś zapyta, dlaczego wersja 17 była lepsza od wersji 20, możemy dokładnie określić, co się zmieniło.
Od pierwszego dnia myślimy o tym, jak Twój model AI będzie działał w prawdziwym świecie. Być może będzie musiał wysyłać dane do CRM, pobierać informacje z ERP lub wyzwalać działania na istniejącej platformie. Niezależnie od przypadku, nasz zespół planuje to na wczesnym etapie.
W celu integracji nasi specjaliści zazwyczaj tworzą interfejs API RESTful (Flask lub FastAPI), aby inne systemy mogły łatwo łączyć się z modelem. Następnie pakujemy wszystko w Docker, aby było stabilne i łatwe do wdrożenia w dowolnym miejscu.
Aby zapewnić skalowalność, wprowadziliśmy Kubernetes do automatycznego zarządzania i skalowania. Kafka obsługuje potoki danych w czasie rzeczywistym. Załóżmy, że ruch jest nieprzewidywalny (witaj, wyprzedaże świąteczne lub premiery produktów). W takim przypadku użyjemy narzędzi bezserwerowych, takich jak AWS Lambda lub Google Cloud Functions, aby Twój system mógł obsłużyć nagłe skoki bez wysiłku.
Projekty AI szybko się rozpadają, gdy tylko zespół programistów wie, co się dzieje. Dlatego nasz zespół dba o to, by wszyscy - liderzy biznesowi, zespoły operacyjne i osoby niezwiązane z technologią - mogli śledzić historię. Jasne, kod znajduje się w GitHub, ale utrzymujemy również łatwe do przyswojenia briefy w Confluence lub Markdown. Bez żargonu, bez zgadywania.
I nie znikamy w jaskini koderów. Nasi eksperci dzielą się tymczasowymi wynikami, szybkimi wersjami demonstracyjnymi, aktualizacjami na Slacku i krótkimi odprawami na piasku, dzięki czemu wszyscy widzą postępy i wcześnie wkraczają do akcji.
Wszystko sprowadza się do wyników. Nasz zespół przedstawia wskaźniki w postaci pulpitów nawigacyjnych lub raportów, podkreślając, co się udało, a co wymaga pracy.
Jeśli jest to wygrana, rozmawiamy o kolejnych krokach - być może uruchomieniu programu pilotażowego lub pełnego wdrożenia produkcyjnego. Jeśli PoC nie przyniesie oczekiwanych rezultatów, nasi eksperci ustalają, dlaczego tak się stało. Czasami oznacza to dostosowanie potoków danych, zamianę algorytmów lub ponowne przemyślenie naszego podejścia. A czasami zdajemy sobie sprawę, że pomysł po prostu nie jest wykonalny i to jest całkowicie w porządku. Szybka porażka z rzeczywistymi spostrzeżeniami przewyższa marnowanie miesięcy na ślepy zaułek.
AI PoC daje ci szybki i mało ryzykowny sposób na przetestowanie, czy twój pomysł rzeczywiście działa, zanim wejdziesz na rynek. Ale aby uzyskać z tego prawdziwą wartość, potrzebujesz partnera, który zna się na rzeczy. I tu właśnie wkraczamy my. Oto, co otrzymasz, gdy połączysz siły z Innowise:
Od nieuporządkowanych zbiorów danych po dopracowane spostrzeżenia, nasi inżynierowie danych, specjaliści ML i eksperci dziedzinowi zajmują się całym potokiem. Żadnych luk, żadnych domysłów.
Mając na swoim koncie ponad 1300 projektów z zakresu opieki zdrowotnej, finansów i produkcji, wiemy, jak przekształcić pomysły AI w wyniki, które poruszają igłę.
Zamykamy dane i sprawdzamy wszystkie pola zgodności - RODO, HIPAA, PCI DSS, PSD2 - cały alfabet, od pierwszego dnia. Dzięki temu PoC omija audytorów, zamiast uderzać w biurokrację.
Nasi specjaliści ustalają ostre jak brzytwa wskaźniki KPI i utrzymują szeroko otwartą komunikację - dzięki czemu wszyscy dokładnie wiedzą, na czym stoi PoC i co będzie dalej.
Nasi eksperci dbają o skalowalność każdej kompilacji. Gdy PoC przejdzie testy, zostanie przeniesiony bezpośrednio do produkcji i będzie się dostosowywał do rosnących celów.
Nasz zespół nie pracuje z oczyszczonymi zestawami danych lub nierealistycznymi scenariuszami. Zajmujemy się nieuporządkowanymi danymi wejściowymi, trudnymi przypadkami brzegowymi i rodzajami ograniczeń, z którymi faktycznie boryka się Twoja firma.
Z tego, co widziałem, solidny PoC AI - niezależnie od tego, czy jest to klasyczny model predykcyjny, potok wizji komputerowej, czy nawet generatywna sztuczna inteligencja PoC - może zaoszczędzić wiele czasu, pieniędzy i stresu. Daje to jasne spojrzenie na to, co faktycznie działa, gdzie są luki i czy twój pomysł może wytrzymać poza środowiskiem testowym. Nie chcesz przecież, aby okazało się, że Twój model załamuje się pod presją, gdy już zaangażowałeś poważne zasoby.
Tak więc, przed przystąpieniem do pełnego rozwoju, sugerowałbym przeprowadzenie małego, skoncentrowanego PoC przy użyciu rzeczywistych danych biznesowych. Zmieni to domysły w twarde dowody i da ci pewność, że możesz albo podwoić, albo odejść, bez żalu.
Dyrektor ds. transformacji cyfrowej, CIO
Dzięki ponad 8-letniemu doświadczeniu w transformacji cyfrowej Maksim przekształca złożone wyzwania technologiczne w wymierne korzyści biznesowe. Jego prawdziwą pasją jest dostosowywanie strategii IT do szeroko zakrojonych celów, gwarantując bezproblemową adopcję cyfrową i elitarną wydajność operacyjną.
Umów się na rozmowę lub wypełnij poniższy formularz, a my skontaktujemy się z Tobą po przetworzeniu Twojego zgłoszenia.
Dlaczego Innowise?
2000+
specjalistów ds. IT
93%
klientów powracających
18+
lat doświadczenia
1300+
udanych projektów
Rejestrując się, wyrażasz zgodę na naszą Politykę Prywatności, w tym korzystanie z plików cookie i przekazywanie Twoich danych osobowych.
Dziękuję!
Wiadomość została wysłana.
Przetworzymy Twoją prośbę i skontaktujemy się z Tobą tak szybko, jak to możliwe.
Dziękuję!
Wiadomość została wysłana.
Przetworzymy Twoją prośbę i skontaktujemy się z Tobą tak szybko, jak to możliwe.