Michał Gramatyka: każdy algorytm AI ma tendencję do halucynowania
Każdy model, każdy algorytm sztucznej inteligencji, w tym również PLLuM ma tendencję do halucynowania; dlatego niezależnie od używanego modelu, należy uważać na uzyskane odpowiedzi - powiedział wiceminister cyfryzacji Michał Gramatyka, odnosząc się do polskiego modelu językowego AI o nazwie PLLuM.
Resort cyfryzacji poinformował w poniedziałek o uruchomieniu i udostępnieniu w internecie własnego modelu językowego AI o nazwie PLLuM (Polish Large Language Model), który ma wspierać administrację, biznes i naukę. Jak podkreślił wicepremier, minister cyfryzacji Krzysztof Gawkowski, projekt ma wzmocnić suwerenność cyfrową kraju i ograniczyć zależność od zagranicznych technologii. Resort powołał konsorcjum HIVE, które ma wdrażać modele AI w mObywatelu i urzędach.
Gramatyka w czwartek w Studiu PAP pytany o to, czy czeka nas rewolucja w związku z publicznym udostępnieniem polskiego modelu językowego sztucznej inteligencji, ocenił, że "rewolucja to może zbyt dużo powiedziane" ale jest to "gadżet, który od czasu do czasu się przydaje".
"Każdy model, każdy algorytm, każda tzw. sztuczna inteligencja, również PLLuM ma tendencję do halucynowania. To znaczy, że nie zawsze odpowiedzi, które są generowane przez te modele, są prawdziwe. One nawet nie zawsze przekazują ostatnie dane" - powiedział.
Polityk Polski 2050 nawiązał w ten sposób m.in. do odpowiedzi PLLuM na pytanie o to, kto jest Prokuratorem Krajowym. Chatbot wskazuje że jest nim Dariusz Barski, a nie Dariusz Korneluk.
💬 Był pomysł, aby nałożyć model AI na wszystkie dane zebrane w urzędach do obsługi zapytań w trybie dostępu do informacji publicznej, z czym urzędnicy mają największy problem - mówi @McGramat z @CYFRA_GOV_PL i @PL_2050
🎥cała rozmowa na https://t.co/gGhW95RytJ@PAPInformacje pic.twitter.com/dGcQ8NgMe9— Adrian Kowarzyk (@AdrianKowarzyk) February 27, 2025
Gramatyka podkreślił, że oprócz PLLuM działa również inny stworzony w Polsce model językowy o nazwie Bielik. Zaznaczył przy tym, że niezależnie od używanego modelu, należy uważać na uzyskane odpowiedzi i sprawdzać na własną rękę, bo "nie zawsze są one prawdziwe".
Wiceminister cyfryzacji pytany był, czy sztuczna inteligencja nie mogłaby zastąpić części urzędników w pracy. Odpowiedział, że był pomysł, aby nałożyć model AI na wszystkie dane zebrane w urzędach do obsługi zapytań w trybie dostępu do informacji publicznej z czym "urzędnicy mają największy problem". Przy takim zastosowaniu, zdaniem polityka Polski 2050, urzędnik jedynie by sprawdzał i weryfikował wygenerowane w ten sposób odpowiedzi.
Na pytanie, czy uda się zmniejszyć zatrudnienie w administracji publicznej po zaangażowaniu do wielu zadań sztucznej inteligencji odpowiedział, że "pewnie tak", choć podkreślił że nie jest odpowiednim adresatem takiego pytania.
💬 Był pomysł, aby nałożyć model AI na wszystkie dane zebrane w urzędach do obsługi zapytań w trybie dostępu do informacji publicznej, z czym urzędnicy mają największy problem - mówi @McGramat z @CYFRA_GOV_PL i @PL_2050
🎥cała rozmowa na https://t.co/gGhW95RytJ@PAPInformacje pic.twitter.com/dGcQ8NgMe9— Adrian Kowarzyk (@AdrianKowarzyk) February 27, 2025
"Z administracją publiczną jest tak, że jak jedne obowiązki odchodzą, to pojawiają się inne i kimś trzeba te obowiązki ogarniać. Natomiast nie wiem, czy tutaj będziemy mieli do czynienia z jakimś tam dużym zmniejszeniem zatrudnienia" - ocenił.
Model PLLuM został udostępniony w formie przeglądarkowej na http://pllum.clarin-pl.eu/, gdzie każdy może go przetestować.
Projekt PLLuM realizowany jest na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje jego rozwój. Do tej pory w skład konsorcjum wchodziły: Politechnika Wrocławska, która była liderem projektu, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, Naukowa i Akademicka Sieć Komputerowa (NASK-PIB), Ośrodek Przetwarzania Informacji (OPI-PIB) oraz Uniwersytet Łódzki.
Dane w ramach konsorcjum PLLuM zbierane były do lutego 2024 r.; trenowanie modelu trwało od czerwca do września ub.r.; w październiku model był douczany, a w listopadzie optymalizowany; według pierwotnych planów miał zostać opublikowany w grudniu ub.r.
Autor: Adrian Kowarzyk (PAP)
amk/ mmu/kgr/