Bielik – polski duży model językowy

Udostępniono nową wersję modelu językowego Bielik, opracowanego przez Fundację SpeakLeash oraz Akademickie Centrum Komputerowe Cyfronet AGH. Bielik to otwartoźródłowy model językowy, zaprojektowany z myślą o doskonalszym przetwarzaniu języka polskiego. Wersja Bielik-11B-v2, posiadająca 11 miliardów parametrów, powstała na bazie największego zbioru danych w języku polskim, zgromadzonego przez zespół SpeakLeash.

Jednym z kluczowych wyzwań w pracach nad modelem było pozyskanie odpowiednich danych w języku polskim, przy jednoczesnym zapewnieniu pełnej kontroli nad ich pochodzeniem. Proces szkolenia Bielika przeprowadzono z wykorzystaniem superkomputerów Helios i Athena, które wsparły optymalizację i przetwarzanie danych na potrzeby modelu.

Dzięki współpracy ekspertów z AGH i SpeakLeash powstał model językowy, który skutecznie operuje językiem polskim, uwzględniając specyficzne niuanse kulturowe i teksty specjalistyczne, takie jak prawnicze czy medyczne. Mimo że możliwości obliczeniowe polskich superkomputerów są mniejsze niż wiodących światowych rozwiązań, pozwalają one na wykonywanie złożonych obliczeń, które na standardowych komputerach trwałyby wielokrotnie dłużej.

Bielik stanowi odpowiedź na globalne modele językowe, takie jak ChatGPT, które dominują dzięki przetwarzaniu danych w języku angielskim. Twórcy Bielika podkreślają, że choć ChatGPT obsługuje język polski, jego zdolność do rozumienia specyfiki polskiej kultury i zaawansowanych tekstów specjalistycznych jest ograniczona, co uzasadnia potrzebę rozwijania modeli dostosowanych do lokalnych warunków.

Model Bielik jest dostępny publicznie i nieodpłatnie, a użytkownicy mogą korzystać zarówno z pełnych wersji, jak i z wersji umożliwiających uruchomienie modelu na własnym sprzęcie. Model ten ma szerokie zastosowanie w obszarze naukowym i biznesowym, zwłaszcza w przetwarzaniu i streszczaniu tekstów oraz usprawnianiu komunikacji z klientami.

Tworzenie modeli językowych w Polsce ma również strategiczne znaczenie, ponieważ zapewnia niezależność od zagranicznych dostawców technologii. W kontekście przetwarzania danych poufnych, takich jak dane medyczne czy prawnicze, lokalne rozwiązania oparte na modelach takich jak Bielik mogą zapewnić większe bezpieczeństwo i kontrolę nad danymi.

Rozwój tego typu modeli wpisuje się w globalny trend intensyfikacji prac nad sztuczną inteligencją, kluczową dla nowoczesnych gospodarek, a Polska może dzięki temu wzmocnić swoją pozycję w dziedzinie innowacji technologicznych.

 

Źródło: Bielik wylądował! Polski model językowy rozwinął skrzydła dzięki superkomputerom z AGH | Nauka w Polsce