Aktualności - Instytut Podstaw Informatyki Polskiej Akademii Nauk

Instytut na 3 Kongresie "Nauka dla społeczeństwa"

Podczas 3. Kongresu "Nauka dla społeczeństwa" organizowanego w dniach 27-28 maja na Politechnice Warszawskiej pracownicy Instytutu Podstaw Informatyki Polskiej Akademii Nauk zaprezentowali swoje osiągnięcia badawcze, które mają duży potencjał wdrożeniowy:

PLLuM (Polish Large Language Model) – rodzina polskich modeli językowych dla sektora publicznego i prywatnego
MCFS-ID: Ranking, identyfikacja istotnych cech i analiza współzależności w danych molekularnych o wysokim wymiarze
ANSI – sztuczna inteligencja w wykrywaniu podwójnej jakości produktów

Za ww. wdrożenia Instytut został uhonorowany wyróżnieniami otrzymanymi z rąk Dr Karoliny Zioło-Pużuk, Wiceminister Nauki i Szkolnictwa Wyższego.

Więcej…Instytut na 3 Kongresie "Nauka dla społeczeństwa"

Rusza rekrutacja do Szkoły Doktorskiej Technologii Informacyjnych i Biomedycznych PAN

16 czerwca rusza rekrutacja do Szkoły Doktorskiej Technologii Informacyjnych i Biomedycznych Instytutów PAN (TIBPAN). TIBPAN prowadzi kształcenie interdyscyplinarne przygotowujące do uzyskania stopnia doktora w następujących dyscyplinach:

informatyka techniczna i telekomunikacja,
inżynieria biomedyczna,
nauki medyczne.

Termin nadsyłania zgłoszeń na adres Instytutu Podstawowych Problemów Techniki PAN mija 27 czerwca 2025 r.

Więcej…Szkoła Doktorska TIB PAN - rekrutacja 2025

Warsztaty krajowe LDS w Polsce

European Language Data Space oraz Institute of Computer Science, Polish Academy of Sciences zapraszają do udziału w warsztacie o europejskim rynku danych językowych i roli danych w rozwijaniu sztucznej inteligencji w Polsce.

Kiedy? 📆 29 maja (czwartek) w godz. 🕙 10:00–14:30
Gdzie? 🏢 Przedstawicielstwo Komisji Europejskiej W Polsce, 🗺️ ul. Jasna 14/16 Warszawa

O czym będziemy rozmawiać? Przede wszystkim o polskim spojrzeniu na europejski rynek danych, uwarunkowaniach prawnych i powstawaniu modeli i narzędzi AI w oparciu o dane.

Liczba miejsc ograniczona – zapraszamy do zgłaszania chęci uczestnictwa osoby zainteresowane tematem.

Wystąpią: Dariusz Standerski, PhD, Pamela Krzypkowska, Edouard Geoffrois, Wojciech Wysocki, Mateusz S., Katrin Marheinecke, Maciej Ogrodniczuk, Jakub Turowski, Aleksandra Tomaszewska, Adam Polanowski, Michał Nowakowski, PhD, Katarzyna Z. Staroslawska. Panel dyskusyjny poprowadzi Anna Wittenberg.

Link do agendy i rejestracji tutaj.

Kondolencje

Z głębokim smutkiem przyjęliśmy wiadomość o tragedii, do której doszło 7 maja na terenie kampusu Uniwersytetu Warszawskiego.
Dyrekcja oraz pracownicy Instytutu Podstaw Informatyki Polskiej Akademii Nauk pragną wyrazić głęboką solidarność z całą społecznością Uniwersytetu.

Rodzinie Osoby, która straciła życie, składamy szczere wyrazy współczucia i wsparcia w tym niezwykle trudnym czasie. Rannemu pracownikowi Straży Uniwersyteckiej przekazujemy wyrazy najwyższego uznania i życzenia szybkiego powrotu do zdrowia.

Polski otwarty wielki model językowy (PLLuM) gotowy do działania

PLLuM (Polish Large Language Model) to rodzina modeli sztucznej inteligencji, która pozwala przetwarzać i generować teksty w języku polskim. Modele stworzone przez polskich ekspertów i ekspertki z dziedziny IT i lingwistyki, wesprą rozwój kompetencji cyfrowych oraz innowacje w administracji publicznej i biznesie. Ministerstwo Cyfryzacji zaprezentowało polski model językowy PLLuM oraz plan jego rozwoju. Od dziś model dostępny jest dla każdego.

Polski model językowy jest elastyczny i skalowalny – wykorzystuje od 8 do 70 miliardów parametrów. Pozwala na precyzyjne generowanie treści w języku polskim. Mniejsze wersje dobrze sprawdzają się w szybkich zadaniach, podczas gdy większe modele oferują wyższą precyzję i kontekstową spójność w rozumieniu języka polskiego. W rodzinie modeli PLLuM znajdują się m.in. modele w architekturze MoE (ang. Mixture of Experts) ze zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele RAG (ang. Retrieval Augmented Generation).

Bazuje na etycznym pozyskiwaniu danych – wersje do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum, a także zasoby, które, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, mogą być wykorzystane do budowy w pełni otwartego modelu. Modele naukowe (tj. udostępniane na licencjach, które nie pozwalają na zastosowania komercyjne) korzystają także z ogólnodostępnych zbiorów danych, takich jak Common Crawl.

Dostrajany na autorskich zbiorach danych, czyli dziesiątkach tysięcy tzw. instrukcji – pobudzeń (promptów) i oczekiwanych odpowiedzi modelu – oraz preferencji – pobudzeń i różnych odpowiedzi modeli ocenionych pod kątem jakościowym – tworzonych przez zespół ponad 50 specjalistów i specjalistek.

Budowanie ekosystemu polskich modeli językowych. Wspólnie z modelem Bielik mogą promować sztuczną inteligencję tworzoną w Polsce, wspierając się wzajemnie w lepszym procesie trenowania i dalszym pozyskiwaniu oraz otwieraniu danych, potrzebnych by #AIMadeInPoland było coraz lepsze – dla administracji publicznej, biznesu i społeczeństwa

Projekt realizowany jest na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM. Projekt realizowany był do tej pory przez konsorcjum sześciu podmiotów:

Politechnika Wrocławska (lider projektu)
Instytut Podstaw Informatyki PAN
Instytut Slawistyki PAN
Naukowa i Akademicka Sieć Komputerowa (NASK-PIB)
Ośrodek Przetwarzania Informacji (OPI-PIB)
Uniwersytet Łódzki

Więcej…Polski otwarty wielki model językowy (PLLuM) gotowy do działania

Instytut na 3 Kongresie "Nauka dla społeczeństwa"

Rusza rekrutacja do Szkoły Doktorskiej Technologii Informacyjnych i Biomedycznych PAN

Warsztaty krajowe LDS w Polsce

Kondolencje

Polski otwarty wielki model językowy (PLLuM) gotowy do działania

Więcej artykułów…