Organizacja Instytutu Podstaw Informatyki PAN:
Dyrekcja IPI PAN
DYREKTOR
prof. dr hab. inż. Wojciech Penczek
Członek Korespondent PAN
ZASTĘPCA DYREKTORA ds. NAUKOWYCH
dr hab. Agnieszka Mykowiecka, Prof. IPI PAN
ZASTĘPCA DYREKTORA ds. EKONOMICZNO-ORGANIZACYJNYCH
Kontakt:
Sekretariat: tel. +48 22 380-05-04, +48 22 380-05-05
Centrala Instytutu: tel. +48 22 380-05-00
fax. +48 22 380-05-10
Profesorowie piastujący godność Profesor Emeritus IPI PAN
Zakład Teoretycznych Podstaw Informatyki
Kierownik Zakładu
prof. dr hab. inż. Włodzimierz Drabent
NIEZALEŻNI PRACOWNICY NAUKOWI
prof. dr hab. inż. Marek Tudruj (urlop bezpłatny)
GRUPY PROBLEMOWE
Zespół Teorii Systemów Rozproszonych i Obliczeniowych
Członkowie zespołu
- prof. dr hab. Wojciech Jamroga - kierownik zespołu
- prof. dr hab. Andrzej Blikle (urlop bezpłatny)
- prof. dr hab. inż. Włodzimierz Drabent
- mgr Mateusz Kamiński
- dr Michał Knapik (urlop bezpłatny)
- mgr Damian Kurpiewski (doktorant w projekcie)
- prof. dr Marta Kwiatkowska
- dr Łukasz Maśko
- prof. dr hab. Antoni Mazurkiewicz (urlop bezpłatny)
- dr Artur Męski (urlop bezpłatny)
- prof. dr hab. inż. Wojciech Penczek, czł. koresp. PAN
- dr Teofil Sidoruk
WWW: https://ztsrio.ipipan.waw.pl/
Tematyka badawcza
Zespołu Teorii Systemów Rozproszonych
i Obliczeniowych
Działalność i zainteresowania członków grupy dotyczą następujących tematów:
- modele systemów rozproszonych i współbieżnych,
- logiki temporalne dla systemów współbieżnych,
- modelowanie wiedzy i przekonań,
- weryfikacja modelowa systemów czasu rzeczywistego i wielo-agentowych,
- projektowanie i analiza protokołów kryptograficznych,
- formalne modelowanie systemów wieloagentowych: parakonsystentne modele systemów wieloagentowych, modelowanie przekonań, wnioskowanie i komunikacja;
- lokalne obliczenia w grafach: problem elekcji, numeracji i negocjacji.
Wiodącymi badaczami w tym zakresie są: W. Jamroga, W. Penczek.
Projekty:
- Social Explainable Artificial Intelligence (SAI; CHIRT-ERA)
- Socio-Technical Verification of Information Security and Trust in Voting Systems (STV; PolLux)
- Verification of Voter-Verifiable Voting Protocols (VoteVerif; PolLux)
- Verification of Parametric Time constrained Strategic Abilities of Agents acting under Incomplete Information (współpraca PAN-CNRS)
Zespół Kryptografii
Członkowie zespołu
- dr hab. inż. Paweł Morawiecki - kierownik zespołu
- prof. dr hab. inż. Józef Pieprzyk - (Data61, Commonwealth Scientific and Industrial Research Organisation (CSIRO), Australia)
Doktorant Szkoły Doktorskiej TIBPAN
- mgr Andrii Krutsylo
Tematyka badawcza
Zespołu Kryptografii
Działalność i zainteresowania członków grupy dotyczą następujących tematów:
- bezpieczeństwo i wiarygodność głębokich sieci neuronowych,
- kryptoanaliza szyfrów blokowych, strumieniowych, funkcji skrótu,
- projektowanie algorytmów kryptografii symetrycznej,
- schematy szyfrowania z uwierzytelnianiem.
Zakład Sztucznej Inteligencji
Kierownik Zakładu
NIEZALEŻNI PRACOWNICY NAUKOWI
dr Marcin Malawski (urlop bezpłatny)
GRUPY PROBLEMOWE
Zespół Podstaw Sztucznej Inteligencji
Członkowie Zespołu
- prof. dr hab. inż. Mieczysław Kłopotek - kierownik zespołu
- dr Piotr Borkowski
- dr Szymon Chojnacki (urlop bezpłatny)
- dr Krzysztof Ciesielski (urlop bezpłatny)
- dr Dariusz Czerski
- dr inż. Eryk Laskowski (urlop bezpłatny)
- dr Bartłomiej Starosta
- prof. dr hab. inż. Sławomir Wierzchoń (urlop bezpłatny)
WWW: https://zpsi.ipipan.waw.pl/
Tematyka badawcza
Zespołu Podstaw Sztucznej Inteligencji
Zespół Podstaw Sztucznej Inteligencji IPI PAN od czterech dekad prowadzi intensywne badania w zakresie czołowych wyzwań Sztucznej Inteligencji (zwanej też Inteligencją Obliczeniową). Sztuczna Inteligencja (AI) to dział informatyki, zajmujący się rozwiązywaniem problemów, dla których nie istnieją rozwiązania algorytmiczne lub są one zbyt złożone obliczeniowo. W tym duchu Zespół uczestniczył w opracowaniu systemu analizy danych dotyczących skutków zdrowotnych katastrofy w Czernobylu, systemu wspomagania diagnostyki urazów ręki, systemu rozproszonej ekstrakcji wiedzy z danych medycznych, systemu pro-ekologicznej optymalizacji mocy sieci elektrowni, systemu oceny kandydatów do zawodu pilota, pierwszej wielkoskalowej semantycznej wyszukiwarki internetowej, systemu rozwoju cen konsumenckich i wielu innych.
Badania nad konkretnymi zastosowaniami AI sprzęgnięte były z rozwojem teorii wnioskowania i uczenia dla informacji niepewnej i niepełnej (w tym sieci bayesowskich i teorii Dempstera-Shafera), rozwojem metod optymalizacji inspirowanych naturą (m.in. sieci immunologiczne, algorytmy stadne, genetyczne i optymalizacji ekstremalnej), metod ekstrakcji wiedzy z danych numerycznych, tekstu i hipertekstu (nowe algorytmy analizy skupień i klasyfikacji, w tym w dziedzinie grafowej analizy spektralnej, nowe metody ekstrakcji zależności hierarchicznych pojęć jak i prostych relacji z tekstów w języku naturalnym) i innych. Obecnie Zespół podjął się aktualnego, a zarazem ważnego wyzwania rozwoju metod Wyjaśnialnej Sztucznej Inteligencji (XAI). XAI to odpowiedź na zastrzeżenia przemysłu, iż metody sztucznej inteligencji takie jak głębokie sieci neuronowe, algorytmy ewolucyjne i inne działają na zasadzie "czarnej skrzynki", podczas gdy zaufanie budzą jedynie metody transparentne. Nasz Zespół podjął się szczególnie trudnego wyzwania t.j. osiągnięcia wyjaśnialności w dziedzinie analizy skupień dokumentów tekstowych, zwłaszcza grupowanych metodami spektralnymi. Bazowa trudność polega na braku spójnego systemu aksjomatycznego analizy skupień. W obszarze zaś metod spektralnych oderwanie reprezentacji skupień od zawartości tekstowej dokumentów. Nasze osiągnięcia w tym obszarze to:
- Bezsprzeczny system aksjomatyczny, obejmujący m.in. algorytm k-średnich, leżący u podstaw metod spektralnych,
- Metoda klasyfikacji oparta o widma laplasjanów zbiorów dokumentów,
- Metoda grupowania przyrostowego oparta o w/w widma,
- Metoda grupowania oparta o kernelizację macierzy podobieństwa,
- Metoda objaśniania hashtagów przez hashtagi oparta o w/w widma,
- Metoda przypisywania etykiet tekstowych grupom z grupowania spektralnego,
- Wyjaśnienie natury wyników grupowania metodą jądrowego algorytmu k-średnich dla nieeuklidesowych przestrzeni
- Pogłębienie rozumienia i wyboru rozwiązań niezdominowanych w systemach optymalizacji inspirowanych naturą
- I inne.
Zespół Analizy i Modelowania Statystycznego
Członkowie Zespołu
- prof. dr hab. inż. Szymon Jaroszewicz - kierownik zespołu
- dr hab. Stanisław Bylka (urlop bezpłatny)
- dr hab. Łukasz Dębowski
- dr Dariusz Kalociński
- dr Małgorzata Łazęcka (urlop bezpłatny)
- prof. dr hab. Stanisław Matwin
- prof. dr hab. Jan Mielniczuk
- dr Krzysztof Rudaś
- dr hab. Paweł Teisseyre
Doktoranci Szkoły Doktorskiej TIBPAN
- mgr Tomasz Klonecki
- mgr inż. Adam Wawrzeńczyk
WWW: https://zams.ipipan.waw.pl/
Tematyka badawcza
Zespołu Analizy i Modelowania Statystycznego
W Zespole prowadzone są badania nad uogólnieniem klasycznych metod uczenia maszynowego na przypadek modelowania różnicowego. Modelowanie różnicowe (ang. uplift modeling) zajmuje się modelowaniem przyczynowego wpływu danego działania (akcji marketingowej, terapii medycznej) na poziomie jednostkowym poprzez uwzględnienienie grupy kontrolnej nie poddanej danemu działaniu. Rozwijana jest również teoria modeli liniowych dla tego przypadku.
W zespole prowadzone są także badania z zakresu teorii informacji i probabilistycznego modelowania języka naturalnego. Szczegółowym przedmiotem badań są dyskretne procesy stochastyczne o silnej zależności, mierzonej między innymi tempem wzrostu entropii blokowej i maksymalnego powtórzenia. Rozpatrywane procesy cechują się pewnymi własnościami statystycznymi zbliżonymi do tekstów w języku naturalnym m.in. związanymi z hipotezą Hilberga. Badana jest konstrukcja przykładów takich procesów, wnioskowanie statystyczne dla nich oraz ich możliwe zastosowania w lingwistyce komputerowej.
Kolejny kierunek badań prowadzonych w zespole dotyczy metod klasyfikacji w sytuacji wielowymiarowej zmiennej odpowiedzi. Szczególnym przypadkiem jest klasyfikacja wieloetykietowa, w której rozważa się wielowymiarowe odpowiedzi binarne. Badanym problemem jest zaprojektowanie metod działających efektywnie w sytuacji danych o dużej wymiarowości, przy czym dotyczy to zarówno dużej liczby zmiennych objaśniających jak i dużej liczby zmiennych odpowiedzi. Celem badań jest rozwój algorytmów (jak również ich teoretyczna analiza) umożliwiających predykcję oraz selekcję zmiennych.
Tematyka selekcji zmiennych w modelach regresyjnych rozpatrywana jest również dla uogólnionych modeli liniowych dla sytuacji wektora predyktorów o dużej wymiarowości. Badania dotyczą procedur dwustopniowych, w których selekcja przy użyciu kryteriów informacyjnych następuje po wstępnym odsianiu nieistotnych zmiennych oraz procedur opartych na rangowaniu predyktorów wykorzystującym skumulowane miary ich ważności skonstruowane na podstawie dużej liczby losowych podmodeli. Otrzymane wyniki dotyczą zgodności selekcji dla zaproponowanych selektorów w sytuacji dobrej i złej specyfikacji modelu.
W zespole prowadzone są również badania dotyczące modelowania zależności stochastycznej przy użyciu teorii kopuł.
Więcej informacji znaleźć można na stronie Zespołu: http://zams.ipipan.waw.pl/.
Zespół Biologii Obliczeniowej
Członkowie Zespołu
- dr Michał J. Dąbrowski - kierownik zespołu
- dr inż. Michał Dramiński
- mgr Marta Jardanowska
- prof. dr Henryk Jan Komorowski
- dr Małgorzata Perycz
WWW: http://zbo.ipipan.waw.pl/
Tematyka badawcza
Zespołu Biologii Obliczeniowej
Motto: To co matematyka uczyniła dla fizyki, informatyka uczyni dla biologii
(Stanisław Ulam, 1975)
Zespół Biologii Obliczeniowej (ZBO) jest nową jednostką w Zakładzie Sztucznej Inteligencji. ZBO ma dwa zakresy badań:
- Tworzenie i rozwijanie metod do analizy i modelowania z wielkich zbiorów danych, w tym generowanych przez współczesne biotechnologie w całym zakresie nauk o życiu.
- Modelowanie chorób cywilizacyjnych, przede wszystkim nowotworów i cukrzycy typu 2 oraz chorób wirusowych w oparciu o heterogenne dane genomowe z wykorzystaniem danych własnych i publicznych.
W pierwszym zakresie do najważniejszych osiągnięć członków ZBO należą utworzenie metody i zaimplementowanie systemy do wybierania i rangowania własności istotnych przy klasyfikacji stosując drzewa decyzyjne i metodę Monte Carlo (MCFS), oraz do budowania transparentnych klasyfikatorów stosując podejście zbiorów przybliżonych Pawlaka zaimplementowanych w systemie ROSETTA.
W drugim zakresie badań ZBO ma istotne osiągnięcia, między innymi, w modelowaniu patogeniczności wirusa ptasiej grypy oraz w szybko rozwijającym się ostatnio kierunku badań nad mutacjami w obszarach regulatorowych genomu skorelowanych z nowotworzeniem. Dalsze prace nad metodami koncentrują się na znajdywaniu „interdependencies” (współzależności?) pomiędzy istotnymi własnościami oraz na tworzeniu metodologii sieci powiązań opartych na regułach if-then generowanych przez modele zbiorów przybliżonych.
Głównym zadaniem badawczym podjętym przez ZBO jest zbudowanie atlasu regionów regulatorowych w mózgu człowieka (regionów transkrypcji, miejsc wiązania czynników transkrypcyjnych, enhancerów, struktury chromatyny i modyfikacji histonów. Badania te są finansowane przez Narodowe Centrum Nauki poprzez grant Symfonia 3 otrzymanego wspólnie z Instytutem Nenckiego PAN oraz Instytutem Informatyki Uniwersytetu Warszawskiego. Celem tego projektu jest głębsze zrozumienie procesów biologicznych zachodzących w nowotworowych komórkach glejaka oraz w schorzeniach psychicznych takich jak schizofrenia i choroba dwubiegunowa.
Zespół Biologii Obliczeniowej łączy bogate doświadczenia wiodącego ośrodka podstaw informatyki z najnowszymi podejściami biotechnologii stosowanymi w naukach o życiu. ZBO tworzy agorę na której spotykają się między innymi biologowie, statystycy, lingwiści, onkologowie i informatycy. W swoich badaniach ZBO realizuje nie tylko słynną wypowiedź profesora Stanisława Ulama, ale też potwierdza relację iż nauki o życiu dokonują przewrotu w informatyce i matematyce.
Więcej informacji znaleźć można na stronie Zespołu: https://zbo.ipipan.waw.pl.
Zakład Modelowania Języka
Zespół Lingwistyki Formalnej
Członkowie Zespołu
- prof. dr hab. Adam Przepiórkowski - kierownik zespołu
- dr Diego Feinmann
- dr Agnieszka Patejuk
- mgr Sebastian Zawada
Tematyka badawcza
Zespół Lingwistyki Formalnej
Zespół Lingwistyki Formalnej (ZLF) zajmuje się badaniem struktury składniowej i semantycznej języków naturalnych, wykorzystując metody korpusowe, obliczeniowe, eksperymentalne oraz formalne.
Członkowie ZLF prowadzili prace, których efektem było powstanie ważnych zasobów lingwistycznych języka polskiego, w tym Narodowego Korpusu Języka Polskiego (NKJP), słownika walencyjnego Walenty oraz jednego z polskich korpusów w ramach inicjatywy Universal Dependencies (UD-LFG). Nowsze prace obliczeniowe dotyczą przetwarzania składniowo-semantycznego tekstów z wykorzystaniem teorii Lexical Functional Grammar oraz Glue Semantics.
Ważnym obszarem działalności zespołu są prace teoretyczne dotyczące zjawiska koordynacji, czyli struktur współrzędnie złożonych. W ramach tych prac wykazane zostało, że w takich konstrukcjach łączone mogą być człony o różnych wartościach kategorii składniowych, o różnych przypadkach gramatycznych, a także różniące się funkcją gramatyczną. Prace te oparte są na zaawansowanym wykorzystaniu korpusów językowych, a najnowsze prace w tym nurcie mają charakter ankietowy i eksperymentalny. Formalne analizy składniowe konstrukcji współrzędnie złożonych przeprowadzane są w ramach teorii Lexical Functional Grammar, Head-driven Phrase Structure Grammar, Minimalist Program, oraz w ramach gramatyk zależnościowych, analizy semantyczne oparte są natomiast na pojęciu kwantyfikatorów poliadycznych oraz na semantyce zdarzeń.
Formalne metody semantyczne i pragmatyczne wykorzystywane są także w pracach nad kwantyfikacją w językach naturalnych oraz nad zjawiskami niedokładności, homogeniczności i dewiacyjności semantycznej w języku.
Istotnym obiektem zainteresowań członków ZLF jest także struktura argumentowa (tzw. walencja) predykatów, a praktycznym efektem prac z tym związanych – prowadzonych wspólnie z członkami Zespołu Inżynierii Lingwistycznej – jest polski słownik walencyjny Walenty zawierający szczegółowe informacje składniowe, semantyczne i frazeologiczne dotyczące struktury argumentów leksemów czasownikowych, rzeczownikowych, przymiotnikowych i przysłówkowych. Związane z tym nurtem są także prace teoretyczne nad dychotomią argument–modyfikator.
Obecnie intensywnie prowadzone są także prace nad wielofunkcyjnym polskim słowem to. Zmierzają one do klasyfikacji użyć tego słowa w tekstach oraz do wyodrębnienia zbioru leksemów o lemacie TO. Poszczególne leksemy TO poddane są formalnej analizie morfologicznej, składniowej, semantycznej i pragmatycznej.
ZLF uczestniczy we współpracy międzynarodowej między innymi z naukowcami z Uniwersytetu Oksfordzkiego (Wielka Brytania), z Uniwersytetu w Konstancji (Niemcy) oraz z MIT (Massachusetts Institute of Technology, USA).
Więcej informacji o działalności badawczej członków zespołu można znaleźć na stronie: http://zil.ipipan.waw.pl/.
Zespół Inżynierii Lingwistycznej
Członkowie Zespołu
- dr Łukasz Kobyliński - kierownik zespołu
- dr Anna Andrzejczuk (urlop bezpłatny)
- mgr Monika Borys
- dr Anna Bulińska
- mgr Wiktoria Gumienna
- dr hab. Elżbieta Hajnicz
- dr Witold Kieraś
- mgr Dorota Komosińska
- mgr Katarzyna Krasnowska-Kieraś
- mgr Martyna Lewandowska
- prof. dr hab. Marek Łaziński
- mgr Mikołaj Łąkowski
- dr hab. Małgorzata Marciniak
- mgr inż. Dawid Mastalerz
- dr hab. Agnieszka Mykowiecka
- dr hab. Maciej Ogrodniczuk
- dr Angelika Peljak-Łapińska
- mgr Sandra Penno
- dr inż. Piotr Przybyła (urlop bezpłatny)
- mgr Zuzanna Przybysz
- dr Michał Rudolf
- mgr Piotr Rybak
- dr Piotr Rychlik
- mgr Aleksandra Tomaszewska
- dr inż. Aleksander Wawer
- dr hab. Marcin Woliński
- dr Joanna Wołoszyn
- dr Alina Wróblewska
- dr Natalia Zawadzka-Paluektau
- mgr inż. Aleksandra Zwierzchowska
- mgr Bartłomiej Żuk
WWW: http://zil.ipipan.waw.pl/
Tematyka badawcza
Zespołu Inżynierii Lingwistycznej
Zespół Inżynierii Lingwistycznej (ZIL) zajmuje się wieloma aspektami automatycznego przetwarzania języka naturalnego.
Ważnym obszarem działalności Zespołu jest szeroko rozumiana ekstrakcja informacji: liczne prace dotyczą wydobywania informacji z danych dziedzinowych, znajdowania w tekstach jednostek nazewniczych oraz, ogólniej, powierzchniowego parsowania języka. W ramach prac Zespołu powstało narzędzie TermoPL umożliwiające ekstrakcję terminów z tekstów w języku polskim oraz jego wersja wielojęzyczna – TermoUD, która umożliwia przetwarzanie tekstów w językach, dla których istnieje parser zależnościowy UD. Do nurtu tego zaliczyć można także działania związane z wydobywaniem wiedzy lingwistycznej – w tym ram walencyjnych i rozwijania słownika Walenty – na podstawie danych korpusowych.
Kolejnym nurtem działalności ZIL są prace związane z przetwarzaniem tekstów na poziomie semantycznym. Wymienić tu należy przede wszystkim ujednoznacznianie sensów słów, znajdowanie nawiązań (ang. coreference resolution), analizę dyskursu/metatekstu (ang. discourse analysis), wydźwięku (ang. sentiment analysis) i emocji w tekście. Bardziej aplikacyjne prace związane z tą tematyką dotyczą automatycznego streszczania i tematycznej kategoryzacji dokumentów.
Zespół prowadzi także intensywne prace korpusowe. Pod kierunkiem ZIL powstały liczący 1,5 miliarda słów Narodowy Korpus Języka Polskiego (NKJP; oparty m.in. na wcześniejszym Korpusie IPI PAN), liczne narzędzia do ręcznego i automatycznego znakowania korpusów na wielu poziomach lingwistycznych, schemat anotacji XML oraz ręcznie znakowany podkorpus wielkości 1 miliona słów. Na bazie NKJP powstał również korpus składniowy Składnica oraz, w znaczącej części, Polski Bank Drzew Zależnościowych (PDB). Ten ostatni zasób jest powszechnie używany do trenowania modeli parsowania zależnościowego dla języka polskiego (np. COMBO, Trankit, Stanza, UDPipe). Oba treebanki łącznie wykorzystuje hybrydowy składnikowo-zależnościowy parser Hydra.
Nowsze prace korpusowe związane są z Korpusem Współczesnego Języka Polskiego, Korpusem Dyskursu Parlamentarnego, czy korpusami polszczyzny historycznej, w szczególności współpracą przy znakowaniu i udostępnieniu Elektronicznego Korpusu Tekstów Polskich z XVII i XVIII w. (KorBa).
Wiele narzędzi tworzonych w Zespole jest publicznie dostępnych na otwartych licencjach (ang. open source). Wśród nich wymienić należy system segmentacji na zdania i tokeny LAMBO, system wstępnego przetwarzania języka COMBO, analizator morfosyntaktyczny Morfeusz czy aplikację webową do tworzenia i analizy korpusów tekstowych Korpusomat. W ZIL trwają także ciągłe prace nad rozwojem Słownika gramatycznego języka polskiego, który stanowi podstawę wielu tagerów i innych narzędzi do przetwarzania języka polskiego.
Innym obszarem działalności ZIL jest przetwarzanie języka naturalnego na potrzeby szeroko rozumianych nauk społecznych, w tym psychologii. Zastosowania obejmują analizę wydźwięku (sentiment analysis), wykrywanie kłamliwych i nieprawdziwych stwierdzeń (deception detection, fake news) lub zaburzeń, takich jak autyzm lub schizofrenia, na podstawie danych klinicznych.
ZIL aktywnie uczestniczy w konsorcjach infrastruktur badawczych CLARIN-PL i DARIAH-PL, akcjach COST – także jako Grant Holder, obecnie w akcji UniDive – i realizuje liczne projekty krajowe (m.in. ze środków Narodowego Centrum Nauki, Narodowego Centrum Badań i Rozwoju, Fundacji na rzecz Nauki Polskiej, Narodowej Agencji Wymiany Akademickiej i Narodowego Programu Rozwoju Humanistyki) oraz zagraniczne (m.in. w ramach programów CEF, Horizon 2020, DIGITAL).
Więcej informacji znaleźć można na stronie Zespołu: http://zil.ipipan.waw.pl/.