Skip to main content

Organizacja Instytutu Podstaw Informatyki PAN:

Dyrekcja IPI PAN

DYREKTOR

prof. dr hab. inż. Wojciech Penczek
Członek Korespondent PAN

ZASTĘPCA DYREKTORA ds. NAUKOWYCH

dr hab. Agnieszka Mykowiecka, Prof. IPI PAN

ZASTĘPCA DYREKTORA ds. EKONOMICZNO-ORGANIZACYJNYCH

mgr Krzysztof Kossobudzki

Kontakt:
Sekretariat: tel. +48 22 380-05-04, +48 22 380-05-05
Centrala Instytutu: tel. +48 22 380-05-00
fax. +48 22 380-05-10

Profesorowie piastujący godność Profesor Emeritus IPI PAN

Zakład Teoretycznych Podstaw Informatyki

Kierownik Zakładu

prof. dr hab. inż. Włodzimierz Drabent

NIEZALEŻNI PRACOWNICY NAUKOWI

prof. dr hab. inż. Marek Tudruj (urlop bezpłatny)

GRUPY PROBLEMOWE

Zespół Teorii Systemów Rozproszonych i Obliczeniowych

Członkowie zespołu

WWW: https://ztsrio.ipipan.waw.pl/

Tematyka badawcza Logo IPI PAN

Zespołu Teorii Systemów Rozproszonych
i Obliczeniowych

Działalność i zainteresowania członków grupy dotyczą następujących tematów:

  • modele systemów rozproszonych i współbieżnych,
  • logiki temporalne dla systemów współbieżnych,
  • modelowanie wiedzy i przekonań,
  • weryfikacja modelowa systemów czasu rzeczywistego i wielo-agentowych,
  • projektowanie i analiza protokołów kryptograficznych,
  • formalne modelowanie systemów wieloagentowych: parakonsystentne modele systemów wieloagentowych, modelowanie przekonań, wnioskowanie i komunikacja;
  • lokalne obliczenia w grafach: problem elekcji, numeracji i negocjacji.

Wiodącymi badaczami w tym zakresie są: W. Jamroga, W. Penczek.

Projekty:

  • Social Explainable Artificial Intelligence (SAI; CHIRT-ERA)
  • Socio-Technical Verification of Information Security and Trust in Voting Systems (STV; PolLux)
  • Verification of Voter-Verifiable Voting Protocols (VoteVerif; PolLux)
  • Verification of Parametric Time constrained Strategic Abilities of Agents acting under Incomplete Information (współpraca PAN-CNRS)

Reprezentatywne prace

Zespół Kryptografii

Członkowie zespołu

Doktorant Szkoły Doktorskiej TIBPAN

  • mgr Andrii Krutsylo

Tematyka badawcza logo small

Zespołu Kryptografii

Działalność i zainteresowania członków grupy dotyczą następujących tematów:

  • bezpieczeństwo i wiarygodność głębokich sieci neuronowych,
  • kryptoanaliza szyfrów blokowych, strumieniowych, funkcji skrótu,
  • projektowanie algorytmów kryptografii symetrycznej,
  • schematy szyfrowania z uwierzytelnianiem.

Reprezentatywne prace

Zakład Sztucznej Inteligencji

Kierownik Zakładu

prof. dr hab. Jan Mielniczuk

NIEZALEŻNI PRACOWNICY NAUKOWI

dr Marcin Malawski (urlop bezpłatny)

GRUPY PROBLEMOWE

Zespół Podstaw Sztucznej Inteligencji

Członkowie Zespołu

WWW: https://zpsi.ipipan.waw.pl/

Tematyka badawcza logo small

Zespołu Podstaw Sztucznej Inteligencji

Zespół Podstaw Sztucznej Inteligencji IPI PAN od czterech dekad prowadzi intensywne badania w zakresie czołowych wyzwań Sztucznej Inteligencji (zwanej też Inteligencją Obliczeniową). Sztuczna Inteligencja (AI) to dział informatyki, zajmujący się rozwiązywaniem problemów, dla których nie istnieją rozwiązania algorytmiczne lub są one zbyt złożone obliczeniowo. W tym duchu Zespół uczestniczył w opracowaniu systemu analizy danych dotyczących skutków zdrowotnych katastrofy w Czernobylu, systemu wspomagania diagnostyki urazów ręki, systemu rozproszonej ekstrakcji wiedzy z danych medycznych, systemu pro-ekologicznej optymalizacji mocy sieci elektrowni, systemu oceny kandydatów do zawodu pilota, pierwszej wielkoskalowej semantycznej wyszukiwarki internetowej, systemu rozwoju cen konsumenckich i wielu innych.

Badania nad konkretnymi zastosowaniami AI sprzęgnięte były z rozwojem teorii wnioskowania i uczenia dla informacji niepewnej i niepełnej (w tym sieci bayesowskich i teorii Dempstera-Shafera), rozwojem metod optymalizacji inspirowanych naturą (m.in. sieci immunologiczne, algorytmy stadne, genetyczne i optymalizacji ekstremalnej), metod ekstrakcji wiedzy z danych numerycznych, tekstu i hipertekstu (nowe algorytmy analizy skupień i klasyfikacji, w tym w dziedzinie grafowej analizy spektralnej, nowe metody ekstrakcji zależności hierarchicznych pojęć jak i prostych relacji z tekstów w języku naturalnym) i innych. Obecnie Zespół podjął się aktualnego, a zarazem ważnego wyzwania rozwoju metod Wyjaśnialnej Sztucznej Inteligencji (XAI). XAI to odpowiedź na zastrzeżenia przemysłu, iż metody sztucznej inteligencji takie jak głębokie sieci neuronowe, algorytmy ewolucyjne i inne działają na zasadzie "czarnej skrzynki", podczas gdy zaufanie budzą jedynie metody transparentne. Nasz Zespół podjął się szczególnie trudnego wyzwania t.j. osiągnięcia wyjaśnialności w dziedzinie analizy skupień dokumentów tekstowych, zwłaszcza grupowanych metodami spektralnymi. Bazowa trudność polega na braku spójnego systemu aksjomatycznego analizy skupień. W obszarze zaś metod spektralnych oderwanie reprezentacji skupień od zawartości tekstowej dokumentów. Nasze osiągnięcia w tym obszarze to:

  • Bezsprzeczny system aksjomatyczny, obejmujący m.in. algorytm k-średnich, leżący u podstaw metod spektralnych,
  • Metoda klasyfikacji oparta o widma laplasjanów zbiorów dokumentów,
  • Metoda grupowania przyrostowego oparta o w/w widma,
  • Metoda grupowania oparta o kernelizację macierzy podobieństwa,
  • Metoda objaśniania hashtagów przez hashtagi oparta o w/w widma,
  • Metoda przypisywania etykiet tekstowych grupom z grupowania spektralnego,
  • Wyjaśnienie natury wyników grupowania metodą jądrowego algorytmu k-średnich dla nieeuklidesowych przestrzeni
  • Pogłębienie rozumienia i wyboru rozwiązań niezdominowanych w systemach optymalizacji inspirowanych naturą
  • I inne.

Reprezentatywne prace

Zespół Analizy i Modelowania Statystycznego

Członkowie Zespołu

Doktoranci Szkoły Doktorskiej TIBPAN

  • mgr Tomasz Klonecki
  • mgr inż. Adam Wawrzeńczyk

WWW: https://zams.ipipan.waw.pl/

Tematyka badawcza logo small

Zespołu Analizy i Modelowania Statystycznego

W Zespole prowadzone są badania nad uogólnieniem klasycznych metod uczenia maszynowego na przypadek modelowania różnicowego. Modelowanie różnicowe (ang. uplift modeling) zajmuje się modelowaniem przyczynowego wpływu danego działania (akcji marketingowej, terapii medycznej) na poziomie jednostkowym poprzez uwzględnienienie grupy kontrolnej nie poddanej danemu działaniu. Rozwijana jest również teoria modeli liniowych dla tego przypadku.

W zespole prowadzone są także badania z zakresu teorii informacji i probabilistycznego modelowania języka naturalnego. Szczegółowym przedmiotem badań są dyskretne procesy stochastyczne o silnej zależności, mierzonej między innymi tempem wzrostu entropii blokowej i maksymalnego powtórzenia. Rozpatrywane procesy cechują się pewnymi własnościami statystycznymi zbliżonymi do tekstów w języku naturalnym m.in. związanymi z hipotezą Hilberga. Badana jest konstrukcja przykładów takich procesów, wnioskowanie statystyczne dla nich oraz ich możliwe zastosowania w lingwistyce komputerowej.

Kolejny kierunek badań prowadzonych w zespole dotyczy metod klasyfikacji w sytuacji wielowymiarowej zmiennej odpowiedzi. Szczególnym przypadkiem jest klasyfikacja wieloetykietowa, w której rozważa się wielowymiarowe odpowiedzi binarne. Badanym problemem jest zaprojektowanie metod działających efektywnie w sytuacji danych o dużej wymiarowości, przy czym dotyczy to zarówno dużej liczby zmiennych objaśniających jak i dużej liczby zmiennych odpowiedzi. Celem badań jest rozwój algorytmów (jak również ich teoretyczna analiza) umożliwiających predykcję oraz selekcję zmiennych.

Tematyka selekcji zmiennych w modelach regresyjnych rozpatrywana jest również dla uogólnionych modeli liniowych dla sytuacji wektora predyktorów o dużej wymiarowości. Badania dotyczą procedur dwustopniowych, w których selekcja przy użyciu kryteriów informacyjnych następuje po wstępnym odsianiu nieistotnych zmiennych oraz procedur opartych na rangowaniu predyktorów wykorzystującym skumulowane miary ich ważności skonstruowane na podstawie dużej liczby losowych podmodeli. Otrzymane wyniki dotyczą zgodności selekcji dla zaproponowanych selektorów w sytuacji dobrej i złej specyfikacji modelu.

W zespole prowadzone są również badania dotyczące modelowania zależności stochastycznej przy użyciu teorii kopuł.

Logotyp Zespołu Analizy i Modelowania Statystycznego

Więcej informacji znaleźć można na stronie Zespołu: http://zams.ipipan.waw.pl/.

Reprezentatywne prace

Zespół Biologii Obliczeniowej

Członkowie Zespołu

WWW: http://zbo.ipipan.waw.pl/

Tematyka badawcza logo small

Zespołu Biologii Obliczeniowej

Motto: To co matematyka uczyniła dla fizyki, informatyka uczyni dla biologii

(Stanisław Ulam, 1975)

Zespół Biologii Obliczeniowej (ZBO) jest nową jednostką w Zakładzie Sztucznej Inteligencji. ZBO ma dwa zakresy badań:

  1. Tworzenie i rozwijanie metod do analizy i modelowania z wielkich zbiorów danych, w tym generowanych przez współczesne biotechnologie w całym zakresie nauk o życiu.
  2. Modelowanie chorób cywilizacyjnych, przede wszystkim nowotworów i cukrzycy typu 2 oraz chorób wirusowych w oparciu o heterogenne dane genomowe z wykorzystaniem danych własnych i publicznych.

W pierwszym zakresie do najważniejszych osiągnięć członków ZBO należą utworzenie metody i zaimplementowanie systemy do wybierania i rangowania własności istotnych przy klasyfikacji stosując drzewa decyzyjne i metodę Monte Carlo (MCFS), oraz do budowania transparentnych klasyfikatorów stosując podejście zbiorów przybliżonych Pawlaka zaimplementowanych w systemie ROSETTA.

W drugim zakresie badań ZBO ma istotne osiągnięcia, między innymi, w modelowaniu patogeniczności wirusa ptasiej grypy oraz w szybko rozwijającym się ostatnio kierunku badań nad mutacjami w obszarach regulatorowych genomu skorelowanych z nowotworzeniem. Dalsze prace nad metodami koncentrują się na znajdywaniu „interdependencies” (współzależności?) pomiędzy istotnymi własnościami oraz na tworzeniu metodologii sieci powiązań opartych na regułach if-then generowanych przez modele zbiorów przybliżonych.

Głównym zadaniem badawczym podjętym przez ZBO jest zbudowanie atlasu regionów regulatorowych w mózgu człowieka (regionów transkrypcji, miejsc wiązania czynników transkrypcyjnych, enhancerów, struktury chromatyny i modyfikacji histonów. Badania te są finansowane przez Narodowe Centrum Nauki poprzez grant Symfonia 3 otrzymanego wspólnie z Instytutem Nenckiego PAN oraz Instytutem Informatyki Uniwersytetu Warszawskiego. Celem tego projektu jest głębsze zrozumienie procesów biologicznych zachodzących w nowotworowych komórkach glejaka oraz w schorzeniach psychicznych takich jak schizofrenia i choroba dwubiegunowa.

Zespół Biologii Obliczeniowej łączy bogate doświadczenia wiodącego ośrodka podstaw informatyki z najnowszymi podejściami biotechnologii stosowanymi w naukach o życiu. ZBO tworzy agorę na której spotykają się między innymi biologowie, statystycy, lingwiści, onkologowie i informatycy. W swoich badaniach ZBO realizuje nie tylko słynną wypowiedź profesora Stanisława Ulama, ale też potwierdza relację iż nauki o życiu dokonują przewrotu w informatyce i matematyce.

Więcej informacji znaleźć można na stronie Zespołu: https://zbo.ipipan.waw.pl.

Reprezentatywne prace

Zakład Modelowania Języka

Kierownik Zakładu

dr hab. Maciej Ogrodniczuk

GRUPY PROBLEMOWE

Zespół Lingwistyki Formalnej

Członkowie Zespołu

Tematyka badawcza logo small

Zespół Lingwistyki Formalnej

Zespół Lingwistyki Formalnej (ZLF) zajmuje się badaniem struktury składniowej i semantycznej języków naturalnych, wykorzystując metody korpusowe, obliczeniowe, eksperymentalne oraz formalne.

Członkowie ZLF prowadzili prace, których efektem było powstanie ważnych zasobów lingwistycznych języka polskiego, w tym Narodowego Korpusu Języka Polskiego (NKJP), słownika walencyjnego Walenty oraz jednego z polskich korpusów w ramach inicjatywy Universal Dependencies (UD-LFG). Nowsze prace obliczeniowe dotyczą przetwarzania składniowo-semantycznego tekstów z wykorzystaniem teorii Lexical Functional Grammar oraz Glue Semantics.

Ważnym obszarem działalności zespołu są prace teoretyczne dotyczące zjawiska koordynacji, czyli struktur współrzędnie złożonych. W ramach tych prac wykazane zostało, że w takich konstrukcjach łączone mogą być człony o różnych wartościach kategorii składniowych, o różnych przypadkach gramatycznych, a także różniące się funkcją gramatyczną. Prace te oparte są na zaawansowanym wykorzystaniu korpusów językowych, a najnowsze prace w tym nurcie mają charakter ankietowy i eksperymentalny. Formalne analizy składniowe konstrukcji współrzędnie złożonych przeprowadzane są w ramach teorii Lexical Functional Grammar, Head-driven Phrase Structure Grammar, Minimalist Program, oraz w ramach gramatyk zależnościowych, analizy semantyczne oparte są natomiast na pojęciu kwantyfikatorów poliadycznych oraz na semantyce zdarzeń.

Formalne metody semantyczne i pragmatyczne wykorzystywane są także w pracach nad kwantyfikacją w językach naturalnych oraz nad zjawiskami niedokładności, homogeniczności i dewiacyjności semantycznej w języku.

Istotnym obiektem zainteresowań członków ZLF jest także struktura argumentowa (tzw. walencja) predykatów, a praktycznym efektem prac z tym związanych – prowadzonych wspólnie z członkami Zespołu Inżynierii Lingwistycznej – jest polski słownik walencyjny Walenty zawierający szczegółowe informacje składniowe, semantyczne i frazeologiczne dotyczące struktury argumentów leksemów czasownikowych, rzeczownikowych, przymiotnikowych i przysłówkowych. Związane z tym nurtem są także prace teoretyczne nad dychotomią argument–modyfikator.

Obecnie intensywnie prowadzone są także prace nad wielofunkcyjnym polskim słowem to. Zmierzają one do klasyfikacji użyć tego słowa w tekstach oraz do wyodrębnienia zbioru leksemów o lemacie TO. Poszczególne leksemy TO poddane są formalnej analizie morfologicznej, składniowej, semantycznej i pragmatycznej.

ZLF uczestniczy we współpracy międzynarodowej między innymi z naukowcami z Uniwersytetu Oksfordzkiego (Wielka Brytania), z Uniwersytetu w Konstancji (Niemcy) oraz z MIT (Massachusetts Institute of Technology, USA).

Więcej informacji o działalności badawczej członków zespołu można znaleźć na stronie: http://zil.ipipan.waw.pl/.

Reprezentatywne prace

Zespół Inżynierii Lingwistycznej

Członkowie Zespołu

WWW: http://zil.ipipan.waw.pl/

Tematyka badawcza logo small

Zespołu Inżynierii Lingwistycznej

Zespół Inżynierii Lingwistycznej (ZIL) zajmuje się wieloma aspektami automatycznego przetwarzania języka naturalnego.

Ważnym obszarem działalności Zespołu jest szeroko rozumiana ekstrakcja informacji: liczne prace dotyczą wydobywania informacji z danych dziedzinowych, znajdowania w tekstach jednostek nazewniczych oraz, ogólniej, powierzchniowego parsowania języka. W ramach prac Zespołu powstało narzędzie TermoPL umożliwiające ekstrakcję terminów z tekstów w języku polskim oraz jego wersja wielojęzyczna – TermoUD, która umożliwia przetwarzanie tekstów w językach, dla których istnieje parser zależnościowy UD. Do nurtu tego zaliczyć można także działania związane z wydobywaniem wiedzy lingwistycznej – w tym ram walencyjnych i rozwijania słownika Walenty – na podstawie danych korpusowych.

Kolejnym nurtem działalności ZIL są prace związane z przetwarzaniem tekstów na poziomie semantycznym. Wymienić tu należy przede wszystkim ujednoznacznianie sensów słów, znajdowanie nawiązań (ang. coreference resolution), analizę dyskursu/metatekstu (ang. discourse analysis), wydźwięku (ang. sentiment analysis) i emocji w tekście. Bardziej aplikacyjne prace związane z tą tematyką dotyczą automatycznego streszczania i tematycznej kategoryzacji dokumentów.

Zespół prowadzi także intensywne prace korpusowe. Pod kierunkiem ZIL powstały liczący 1,5 miliarda słów Narodowy Korpus Języka Polskiego (NKJP; oparty m.in. na wcześniejszym Korpusie IPI PAN), liczne narzędzia do ręcznego i automatycznego znakowania korpusów na wielu poziomach lingwistycznych, schemat anotacji XML oraz ręcznie znakowany podkorpus wielkości 1 miliona słów. Na bazie NKJP powstał również korpus składniowy Składnica oraz, w znaczącej części, Polski Bank Drzew Zależnościowych (PDB). Ten ostatni zasób jest powszechnie używany do trenowania modeli parsowania zależnościowego dla języka polskiego (np. COMBO, Trankit, Stanza, UDPipe). Oba treebanki łącznie wykorzystuje hybrydowy składnikowo-zależnościowy parser Hydra.

Nowsze prace korpusowe związane są z Korpusem Współczesnego Języka Polskiego, Korpusem Dyskursu Parlamentarnego, czy korpusami polszczyzny historycznej, w szczególności współpracą przy znakowaniu i udostępnieniu Elektronicznego Korpusu Tekstów Polskich z XVII i XVIII w. (KorBa).

Wiele narzędzi tworzonych w Zespole jest publicznie dostępnych na otwartych licencjach (ang. open source). Wśród nich wymienić należy system segmentacji na zdania i tokeny LAMBO, system wstępnego przetwarzania języka COMBO, analizator morfosyntaktyczny Morfeusz czy aplikację webową do tworzenia i analizy korpusów tekstowych Korpusomat. W ZIL trwają także ciągłe prace nad rozwojem Słownika gramatycznego języka polskiego, który stanowi podstawę wielu tagerów i innych narzędzi do przetwarzania języka polskiego.

Innym obszarem działalności ZIL jest przetwarzanie języka naturalnego na potrzeby szeroko rozumianych nauk społecznych, w tym psychologii. Zastosowania obejmują analizę wydźwięku (sentiment analysis), wykrywanie kłamliwych i nieprawdziwych stwierdzeń (deception detection, fake news) lub zaburzeń, takich jak autyzm lub schizofrenia, na podstawie danych klinicznych.

ZIL aktywnie uczestniczy w konsorcjach infrastruktur badawczych CLARIN-PL i DARIAH-PL, akcjach COST – także jako Grant Holder, obecnie w akcji UniDive – i realizuje liczne projekty krajowe (m.in. ze środków Narodowego Centrum Nauki, Narodowego Centrum Badań i Rozwoju, Fundacji na rzecz Nauki Polskiej, Narodowej Agencji Wymiany Akademickiej i Narodowego Programu Rozwoju Humanistyki) oraz zagraniczne (m.in. w ramach programów CEF, Horizon 2020, DIGITAL).

Więcej informacji znaleźć można na stronie Zespołu: http://zil.ipipan.waw.pl/.

Reprezentatywne prace


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności