Informatyka w służbie społeczeństwu
Ilekroć przychodzi mi pisać o Instytucie Podstaw Informatyki Polskiej Akade¬mii Nauk (IPI PAN) zaczynam od przypomnienia z dumą, że od początku pracowali w nim uczeni zaliczani do czołówki światowej, prawdziwi pionierzy światowej informatyki. Pionierskie lata już dawno za nami, ale niesłychany rozwój informatyki nie tylko trwa, ale wręcz przyspieszył.
Najlepsi badacze IPI PAN odkrywają matematyczne i algorytmiczne podstawy zjawisk językowych, począwszy od twórczego spojrzenia na teorio-informacyjne podstawy komunikacji językowej oraz teorię kodowania informacji. Inni rozwijają metody weryfikacji poprawności systemów rozproszonych i współbieżnych, zajmują się analizą protokołów kryptograficznych, tworzą algorytmy zdolne analizować wielkie zbiory danych, np. algorytmy do analizy danych występujących w genetyce, proteomice (analizie białek), czy ogólniej biologii obliczeniowej, albo też algorytmy, które pozwalają gromadzić i analizować, w tym np. grupować, wielkie kolekcje dokumentów tekstowych. I nie są to wszystkie pola naszych badań podstawowych.
Naturalną koleją rzeczy, nasze osiągnięcia na polu badań podstawowych staramy się przenosić do obszaru zastosowań. Na przykład Zespół Inżynierii Lingwistycznej IPI PAN, który jest jedną z najważniejszych polskich grup prowadzących badania nad automatycznym przetwarzaniem składni i semantyki języka polskiego, jest autorem wielu dostępnych na zasadzie licencji otwartej zasobów i narzędzi do przetwarzania języka polskiego, szeroko używanych przez placówki badawcze oraz firmy komercyjne. Wśród najbardziej obiecujących zasobów tego typu są m.in.: Walenty - nowy słownik gramatyczny z informacjami składniowymi oraz Polski Korpus Koreferencyjny - jeden z największych na świede zasobów z opisem semantycznych odwołań między fragmentami tekstów.
Niezwykle ważnym dokonaniem Zespołu (zrealizowanym w ramach koordynowanego przez IPI PAN projektu wspólnego z Instytutem Języka Polskiego PAN, PWN oraz Uniwersytetem Łódzkim) jest Narodowy Korpus Języka Polskiego (NKJP) - zbiór tekstów o wielkości ponad półtora miliarda słów, stanowiący model współczesnej polszczyzny. Korpus ten, publicznie dostępny i wielokrotnie nagradzany, jest niezastąpionym materiałem źródłowym dla nowoczesnych badań językoznawczych i lingwistyczno-informatycznych. Na jego podstawie powstają nowe podręczniki i słowniki, takie jak opracowywany w IJP PAN Wielki Słownik Języka Polskiego, ale także liczne narzędzia komputerowe: elektroniczne tłumacze, wyszukiwarki, analizatory składniowe i semantyczne.
W ramach projektu POIG o nazwie ,Adaptacyjny system wspomagający roz-wiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych”- zrealizowanego we współpracy z Instytutem Informatyki Politechniki Wrocławskiej - przez prawie pięć lat powstawała w IPI PAN pierw¬sza polska semantyczna wielkoskalowa wyszukiwarka NEKST (skrót od stów: Narzędzia EKsploracji Semantycznej Tekstów). Ostatnio zaczęta służyć nie tylko jako tradycyjna wyszukiwarka dokumentów polskiego Internetu oraz nowatorska wyszukiwarka faktów, ale także jako system wsparcia dla międzyuczelnianego systemu antyplagiatowego. Jej możliwe zastosowania to, oprócz analiz lingwistycznych, także tworzenie wyspecjalizowanych wyszukiwarek produktów, wspomaganie dziedzinowych systemów eksperckich, wyszukiwanie i grupowanie patentów, wyszukiwanie partnerów biznesowych itp. Metody ekstrakcji informacji zaimplementowane w wyszukiwarce NEKST można wykorzystać w wielu innych dziedzinach życia społecznego i gospodarki. W roku 2014 wyszukiwarka NEKST po raz drugi zdobyła tytuł EuroSymbolu Innowacji („Monitor Rynkowy Dziennika Gazety Prawnej” oraz „Monitor Biznesu Rzeczpospolitej”).
Jecek Koronacki
dyrektor Instytutu
Źródło: Fakty Magazyn Gospodarczy Nr 2 (74) Marzec/Kwiecień 2015 r.