Skip to main content

Aktualności Instytutu Podstaw Informatyki PAN

Warsztat „Analiza danych parlamentarnych” w Sejmie RP




29 lutego 2024 r. odbył się w Sejmie RP zorganizowany przez Instytut Podstaw Informatyki PAN warsztat naukowy „Analiza danych parlamentarnych”, który stanowił podsumowanie zorganizowanego na jesieni ubiegłego roku konkursu na analizę stenogramów Sejmu i Senatu. Celem konkursu, adresowanego do studentów, doktorantów i młodych naukowców, było stworzenie oryginalnego opracowania ciekawego problemu badawczego z dowolnej dyscypliny nauki.

Korpus Dyskursu Parlamentarnego i korpus ParlaMint

Wydarzenie rozpoczęło wystąpienie prof. Macieja Ogrodniczuka z Instytutu Podstaw Informatyki PAN, który zaprezentował dwa wykorzystywane w konkursie zbiory danych parlamentarnych. Najważniejszym z nich jest polskojęzyczny Korpus Dyskursu Parlamentarnego (KDP), liczący ponad 800 mln słów zestaw stenogramów z posiedzeń plenarnych, sprawozdań z posiedzeń komisji oraz interpelacji, zapytań i odpowiedzi od roku 1919 aż do dnia dzisiejszego. Jego współczesną część (od roku 2015) zawiera natomiast wielojęzyczny korpus ParlaMint, gromadzący podobne dane z parlamentów prawie wszystkich krajów europejskich, a także ich tłumaczenia na język angielski.

Dane wykorzystywane w konkursie są dostępne bezpłatnie dla wszystkich. Co ważne – żeby z nich korzystać, nie trzeba umieć programować. Zarówno KDP, jak i ParlaMint zostały udostępnione w sieci w prostych w obsłudze interfejsach.

Nagrodzone projekty

Kolejną część warsztatu stanowiła prezentacja zwycięskich prac konkursowych:

  1. „Aplikacji do analizy sentymentu wypowiedzi parlamentarzystów RP” Bartłomieja Klimowskiego z Uniwersytetu Warszawskiego, nagrodzonej za dobry przykład wykorzystania metody analizy składowych głównych w aplikacji prezentującej charakterystykę emocjonalną wypowiedzi parlamentarzystów, dobre dostosowanie narzędzia do zbioru danych oraz możliwość jego dalszej rozbudowy.
  2. „Analizy dynamiki emocji w debatach parlamentarnych o wojnie w Ukrainie” Konrada Kiljana z Uniwersytetu Warszawskiego i Eweliny Gajewskiej z Politechniki Warszawskiej, nagrodzonej za dopracowaną analizę porównującą wypowiedzi parlamentarzystów z Europy Zachodniej, Wschodniej i Ukrainy na przestrzeni czasu, dobry dobór metody badawczej oraz jasne kryteria oceny wyników (z podaną dokładnością oraz informacją o walidacji).
  3. „Języka wrażliwego na płeć (gender-fair language) w polskim parlamencie: badania korpusowego debat parlamentarnych w korpusie ParlaMint” Aleksandry Tomaszewskiej z Instytutu Podstaw Informatyki PAN i Anny Jamki z Uniwersytetu Warszawskiego, docenionej za analizę tendencji dotyczących użycia języka inkluzywnego w debatach parlamentarnych, dobry opis tematu i czytelne pytania badawcze.

O zmianach w polszczyźnie parlamentarnej

Kolejnym punktem programu był wykład prof. Marka Łazińskiego, językoznawcy z UW i członka Rady Języka Polskiego, dotyczący. „zmian w polszczyźnie ostatnich stu lat w zwierciadle debat parlamentarnych” na różnych poziomach analizy języka – w fonetyce, fleksji, słowotwórstwie, składni i słownictwie.

Zakończenie warsztatu

Na zakończenie spotkania odbył się panel dyskusyjny z udziałem części kapituły konkursowej – prof. Magdaleny Derwojedowej z Uniwersytetu Warszawskiego, prof. Krzysztofa Kasianiuka z Collegium Civitas, prof. Adama Pawłowskiego z Uniwersytetu Wrocławskiego oraz prof. Marka Łazińskiego. Poruszono w nim kwestię rodzajów danych i metadanych opisujących wypowiedzi parlamentarzystów, odpowiedniego przygotowania danych do użycia w badaniach, udostępniania zasobów oraz roli badaczy w przybliżaniu prac parlamentu obywatelom. Warsztat zakończył się uroczystym wręczeniem dyplomów nagrodzonym w konkursie.

Organizatorem warsztatu był Instytut Podstaw Informatyki PAN w ramach konsorcjum CLARIN-PL.


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności