18.05.2026 - Seminarium Instytutowe — godz. 12:00
Maciej Ogrodniczuk, Anna Latusek, Alina Wróblewska, Bartosz Żuk (Instytut Podstaw Informatyki PAN)
Streszczenie (autorskie):
Podczas wystąpienia przybliżymy założenia projektu Universal Discourse, którego celem jest stworzenie uniwersalnego, wielojęzycznego modelu opisu relacji dyskursywnych. Podstawą teoretyczną prac jest standard ISO 24617-8, służący jako punkt wyjścia do harmonizacji istniejących zasobów korpusowych. W pierwszej części omówimy problematykę segmentacji tekstu na jednostki dyskursywne. Przedstawimy analizę porównawczą różnych formalizmów (takich jak RST czy PDTB) oraz autorską, opartą na regułach heurystykę, która wykazuje wysoką spójność w wyznaczaniu granic jednostek na poziomie zdań składowych. Następnie zaprezentujemy proponowany wielowarstwowy model relacji. Skupimy się na autorskim drzewie decyzyjnym, które pozwala na systematyczną klasyfikację powiązań znaczeniowych (m.in. przyczynowych, warunkowych czy temporalnych). W ostatniej części przedstawimy stan prac nad rozwojem parserów dyskursu oraz wyniki pierwszych eksperymentów.
