09.12.2019 - Seminarium Instytutowe - godz. 13:00,
Marcin Sydow (PJATK / IPI PAN)
Streszczenie (autorskie):
Teksty wiadomości na portalach informacyjnych, w tym same ich nagłówki (tytuły), często niosą duży ładunek emocji, w tym czasami nieobiektywnych, w kontekście określonych osób, instytucji, partii politycznych, państw, etc.Wpływać to może na taki czy inny odbiór społeczny w/w encji. W szczególności realnym wydaje się scenariusz, w którym systematyczne i nieobiektywne przedstawianie danej encji np. w nieuzasadnienie negatywnym świetle w danym medium może mieć wpływ na masowy negatywny odbiór społeczny, a w efekcie może potencjalnie przełożyć się na próbę manipulacji w ten sposób pewnych procedur demokratycznych, np. wyniki wyborów, etc. Niezależnie od tego pożytecznym wydaje się budowanie narzędzi informatycznych mogących w możliwie obiektywny sposób mierzyć tonalność wizerunku danej encji w strumieniu publicznych tekstów, np. artykuły z danego portalu, czy nawet ich nagłówki.
Prezentowane będzie podejście do w/w zagadnienia za pomocą metod uczenia maszynowego z nadzorem na specjalnie przygotowanych lub przystosowanych zbiorach danych dotyczących polskich i angielskich nagłówków artykułów wiadomości. Zaprezentowane będą wstępne wyniki przy użyciu uważanych obecnie za najlepsze (w pokrewnych zadaniach) modeli w tym pewnych wariantów głębokich i rekurencyjnych sieci neuronowych. Wyniki te demonstrują potencjalną przydatność proponowanego podejścia do budowy m.in. praktycznych narzędzi analitycznych lub do monitoringu mediów, etc.
Uwaga: praca we współpracy z mgr K.Baraniak, PJATK