• Aktualności

Aktualności Instytutu Podstaw Informatyki PAN

Algorytm wykryje fake newsy na podstawie stylu


pap nwp logo

Artykuły prasowe o tej tematyce:

Więcej o projekcie można znaleźć na stronie: homados.ipipan.waw.pl

Nad algorytmem, który na podstawie cech stylistycznych tekstu informacyjnego wykryje, czy jest on fałszywy lub zmanipulowany, pracuje dr inż. Piotr Przybyła z PAN. Jego zespół chce w ten sposób nie tylko wykrywać fake newsy, ale też boty w mediach społecznościowych.

Algorytmy, które wykrywają zmanipulowane lub szkodliwe treści, nie są nowością. Korzystają z nich na przykład media społecznościowe, takie jak Facebook czy Twitter. Jednak wielkie korporacje niechętnie dzielą się informacjami, na jakiej zasadzie one pracują.

"Brakuje w tej kwestii transparentności z ich strony" - uważa dr inż. Piotr Przybyła z Instytutu Podstaw Informatyki PAN. Zespół pod jego kierownictwem zajął się budową algorytmu, który jest w dużej mierze nowatorski, bo do tej pory naukowcy skupiali się na analizie prawdziwości faktów podanych w treści. Przybyła stwierdził, że warto przyjrzeć się stylowi tekstów udostępnianych online, w formie artykułów newsowych i postów w mediach społecznościowych.

"Chcemy sprawdzić, jaka będzie wydajność oceny wiarygodności dokumentu na podstawie cech czysto stylistycznych" - dodał.

Podkreśla, że jego celem jest stworzenie takiego algorytmu, który nie tylko wykryje fake newsy (które są najbardziej jaskrawym przykładem zmanipulowanych treści), ale też innych technik propagandowych i botów.

Czytaj więcej: Algorytm wykryje fake newsy na podstawie stylu (PAP - Nauka w Polsce)

Konstrukcje predykatywne w języku polskim


obrazek chmuma słów kluczowych

Artykuł pracowników Zespołu Inżynierii Lingwistycznej, dr Agnieszki Patejuk i prof. Adama Przepiórkowskiego, Predicative adverbs – evidence from Polish, został przyjęty do czasopisma “Linguistic Inquiry”.

Autorzy opisują konstrukcje predykatywne. W konstrukcjach typu Pływanie jest miłe, Pływanie jest świetnym sportem czy Pływanie jest do kitu predykat może zostać wyrażony przez frazę przymiotnikową (miłe), rzeczownikową (świetnym sportem) czy przyimkową (do kitu). Powszechnie uważa się, że predykatami w takich konstrukcjach (w różnych językach, nie tylko w polskim) nie mogą być frazy przysłówkowe, na przykład niepoprawne jest zdanie *Pływanie jest miło. Artykuł obala to przekonanie: w języku polskim frazy przysłówkowe mogą być predykatami, gdy podmiotem jest fraza bezokolicznikowa (np. Pływać jest miło) lub zdaniowa (np. Było miło, że popływał). Artykuł proponuje analizę składniową i semantyczną takich konstrukcji, a także porównuje je do analogicznych konstrukcji z predykatami przymiotnikowymi.

Algorytm wykryje fake newsy


logoDGP

Wprowadzają w błąd, sieją zamęt, wywołują emocje – jest coraz więcej fałszywych informacji w przestrzeni internetu. Polscy naukowcy chcą to zjawisko zatrzymać. Autorem projektu przeciwdziałania dezinformacji poprzez ocenę wiarygodności źródeł internetowych jest dr Piotr Przybyła z Instytutu Podstaw Informatyki PAN

Młody, ambitny naukowiec dostaje propozycje współpracy z zagraniczną uczelnią, w pana przypadku cenioną jednostką naukową. Czy na tamtym etapie zawodowym to była szansa, której nie można było zmarnować?

Niestety to rzadko się zdarza, by taki młody naukowiec zaraz po doktoracie rzeczywiście dostał taką propozycję. W praktyce to wygląda tak, że trzeba samemu aktywnie poszukiwać. Obroniłem doktorat w Instytucie Podstaw Informatyki PAN i uznałem, że kontynuowanie pracy za granicą będzie naturalnym kolejnym krokiem. Taka jest dobra praktyka w międzynarodowym środowisku naukowym: ludzie po ukończeniu doktoratu podejmują staże podoktorskie w cenionych ośrodkach. Dzięki temu mają możliwość zdobycia nowych doświadczeń, zobaczenia, jak wyglądają badania w innej tematyce, poznania nowych metod badawczych. Tak zdobywa się też kontakty z innymi młodymi badaczami, a to potem procentuje. Jest to jednak coś, co wymaga wiele wysiłku, bo znalezienie odpowiedniego miejsca wcale nie jest łatwe.

Czytaj więcej: Algorytm na fake news (Dziennik Gazeta Prawna)

Dofinansowanie ze środków Funduszy Strukturalnych dla projektu DARIAH-PL


logo dariah

Cyfrowa infrastruktura badawcza dla humanistyki i nauk o sztuce DARIAH-PL, projekt konsorcjum wiodących polskich instytucji naukowo-badawczych, zdobył dofinansowanie z Programu Operacyjnego Inteligentny Rozwój.
Liderem projektu jest Instytut Chemii Bioorganicznej Polskiej Akademii Nauk Poznańskie Centrum Superkomputerowo-Sieciowe.

W ramach realizcji projektu Instytut Podstaw Informatyki będzie zaangażowany w realizację zadań grup roboczych:

  • Metody i narzędzia lingwistycznej analizy tekstu
  • Korpusowa infrastruktura badawcza dla polszczyzny
  • Filologia cyfrowa

Powstałe w sierpniu 2014 roku konsorcjum DARIAH-PL (Digital Research Infrastructure for the Arts and Humanities) to największe konsorcjum humanistyczne w Polsce. DARIAH-PL, złożone obecnie z 18 instytucji, to największe w historii polskiej humanistyki konsorcjum naukowe. Jego celem jest rozwój i współpraca instytucji i badaczy zajmujących się projektami wykorzystującymi infrastrukturę cyfrową w realizacji projektów z zakresu humanistyki i nauki o sztuce w naszym kraju. Koordynatorem konsorcjum DARIAH-PL jest Uniwersytet Warszawski

Wiecej o DARIAH-PL na stronie: dariah.pl

Referat doktora Pawła Teisseyre na konferencji ECAI


Doktor Paweł Teisseyre (Zespół Analizy i Modelowania Statystycznego) wygłosił referat na prestiżowej konferencji ECAI (European Conference on Artificial Intelligence). Konferencja należy do najbardziej prestiżowych europejskich konferencji z dziedziny uczenia maszynowego i sztucznej inteligencji (ranking CORE: A). Praca dotyczy zaproponowanej przez dr Teisseyre metody uczenia łańcuchów klasyfikatorów w problemie klasyfikacji z wieloma etykietami. Zaproponowany algorytm pozwala ograniczyć liczbę cech wybieranych do modelu przy gwarancjach na wybieranie cech istotnych. Nowa metoda została użyta do przewidywania wielo-zachorowalności (współwystępowania wielu chorób u jednej osoby) na podstawie parametrów klinicznych pacjentów. Praca została opublikowana w materiałach konferencji ECAI i jest dostępna pod adresem: http://ecai2020.eu/papers/466_paper.pdf

ecai 2020 logo

© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności