Seminaria ogólnoinstytutowe:

Informacje:

Poniedziałki, o godz. 12:00
Miejsce seminarium: sala seminaryjna IPI PAN
ul. Jana Kazimierza 5
e-mail: seminarium@ipipan.waw.pl

Archiwum Seminarium Ogólnoinstytutowego

22.03.2021 - Seminarium Instytutowe - godz. 12:00 seminarium on-line

Paweł Teisseyre (Instytut Podstaw Informatyki PAN)

Odnośnik do spotkania w MS Teams (nowe okno)

Streszczenie (autorskie):

Referat będzie poświęcony problemowi klasyfikacji z niepełną obserwowalnością zmiennej odpowiedzi typu PU (positive and unlabelled). W tradycyjnym problemie klasyfikacji binarnej, celem jest zbudowanie modelu który przypisuje obserwacji jedną z dwóch klas: pozytywną lub negatywną na podstawie cech opisujących daną obserwację. Zakłada się że zbiór uczący, na podstawie którego dopasowuje się model, zawiera obserwacje pozytywne oraz negatywne. W problemie PU, zbiór danych uczących zawiera obserwacje które mają przypisaną etykietę pozytywną, zaś pozostałe obserwacje nie mają przypisanej etykiety. Na przykład w zastosowaniach medycznych, obserwacje niemające przypisanej klasy, mogą odpowiadać pacjentom u których nie zdiagnozowano choroby. Brak diagnozy nie oznacza jednak że choroba nie występuje. Podczas prezentacji przedstawię formalny opis problemu, podstawowe definicje i fakty oraz interesujące wyzwania związane z danymi PU. Pokażę w jaki sposób można zaadoptować popularny model regresji logistycznej dla danych PU.


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności