22.03.2021 - Seminarium Instytutowe - godz. 12:00 seminarium on-line

Paweł Teisseyre (Instytut Podstaw Informatyki PAN)

Odnośnik do spotkania w MS Teams (nowe okno)

Streszczenie (autorskie):

Referat będzie poświęcony problemowi klasyfikacji z niepełną obserwowalnością zmiennej odpowiedzi typu PU (positive and unlabelled). W tradycyjnym problemie klasyfikacji binarnej, celem jest zbudowanie modelu który przypisuje obserwacji jedną z dwóch klas: pozytywną lub negatywną na podstawie cech opisujących daną obserwację. Zakłada się że zbiór uczący, na podstawie którego dopasowuje się model, zawiera obserwacje pozytywne oraz negatywne. W problemie PU, zbiór danych uczących zawiera obserwacje które mają przypisaną etykietę pozytywną, zaś pozostałe obserwacje nie mają przypisanej etykiety. Na przykład w zastosowaniach medycznych, obserwacje niemające przypisanej klasy, mogą odpowiadać pacjentom u których nie zdiagnozowano choroby. Brak diagnozy nie oznacza jednak że choroba nie występuje. Podczas prezentacji przedstawię formalny opis problemu, podstawowe definicje i fakty oraz interesujące wyzwania związane z danymi PU. Pokażę w jaki sposób można zaadoptować popularny model regresji logistycznej dla danych PU.

09.03.2021 wtorek! - Seminarium Instytutowe - godz. 12:00 seminarium on-line

Aleksander Wawer (Instytut Podstaw Informatyki PAN), Izabela Chojnicka (Wydział Psychologii Uniwersytetu Warszawskiego), Justyna Sarzyńska-Wawer (Instytut Psychologii PAN)

Odnośnik do spotkania w MS Teams (nowe okno)

Streszczenie (autorskie):

Diagnostyka zaburzeń psychicznych na podstawie danych tekstowych to nowy obszar zastosowań dla przetwarzania języka naturalnego, a w szczególności metod uczenia maszynowego i głębokiego uczenia. Omówimy serię eksperymentów wykonanych na polskojęzycznych danych tekstowych dotyczących zaburzeń ze spektrum autyzmu i schizofrenii. Wystąpienie rozpoczniemy od analizy obydwu zaburzeń oraz przedstawienia narzędzi diagnostycznych: TLC i ADOS-2, wraz z charakterystyką zebranych danych. Przedstawimy efekty zastosowania metod słownikowych, mierzących takie wymiary jak poziom abstrakcji językowej oraz wydźwięk. Następnie przejdziemy do prób automatycznego diagnozowania obydwu zaburzeń. Porównamy skuteczność: (1) tradycyjnych narzędzi diagnostycznych TLC i ADOS-2, (2) metod uczenia maszynowego i głębokiego uczenia zastosowanych do danych zgromadzonych przez te narzędzia oraz (3) psychiatrów. Omówimy skuteczność najprostszych metod typu bag-of-words, metod słownikowych, a także głębokich sieci neuronowych. Przedstawimy eksperymenty z transfer learning, a także uczeniem w scenariuszach zero-shot i few-shot, dedykowanych sytuacjom o małej liczebności danych, co jest typowym problemem w warunkach klinicznych. Psychiatria to jedna z nielicznych dziedzin medycyny, w których diagnoza większości zaburzeń opiera się na subiektywnej ocenie psychiatry. Nasze prace są krokiem w kierunku wprowadzenia zautomatyzowanych i obiektywnych narzędzi wspomagających diagnostykę.

15.02.2021 - Seminarium Instytutowe - godz. 12:00 seminarium on-line

Agata Dziedzic (Instytut Podstaw Informatyki PAN)

Odnośnik do spotkania w MS Teams (nowe okno)

Streszczenie (autorskie):

Glejak jest najczęstszym typem złośliwego nowotworu mózgu. Jak w przypadku wielu nowotworów, przyczyny powstawania i rozwijania się glejaka są złożone i, mimo iż intensywnie badane przez zespoły naukowców na całym świecie, wciąż niejasne. Jedną z często wskazywanych aberracji genetycznych leżących u podstaw choroby jest mutacja w genie IDH1. Sądzi się, że ma ona wpływ na dynamikę rozwoju choroby i raportowanych jest coraz więcej badań na jej temat, ale całościowy wpływ mutacji genu IDH1 na proces onkogenezy (rakowacenia) nie jest jeszcze w pełni wyjaśniony. Nasze badania dotyczą tego problemu. Pierwotny materiał badawczy stanowiły próbki glejaka pobrane od pacjentów w trakcie operacji. Próbki te zostały poddane szeregowi eksperymentów laboratoryjnych, które dostarczyły danych na temat kilku różnych warstw informacji genetycznej. Uzyskane dane wykorzystaliśmy do przeprowadzenia analizy porównawczej między próbkami o różnym statusie genu IDH1: "IDH1-mutanty" zostały porównane do tak zwanych "IDH1-dzikich" (bez mutacji; z angielskiego "wild type"). Uzyskaliśmy wyniki, które wskazują na konkretne następstwa mutacji genu IDH1 i sugerują, jak kaskada kolejnych zdarzeń wywołanych przez tą mutację może wpływać na rozwój choroby. Mutacja genu IDH1 wywołuje efekt domina, zaburzając regulację kolejnych genów — pokazujemy, jak może to przebiegać i które geny są docelowo zaburzone. Mamy nadzieję, że raportując różnice genetyczne pomiędzy IDH1-mutantami a IDH1-dzikimi przyczynimy się do zrozumienia złożonych następstw mutacji genu IDH1. Jednocześnie należy mieć na uwadze fakt, że użyliśmy metod obliczeniowych, a obserwowana przez nas statystyczna istotność wyników nie jest wystarczającym dowodem na ich prawdziwy efekt biologiczny. Aby uzyskać większą pewność w tym zakresie należałoby zaprojektować i przeprowadzić odpowiednie eksperymenty biologiczne.


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności