27.06.2016 - Institute Seminar - 13:30, prof. Jan Mielniczuk (ICS PAS) 

27 06 2016 mielniczuk

Dla przypadku danych wysokowymiarowych, dla których liczba predyktorów jest większa od liczby obserwacji, rozważymy problem konstrukcji rzadkiego modelu predykcyjnego, czyli prostej i jednocześnie silnej zależności między małą liczbą predyktorów a zmienną zależną y.

Istotną trudnością jest tu złe uwarunkowanie problemu oraz częste wzajemne skorelowanie predyktorów, co powoduje, że filtracje oparte na sile zależności indywidualnych predyktorów z y nie prowadzą do  satysfakcjonujących rozwiązań.

Jedną z możliwości stanowią metody wykorzystujące maksymalizację funkcji wiarogodności z karą indukującą rzadkość, takie, jak LASSO. Obecnie wiadomo, że LASSO wybiera zbyt duży zbiór zmiennych aktywnych, oraz że zmienne nieaktywne mogą być włączane do modelu przed zmiennymi aktywnymi. Problem ten usiłuje się rozwiązać przy użyciu innych kar, w tym kar quasi-wypukłych FCP.

W referacie przedstawię podejście SOS (Screening-Ordering-Selection), oparte na wstępnym wyborze zmiennych przy użyciu LASSO, dopasowaniu małego modelu używającego wybranych zmiennych, oraz wyborze ostatecznego zbioru zmiennych, które wykorzystuje uogólnione kryteria informacyjne. 

Skupię się przede wszystkim na omówieniu zależności liniowych i odpowiedzi ilościowej, omawiając jednak krótko sytuację odpowiedzi binarnej i złej specyfikacji modelu.

Omawiane wyniki pochodzą z wspólnych prac z Piotrem Pokarowskim, Pawłem Teisseyre i Mariuszem Kubkowskim.

ONLINE BROADCAST: (from 13:30 - 06/27/2016)

Direct link: https://www.youtube.com/watch?v=0o_dgXFNhns

ATTENTION! This site uses cookies and similar technologies.

If you do not change your browser settings, you automatically agree to this.

I understand