16.05.2016 - Seminarium Instytutowe - godz. 13:00, prof. Jacek Koronacki (IPI PAN)
Rozwój technologii teleinformatycznych sprawia, że możemy utonąć w powodzi danych. Ale możemy też z tej powodzi starać się wydobywać nową i wartościową wiedzę. Na przykład niezwykle rozwinęły się biotechnologie pozwalające na zbieranie masowych danych o żywych komórkach. Wyzwanie, jakie się za tym od początku kryło, brało się stąd, że typowe dane w takich zastosowaniach biologicznych charakteryzowały się małą liczbą obserwacji (obiektów) – np. rzędu dziesiątków lub setek – z których każda opisana była tysiącami lub większą liczbą atrybutów (cech). Dobrymi i ważnymi przykładami problemów tego typu były dane mikromacierzowe, dotyczące tzw. ekspresji genów, lub dane proteomiczne. Z czasem badania tego typu przyniosły większe liczby obserwacji, ale też jeszcze większe liczby atrybutów opisujących te obserwacje. W ramach wykładu, w jego zasadniczej części, przedstawiony zostanie stan badań w obszarze uczenia pod nadzorem w opisanej sytuacji.
W drugiej, znacznie krótszej, części wykładu spojrzymy ze statystycznej – i w jakiejś mierze filozoficznej – perspektywy na problem szerszy, a mianowicie analizy zbiorów danych zwanych po angielsku „Big Data”.