30.10.2017 - Seminarium Instytutowe - godz. 13:00, Mieczysław A. Kłopotek (IPI PAN)
Powszechnie zakłada się, że celem analizy skupień jest taki podział zbioru obiektów na grupy, by elementy grupy były do siebie jak najbardziej podobne, a elementy między grupami różniły się maksymalnie. Pytanie, które podnosimy w tym referacie brzmi: CZYŻBY?
Ćwierćwiecze naukowych i prakseologicznych dociekań autora na własnościami algorytmów analizy skupień, zainspirowanych twierdzeniem Watanabe, doprowadziły do wniosku, iż dodatkowym wymiarem jest tu domyślny podział indukowany przez algorytm. Podział domyślny to taki, który jest implikowany przez algorytm grupowania w sytuacji, gdy w rzeczywistości zbiór nie rozpada się na naturalne grupy. Stąd interesujące są tylko te podziały na grupy, które są odległe od domyślnego dla danego algorytmu.
Powyższa hipoteza zostanie zilustrowana na podstawie tzw. algorytmów grupowania kompromisowego oraz metagrupowania. Obie kategorie algorytmów próbują wyjść naprzeciw problemowi zwracania różnych podziałów na grupy tego samego zbioru przez różne algorytmy analizy skupień. Algorytmy kompromisowe poszukują podziału najbliższemu wszystkim uzyskanym podziałom. Algorytmy metagrupowania traktują podziały jako obiekty i grupują je, by zobrazować użytkownikowi, jakie typy podziałów zbioru występują, by użytkownik sam mógł dokonać wyboru najlepszego grupowania.
W referacie skupiamy się na grupowaniu kompromisowym i metagrupowaniu uniwersum wszystkich możliwych podziałów. Teoretycznie jest to sytuacja, w której brak jest struktury w danych. Jednak wykażemy, że znane algorytmy zwrócą pewien konkretny podział, podział domyślny. Fakt ten stanowi wyzwanie dla dalszego rozwoju metod analizy skupień.