Aleksandra Tomaszewska o etycznym pozyskiwaniu danych tekstowych na współKongresie Kultury w PKiN
Na współKongresie Kultury, organizowanym w Pałacu Kultury i Nauki w dniach 7-9 listopada br., w panelu dotyczącym prawnych i etycznych aspektów tworzenia sztucznej inteligencji, Aleksandra Tomaszewska z Instytutu Podstaw Informatyki PAN opowiedziała o tym, jak pozyskiwane są dane do tworzonego w ramach konsorcjum PLLuM otwartego polskiego modelu AI, który będzie wsparciem m.in. dla nauki, mediów i administracji publicznej.
Aleksandra Tomaszewska podkreśliła, że cały zespół PLLuM od początku przykłada dużą wagę do etycznego pozyskiwania wartościowych i przede wszystkim polskojęzycznych danych. Szczególnie ważna jest współpraca z wydawnictwami. Model językowy, aby mógł skutecznie działać, potrzebuje dostępu do wielu polskich tekstów z różnych dziedzin, od literatury pięknej, przez artykuły naukowe, prasę codzienną, aż po teksty poradnikowe czy urzędowe.
Z zainteresowanymi wydawcami za każdym razem podpisywane są umowy licencyjne, które określają zasady korzystania z przekazanych danych, w tym pola ich eksploatacji. Co ważne, dane używane są wyłącznie do trenowania modelu PLLuM i nie są nigdy udostępniane na zewnątrz.
Więcej…Aleksandra Tomaszewska o etycznym pozyskiwaniu danych tekstowych na Współkongresie w PKiN