Aleksandra Tomaszewska o etycznym pozyskiwaniu danych tekstowych na współKongresie Kultury w PKiN
Na współKongresie Kultury, organizowanym w Pałacu Kultury i Nauki w dniach 7-9 listopada br., w panelu dotyczącym prawnych i etycznych aspektów tworzenia sztucznej inteligencji, Aleksandra Tomaszewska z Instytutu Podstaw Informatyki PAN opowiedziała o tym, jak pozyskiwane są dane do tworzonego w ramach konsorcjum PLLuM otwartego polskiego modelu AI, który będzie wsparciem m.in. dla nauki, mediów i administracji publicznej.
Aleksandra Tomaszewska podkreśliła, że cały zespół PLLuM od początku przykłada dużą wagę do etycznego pozyskiwania wartościowych i przede wszystkim polskojęzycznych danych. Szczególnie ważna jest współpraca z wydawnictwami. Model językowy, aby mógł skutecznie działać, potrzebuje dostępu do wielu polskich tekstów z różnych dziedzin, od literatury pięknej, przez artykuły naukowe, prasę codzienną, aż po teksty poradnikowe czy urzędowe.
Z zainteresowanymi wydawcami za każdym razem podpisywane są umowy licencyjne, które określają zasady korzystania z przekazanych danych, w tym pola ich eksploatacji. Co ważne, dane używane są wyłącznie do trenowania modelu PLLuM i nie są nigdy udostępniane na zewnątrz.
Aleksandra Tomaszewska o etycznym pozyskiwaniu danych tekstowych na współKongresie Kultury w PKiN
Na współKongresie Kultury, organizowanym w Pałacu Kultury i Nauki w dniach 7-9 listopada br., w panelu dotyczącym prawnych i etycznych aspektów tworzenia sztucznej inteligencji, Aleksandra Tomaszewska z Instytutu Podstaw Informatyki PAN opowiedziała o tym, jak pozyskiwane są dane do tworzonego w ramach konsorcjum PLLuM otwartego polskiego modelu AI, który będzie wsparciem m.in. dla nauki, mediów i administracji publicznej.
Rozmowę prowadziła Justyna Czechowska, literaturoznawczyni, tłumaczka, a wzięli w niej udział poza Aleksandra Tomaszewska, Iga Bałos, dr nauk prawnych, specjalizująca się w prawie własności intelektualnej oraz Piotr Siemion, PhD, J.D. (US), prawnik, pisarz i tłumacz.
Aleksandra Tomaszewska podkreśliła, że cały zespół PLLuM od początku przykłada dużą wagę do etycznego pozyskiwania wartościowych i przede wszystkim polskojęzycznych danych. Szczególnie ważna jest współpraca z wydawnictwami. Model językowy, aby mógł skutecznie działać, potrzebuje dostępu do wielu polskich tekstów z różnych dziedzin, od literatury pięknej, przez artykuły naukowe, prasę codzienną, aż po teksty poradnikowe czy urzędowe.
Z zainteresowanymi wydawcami za każdym razem podpisywane są umowy licencyjne, które określają zasady korzystania z przekazanych danych, w tym pola ich eksploatacji. Co ważne, dane używane są wyłącznie do trenowania modelu PLLuM i nie są nigdy udostępniane na zewnątrz.
Zachęcamy do zapoznania się z relacją z kongresu, którą przygotował Jakub Jamrozek z Radia Czwórka Polskie Radio S.A. Można tam dowiedzieć się m.in. o:
- idei współKongersu, o której mówi Hanna Wróblewska Ministra Kultury i Dziedzictwa Narodowego,
- polskim modelu językowym opowiada Aleksandra Tomaszewska z IPI PAN.