06.03.2023 - Seminarium Instytutowe — godz. 11:00 on-line

Józef Pieprzyk (IPI PAN & Queensland Universilty of Technology)

Odnośnik do spotkania w MS Teams (nowe okno)

Streszczenie (autorskie):

Większość komunikacji internetowej jest bardzo nadmiarowa i jednocześnie wymagany jest odpowiedni stopień bezpieczeństwa podczas transmisji. Aby zaoszczędzić na przepustowości komunikacji i zapewnić pożądany poziom bezpieczeństwa, strumień danych jest najpierw kompresowany w celu usunięcia nadmiarowych bitów, a następnie szyfrowany z użyciem uwierzytelnionego szyfrowania. To rozwiązanie jest bardzo elastyczne i działa dobrze dla dowolnej pary algorytmów (kompresji i szyfrowania). Jego wadą jest jednak fakt, że oba algorytmy są projektowane niezależnie. Można oczekiwać, że zaprojektowanie pojedynczego algorytmu kompresującego i szyfrującego (zwanego compcrypt) powinno przynieść korzyści pod względem zarówno wydajności jak i stopnia bezpieczeństwa.
Seminarium przedstawia wyniki osiągnięte podczas projektowania algorytmów łącznej kompresji i szyfrowania z użyciem algorytmu kompresji ANS. Najpierw wprowadzimy kompresję ANS i omówimy jej własności. Pokażemy również, że ANS z ukrytą tablicą kodowania (i dekodowania) można "złamać" za pomocą ataków statystycznych. Następnie badamy zachowanie algorytmu ANS w przypadku, gdy jego stany są wybierane losowo. Po tej wstępnej fazie przedstawiamy nasz algorytm compcrypt, który jest zbudowany w oparciu o ANS z losowymi skokami stanów i z szyfrowaniem z użyciem gąbki MonkeyDuplex. Podajemy również formalne dowody stopnia bezpieczeństwa (poufności i integralności/uwierzytelnienia) oparte na grach kryptograficznych. Nasz algorytm compcrypt został zaimplementowany. Nasza implementacja pozwala na przetwarzanie danych z szybkością 178 MB/s, która jest porównywalna do szybkości ANS-a z losowymi skokami stanów (182 MB/s). Ceną za to jest mała strata jakości kompresji.
Prezentacja jest oparta na pracy dostępnej w ramach Open Access: Camtepe S., et al. (2022): ANS-based compression and encryption with 128-bit security, International Journal of Information Security, Vol. 21, pp. 1051–1067.

27.03.2023 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Julian Zubek i Joanna Rączaszek-Leonardi (Wydział Psychologii Uniwersytetu Warszawskiego)

Odnośnik do spotkania w MS Teams (nowe okno)


Streszczenie (autorskie):

Rozwój nauk informatycznych przyzwyczaił nas do rozumienia symboli jako dyskretnych elementów abstrakcyjnej struktury, na których wykonywane są formalne operacje. W ujęciu semiotycznym symbole są szczególnym rodzajem znaków, które funkcjonują w ramach systemu powiązań i których interpretacja wymaga znajomości reguł rządzących tym systemem. Patrząc z perspektywy procesów ewolucji języka i rozwoju językowego, wyłanianie się struktur symbolicznych oraz zdolności do posługiwania się nimi wiąże się z szeregiem podstawowych pytań. W naszym programie badawczym koncentrujemy się na tym, jak abstrakcyjne symbole kształtują się równolegle do zdolności wykonywania fizycznych akcji w świecie i w jaki sposób symbole mogą stać się regulatorami tych akcji. W celu ilustracji tych zależności, korzystamy z symulacji komputerowych, w których agenci koordynują swoje działania przy pomocy protokołu komunikacyjnego wyłaniającego się oddolnie w schemacie uczenia ze wzmocnieniem. Wskazujemy na założenia stojące u podstaw tego typu modeli i na istniejące trudności w modelowaniu wielorakich źródeł presji kształtujących strukturę języka. Prezentujemy wyniki własnych symulacji, ilustrujących a) wpływ historii interakcji na strukturę języka, b) związek dostępności kontekstu i wieloznaczności w komunikacji, c) rolę dialogu w koordynacji i strukturyzacji akcji w dynamicznym środowisku. Uzyskane wyniki pokazują złożoną naturę symboli, która wymaga komplementarności opisu na poziomie formalnej struktury i na poziomie dynamiki układu. Złożoność ta powinna znaleźć również odzwierciedlenie w projektowaniu i ewaluacji algorytmów sztucznej inteligencji przeznaczonych do interakcji z ludźmi.

27.02.2023 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Sebastian Vincent (University of Sheffield)

Odnośnik do spotkania w MS Teams (nowe okno)


Streszczenie (autorskie):

Wydajne użycie kontekstu pochodzącego z wewnątrz lub spoza tłumaczonego tekstu pozostaje jedną z krytycznych luk pomiędzy tłumaczeniem profesjonalnym a maszynowym. Dotychczasowo, badania koncentrowały się głównie na pojedynczych, dobrze zdefiniowanych typach kontekstu, takich jak poprzednie zdania, lub dyskretne zmienne (np. płeć mówcy). Niniejsza praca przedstawia MTCue, framework neuronowego tłumaczenia maszynowego, który, przepisując dyskretny kontekst na tekst, uczy się abstrakcyjnej reprezentacji kontekstu pozwalającej na transfer pomiędzy różnymi ustawieniami danych oraz wykorzystanie podobnych sygnałów, gdy danych jest niewiele. Eksperymenty w sześciu parach językowych w domenie dialogu z dostępem do metadanych i poprzednich zdań wykazują wyraźny wzrost jakości tłumaczenia w stosunku do bezkontekstowego systemu. Dalsza analiza pokazuje, że enkoder kontekstu w MTCue uczy się reprezentacji zorganizowanej w odniesieniu do specyficznych atrybutów, takich jak formalność, efektywnie umożliwiając ich kontrolę bez trenowania. Wstępne szkolenie na metadanych i poprzednich zdaniach pozwala również MTCue uczyć się nowych kodów kontrolnych z mniejszą ilością danych.

13.02.2023 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Artur Nowakowski, Gabriela Pałka, Kamil Guttmann, Mikołaj Pokrywka (Uniwersytet Adama Mickiewicza)


Streszczenie (autorskie):

Większość systemów tłumaczenia automatycznego opiera się na trenowaniu modeli na poziomie zdań. Jednak współcześnie coraz częściej oczekuje się, że system tłumaczenia będzie uwzględniał kontekst całego dokumentu. W odpowiedzi na te oczekiwania, organizatorzy konferencji WMT 2022 stworzyli zadanie General MT Task, polegające na tłumaczeniu dokumentów z różnych dziedzin: newsów, treści z portali społecznościowych, konwersacji i tekstów z dziedziny e-commerce.
Podczas prezentacji omówione zostanie zadanie, z jakim przyszło się zmierzyć podczas konferencji WMT 2022 w kierunkach tłumaczenia czeski-ukraiński oraz ukraiński-czeski. Przedstawione zostaną napotkane problemy, takie jak poprawne tłumaczenie jednostek nazwanych, uwzględnienie kontekstu dokumentu oraz poprawne uwzględnienie rzadko występujących znaków, takich jak emoji. Pokazane zostaną także metody wspomagające wybór najlepszego tłumaczenia spośród tłumaczeń wygenerowanych przez system, oparte na modelach automatycznej oceny jakości tłumaczenia. Celem prezentacji jest przede wszystkim zaprezentowanie składowych systemu, które pomogły osiągnąć najlepszy wynik spośród wszystkich uczestników konkursu.

21.03.2023 - Seminarium Teorii Gier i Decyzji - godz. 11:00,

Adam Idzik (Instytut Podstaw Informatyki PAN)

Streszczenie:
Omówione zostaną uogólnienia twierdzenia Brouwera : jeśli ciągłe odwzorowanie sympleksu n-wymiarowego, położonego w n-wymiarowej przestrzeni euklidesowej, w tę przestrzeń zachowuje ściany tego sympleksu, to to odwzorowanie jest surjektywne. Podane zostaną również uogólnienia na odwzorowania wielowartościowe.
Twierdzenia te mają zastosowanie w dowodach istnienia równowagi w dyskretnych modelach gospodarki z pieniędzmi.

14.03.2023 - Seminarium Teorii Gier i Decyzji - godz. 11:00,

Adam Idzik (Instytut Podstaw Informatyki PAN)

Streszczenie:
Omówione zostaną uogólnienia twierdzenia Brouwera : jeśli ciągłe odwzorowanie sympleksu n-wymiarowego, położonego w n-wymiarowej przestrzeni euklidesowej, w tę przestrzeń zachowuje ściany tego sympleksu, to to odwzorowanie jest surjektywne. Podane zostaną również uogólnienia na odwzorowania wielowartościowe.
Twierdzenia te mają zastosowanie w dowodach istnienia równowagi w dyskretnych modelach gospodarki z pieniędzmi.


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności