Zapytanie ofertowe
na usługę: przygotowanie automatycznego klasyfikatora oznaczającego w tekście polskim wyrażenia kwantyfikujące
dla
Instytutu Podstaw Informatyki Polskiej Akademii Nauk
w Warszawie przy ul. Jana Kazimierza 5
Specyfikacja:
- Klasyfikator powinien być oparty na rozwiązaniach z dziedziny uczenia maszynowego.
- Dane treningowe (uczące) dla klasyfikatora stanowić będzie wzorcowy korpus NKJP1M w dwóch oddzielnych postaciach: z oznaczonymi ręcznie wyrażeniami kwantyfikującymi oraz z oznaczonymi automatycznie za pomocą parsera COMBO rozbiorami zależnościowymi zdań znajdujących się w korpusie. Ewentualne scalenie obu wersji korpusu w jeden zasób (o ile będzie to potrzebne) spoczywa na zleceniobiorcy.
- Klasyfikator powinien być stworzony tak, by mógł być uruchamiany na współczesnych wersjach systemu Linux (np. Ubuntu 18.04 i nowszych) z wykorzystaniem ogólnodostępnych bibliotek programistycznych.
- Klasyfikator powinien zostać poddany standardowym procedurom ewaluacyjnym, jak np. dziesięciokrotna walidacja krzyżowa. Wyniki przeprowadzonej ewaluacji oraz skrypty ewaluujące powinny zostać dostarczone wraz z klasyfikatorem.
- Zleceniobiorca powinien dostarczyć również podstawową dokumentację oprogramowania, umożliwiającą wykorzystanie klasyfikatora w dalszych pracach projektowych oraz prowadzenie w przyszłości zmian w samym programie. Klasyfikator i dokumentacja powinny w szczególności uwzględniać możliwość modyfikacji danych treningowych polegającej na rozszerzeniu zestawu cech opisujących wyrażenia kwantyfikujące, dzięki czemu klasyfikator mógłby być ponownie wytrenowany i wykorzystany bez ingerencji ze strony zleceniobiorcy.
- Zleceniobiorca powinien dostarczyć również programy konwertujące dane treningowe z formatów wejściowych NKJP1M na format wejściowy klasyfikatora (jeśli będzie on inny), a także programy konwertujące dane w formacie wyjściowym klasyfikatora na format TEI NKJP oraz CONLL (format kolumnowy rozbiorów zależnościowych rozszerzony o dodatkowe kolumny z oznaczeniami kwantyfikatorów).
- Zleceniobiorca powinien zapewnić również podstawowe wsparcie techniczne przez okres 6 miesięcy na wypadek problemów z działaniem programu, co będzie polegać na usuwaniu błędów w ciągu 5 dni roboczych od ich zgłoszenia.
- Zleceniodawca określa termin wykonania zamówienia na 1 grudnia 2020 r.
Termin składania ofert: 19 maja 2020 r. godz. 12:00 20 maja 2020 r. godz. 12:00
Adres do składania ofert: zamowienia@ipipan.waw.pl.
Oferta powinna zawierać cenę brutto, która będzie uwzględniać wszystkie koszty zamawiającego (IPI PAN) związane z przedmiotem zamówienia.
Pytania, np. dotyczące specyfikacji i realizacji zamówienia, proszę kierować na ww. adres email.