NLP

Метод формування набору даних для перевірки якості вивчення мовними моделями транзитивного відношення у контексті задачі логічного висновку

Розроблено метод формування набору даних для перевірки вивчення готовими моделями залежності транзитивності. Сформований набір даних використано для тестування якості вивчення моделями залежності транзитивності у задачі логічного висновку (NLI). Тестування набору даних розміром 10 000 зразків (MultiNLI) відбувалось на моделі RoBerta. Також досліджено, що у задачі логічного висновку клас подібний є більш спрямованим, ніж протиріччя і нейтральний.

Інформаційна система озвучення україномовного тексту на основі методів NLP та машинного навчання

Під час дослідження розроблено інформаційну систему озвучення україномовного тексту на основі методів NLP та машинного навчання. Створена інформаційна система реалізована у виг- ляді десктоп-додатка, який дає змогу здійснювати озвучення україномовного тексту Створення системи охоплювало всі стадії розроблення програмного забезпечення: процес проєктування, процес реалізації та процес тестування. Щоб обґрунтувати доцільність створення такої системи, ми проаналізували вже наявні програмні рішення на ринку, їхні переваги та недоліки, які ураховували, створюючи нову систему.

Overview of the Ukrainian language resources within the multilingual European MULTEXT-East project, v. 4

The article presents an overview of computational resources for the Ukrainian language within a multilingual European MULTEXT-East project (MTE, http://nl.ijs.si/ME/V4) freely available for researchers since May 2010, including a formal representation of morphosyntactic specifications consisting of 1239 unique grammatical tags in the XML, TEI-5 compatible, format and a morphosyntactic lexicon covering over 200000 wordforms with lemmas and morphosyntactic codes.