Надіслано: Травень 06, 2022
Прийнято: Травень 19, 2022

Цитування за ДСТУ: Теслюк В. М., Казимира І. Я., Кордіяка Ю. М., Рибак І. Р. Моделі та засоби автоматизованого визначення статистичного профілю україномовних текстів. Український журнал інформаційних технологій. 2022, т. 4, № 1. С. 37–43.

Citation APA: Teslyuk, V. M., Kazymyra, I. Ya., Kordiiaka, Yu. M., & Rybak, I. R. (2022). Models and tools for automated determining the statistical profile of ukrainian-language texts. Ukrainian Journal of Information Technology, 4(1), 37–43. https://doi.org/10.23939/ujit2022.01.037

Національний університет "Львівська політехніка", м. Львів, Україна
У роботі вирішується актуальне завдання із вдосконалення професійного програмного забезпечення для статистичного аналізу тексту відповідно до потреб фахівців. Проаналізовано особливості і перспективи статистичних досліджень у мовознавстві та розроблено інформаційну технологію (ІТ) визначення статистичного профілю україномовних текстів. Проведено комплексну роботу над моделюванням програмної системи, яку представлено у відповідних схемах і діаграмах, що цілісно відображають функціонування та призначення розробленого продукту. Розглядаються математичні та системні основи статистичного аналізу для автоматизації професійного опрацювання текстів українською мовою, в контексті впровадження пропонованої інформаційної технології. Побудовано структурну схему проектного рішення та визначено головні вимоги до апаратного забезпечення. Розроблено компоненти інформаційної технології та запропоновано структуру програмної системи, які ґрунтуються на модульному принципі. Розроблено математичне забезпечення ІТ, яке базується на методах прикладної статистики та дає змогу визначити основні характеристики (статистичний профіль) досліджуваних україномовних текстів. Окрім цього, розроблено алгоритмічне та програмне забезпечення ІТ, для реалізації якого використано Python. Наведено результати дослідження україномовних текстів та їх статистичні профілі, продемонстровано, що розроблена інформаційна технологія забезпечує опрацювання україномовних текстів з високим рівнем автоматизації. Отримані результати можна розглядати як внесок у розвиток наукових досліджень у лінгвістиці, завдяки якому створюються умови для вивчення авторських текстів різного стилю та ефективного використання професійних навичок та знань широким колом користувачів.

