Інформаційна технологія з визначення токсичності у тексті
У представленій роботі досліджено проблему автоматизації виявлення агресивних висловлювань в українському сегменті інтернету, що є критично важливим через дефіцит спеціалізованих лінгвістичних ресурсів для цієї мови. Основний фокус уваги було приділено створенню та випробуванню інформаційної технології, здатної ефективно класифікувати токсичні повідомлення за допомогою моделей основних алгоритмів машинного навчання. Для проведення експериментів було сформовано набір даних із 4600 записів, у яких об’єднано дані з платформ YouTube та Google Play із відкритими датасетами.