природномовний текст

Метод побудови ембедінгів ознак у задачах глибинного навчання на основі онтологій

У роботі досліджено проблему ембедингу ознак, які використовують у датасетах для навчання нейронних мереж. Використання ембедингів підвищує продуктивність нейронних мереж, а отже, є важливою ланкою підготовки даних для методів глибинного навчання. Такий процес ґрунтується на семантичній метриці. Запропоновано для ембедингу використовувати онтології предметних областей, до яких належить відповідна ознака. У цій роботі розроблено такий метод й досліджено його використання для завдання рубрикування текстових документів. Результати досліджень підтвердили перевагу розробленого методу.