векторна модель текстів

Класифікація повідомлень груп новин у векторному просторі семантичних полів

Розглянуто класифікацію повідомлень груп новин у просторі семантичних полів. Проаналізовано ефективність баєсівського класифікатора та класифікатора за найближчими сусідами для різних навчальних та тестових вибірок повідомлень. Показано існування підмножини груп новин, для яких використання аналізованих класифікаторів є ефективним.

Кластерний аналіз повідомлень груп новин у просторі семантичних ознак

Проаналізовано кластеризацію текстових повідомлень груп новин на основі моделі векторного простору із базисом, утвореним семантичними ознаками. Як семантичні ознаки розглянуто частотні характеристики семантичних та тематичних полів. Показано ефективність запропонованої моделі у тематичному аналізі неструктурованих текстових повідомлень.