Кластерний аналіз повідомлень груп новин у просторі семантичних ознак

Authors: 

Павлишенко Б.М.

Львівський національний університет імені Івана Франка, кафедра фізики напівпровідників

Проаналізовано кластеризацію текстових повідомлень груп новин на основі моделі векторного простору із базисом, утвореним семантичними ознаками. Як семантичні ознаки розглянуто частотні характеристики семантичних та тематичних полів. Показано ефективність запропонованої моделі у тематичному аналізі неструктурованих текстових повідомлень.

1. Ким Д.О., Мьюллер Ч.У., Клекка У.Р. Факторный, дискриминантный и кластерный анализ. – М.: Финансы и статистика, 1989. – 215 с.: ил. 2. Жамбю М. Иерархический кластер-анализ и соответствия: пер. с фр. – М.: Финансы и статистика, 1988. – 342 с. 3. Павлишенко Б.М. Векторизація кластерів на растрових зображеннях електронної мікроскопії // Вісник Львів. ун-ту, серія фізична. 2007 р. – Вип. 40. – С. 117–121. 4. Fellbaum C. WordNet. An Electronic Lexical Database. Cambridge, MA: MIT Press, 1998, 432 p. 5. Gliozzo Alfio, Strapparava Carlo Semantic Domains in Computational Linguistics. Springer , 2009 – 132 p. 6. Брасегян А.А., Куприянов М.С., Холод И.И., Тесс М.Д., Елизаров С.И. Анализ данных и процессов: учеб. пособие. – СПб.:БХВ–Петербург, 2009. – 512 с. 7. Павлишенко Б. М. Ієрархічна кластеризація текстових документів у векторному просторі семантичних полів // Електроніка та інформаційні технології. –2011. – Вип. 1.– С. 212–222. 8. Павлишенко Б. М. Сингулярна декомпозиція матриці семантичних ознак в алгоритмі ієрархічної кластеризації текстових масивів // Математичні машини і системи. – 2012. – №1. – С. 69–76. 9. Pantel Patrick, Turney Peter D. From Frequency to Meaning: Vector Space Models of Semantics // Journal of Artificial Intelligence Research.–2010. – Vol.37. – pp. 141–188. 10. Павлишенко Б.М. Використання концепції семантичного поля у векторній моделі текстових документів // Східно- Європейський журнал передових технологій. – 2011. – № 6/2(54). – С. 7–11.