Проаналізовано кластеризацію текстових повідомлень груп новин на основі моделі векторного простору із базисом, утвореним семантичними ознаками. Як семантичні ознаки розглянуто частотні характеристики семантичних та тематичних полів. Показано ефективність запропонованої моделі у тематичному аналізі неструктурованих текстових повідомлень.
1. Ким Д.О., Мьюллер Ч.У., Клекка У.Р. Факторный, дискриминантный и кластерный анализ. – М.: Финансы и статистика, 1989. – 215 с.: ил. 2. Жамбю М. Иерархический кластер-анализ и соответствия: пер. с фр. – М.: Финансы и статистика, 1988. – 342 с. 3. Павлишенко Б.М. Векторизація кластерів на растрових зображеннях електронної мікроскопії // Вісник Львів. ун-ту, серія фізична. 2007 р. – Вип. 40. – С. 117–121. 4. Fellbaum C. WordNet. An Electronic Lexical Database. Cambridge, MA: MIT Press, 1998, 432 p. 5. Gliozzo Alfio, Strapparava Carlo Semantic Domains in Computational Linguistics. Springer , 2009 – 132 p. 6. Брасегян А.А., Куприянов М.С., Холод И.И., Тесс М.Д., Елизаров С.И. Анализ данных и процессов: учеб. пособие. – СПб.:БХВ–Петербург, 2009. – 512 с. 7. Павлишенко Б. М. Ієрархічна кластеризація текстових документів у векторному просторі семантичних полів // Електроніка та інформаційні технології. –2011. – Вип. 1.– С. 212–222. 8. Павлишенко Б. М. Сингулярна декомпозиція матриці семантичних ознак в алгоритмі ієрархічної кластеризації текстових масивів // Математичні машини і системи. – 2012. – №1. – С. 69–76. 9. Pantel Patrick, Turney Peter D. From Frequency to Meaning: Vector Space Models of Semantics // Journal of Artificial Intelligence Research.–2010. – Vol.37. – pp. 141–188. 10. Павлишенко Б.М. Використання концепції семантичного поля у векторній моделі текстових документів // Східно- Європейський журнал передових технологій. – 2011. – № 6/2(54). – С. 7–11.