Методи семантичного аналізу при анотованому узагальненні текстових документів

О. Б. Очерклевич; Анатолій Ігнатович

Розглянуто використання семантичного аналізу при узагальненні текстових документів. Проаналізовано найпоширеніші методи узагальнення текстових документів та оцінювання якості результатів оцінювання. Наведено особливості вдосконаленого методу анотаційного узагальнення текстових документів, який використовує принципи прихованого семантичного аналізу та елементи нечіткої логіки для виявлення семантично важливих речень. Запропоновано використання нового підходу до оцінювання ефективності узагальнення, основаного на елементах нечіткої логіки та на статистичному показнику, що використовується для оцінювання важливості слів у контексті та класу документа, що дає змогу визначити міру відповідності вмісту оригінального документа та його резюме. Наведено результати верифікації запропонованих засобів, що засвідчують їхню ефективність.

текстовий документ

анотоване узагальнення

Ahmad K., Vrusias B. PCF Oliveira: Final evaluation and categorization of the text. Proceedings of the 26th Annual ACM SIGIR International Conference on Information Search Research and Development, Toronto, Canada, 2003. pp. 443–444.
Ginek J., Hedgehog K.: A practical approach to automatic generalization of the text. Proceedings of the ELPUB '03 Conference, Guimarães, Portugal, 2003, pp. 378–388.
Gong Yu., Liu X.: Generalization of the general text by means of measurement of relevance and the hidden semantic analysis. Proceedings of the 24th Annual ACM SIGIR International Conference on Information Research and Development, New Orleans, Louisiana, USA, 2001. pp. 19–25.
HP Edmundson: New methods for automatic removal. Journal of the Association of Computers 16 (2), 2001. pp 228–264.
Kupiek J., Pedersen J., Chen F.: Summary: Proceedings of the Eighteenth Annual ACM SIGIR International Conference on Information Search Research and Development, Seattle, Washington, USA, 1995. pp. 68–73
Radev R., Teufel S., Saggion H., Lam V., Blitzer J., Qi H., Celebi A., Liu D., Drabek E.: Problems of evaluation in a large generalization of documents. Issue 41st Annual Meeting of the Association of Computational Linguistics, Sapporo, Japan, 2003. pp. 375–382.
Understanding Inverse Document Frequency: On theoretical arguments for IDF. Stephen Robertson. Reprinted from: Journal of Documentation 60, No. 5, pp. 503–520.
Using Latent Semantic Analysis in Text Summarization and Summary Evaluation. Josef Steinberger, Karel Jezek/https://www.researchgate.net/publication/313673360.
Design System of Image Recognition Based on Neural Network / Vitaliy Yarkun, Yaroslav Paramud and Roman-Andriy Ivantsiv // 15th International Conference. The Experience of Designing and Application of CAD Systems (CADSM`2019). Polyana (Svalyava), Ukraine, February 26 – March, 2019. – рр. 2/41–2/44.
Paramud Y., Yarkun V. Method rozpiznavannya symvoliv na zobragennyakh na osnovi zhortkovoii neiironnoi meregi./ Transactions on Computer systems and networks, Lviv Polytechnic National University Press, 2018, No. 905, pp. 96–105 (in Ukrainian).