TF-IDF

Topic Modeling for News Recommendations: Evaluating the Performance of LDA and BERTopic

Text analysis is an important component in the evolution of recommender systems, as it enables meaningful information to be extracted from vast amounts of textual data.  This study performs a comparative analysis of two main topic modeling techniques, Latent Dirichlet Allocation (LDA) and BERTopic in the context of news recommender systems.  Using a dataset of Moroccan news articles, we evaluate the ability of these models to generate coherent and interpretable topics.  Our results demonstrate that BERTopic outperforms LDA in terms of topic consistency and semantic rich

Метод виявлення дезінформації на основі аналізу текстових даних із застосуванням TF-IDF та контекстних векторних представлень

У статті розглянуто підхід до виявлення джерел дезінформації у цифровому середовищі за допомогою аналізу текстів із використанням методів машинного навчання та опрацювання природної мови. Запропонований метод базується на гібридному представленні тексту, яке поєднує частотні ознаки (TF-IDF) з контекстними векторними представленнями, отриманими за допомогою моделі IBM Granite.

Автоматизація формування професіограми спеціаліста на основі аналізу вакансій та текстових даних

Представлено комплексне дослідження проблеми автоматизації процесу професійного відбору фахівців у сфері штучного інтелекту шляхом побудови професіограм із використанням інформаційних технологій. Основну увагу зосереджено на розробці інноваційної моделі, яка поєднує підходи HR-аналітики та методи обробки неструктурованих текстових даних. Актуальність теми зумовлена стрімким розвитком цифрових технологій, зростанням попиту на спеціалістів з ІТ та потребою у стандартизованому описі компетенцій, необхідних для успішної професійної діяльності.

Інформаційна система видобування інформації з відкритих WEB-ресурсів

The purpose of the work is to develop a project of an information and reference system for finding answers to questions based on the highest degree of comparison using text content from open English- language web resources. Examples of such questions can be: “What is the best book ever?”, “What is the most popular IDE for Python”. The result of the functioning of the information and reference system is a ranked list of answers based on the frequency of appearance of each of the answer options.