TF-IDF

Метод виявлення дезінформації на основі аналізу текстових даних із застосуванням TF-IDF та контекстних векторних представлень

У статті розглянуто підхід до виявлення джерел дезінформації у цифровому середовищі за допомогою аналізу текстів із використанням методів машинного навчання та опрацювання природної мови. Запропонований метод базується на гібридному представленні тексту, яке поєднує частотні ознаки (TF-IDF) з контекстними векторними представленнями, отриманими за допомогою моделі IBM Granite.

Автоматизація формування професіограми спеціаліста на основі аналізу вакансій та текстових даних

Представлено комплексне дослідження проблеми автоматизації процесу професійного відбору фахівців у сфері штучного інтелекту шляхом побудови професіограм із використанням інформаційних технологій. Основну увагу зосереджено на розробці інноваційної моделі, яка поєднує підходи HR-аналітики та методи обробки неструктурованих текстових даних. Актуальність теми зумовлена стрімким розвитком цифрових технологій, зростанням попиту на спеціалістів з ІТ та потребою у стандартизованому описі компетенцій, необхідних для успішної професійної діяльності.

Інформаційна система видобування інформації з відкритих WEB-ресурсів

The purpose of the work is to develop a project of an information and reference system for finding answers to questions based on the highest degree of comparison using text content from open English- language web resources. Examples of such questions can be: “What is the best book ever?”, “What is the most popular IDE for Python”. The result of the functioning of the information and reference system is a ranked list of answers based on the frequency of appearance of each of the answer options.