BERT

Аналіз тональності україномовних звернень громадян: класичні методи та трансформерні архітектури

У статті представлено розширене експериментальне порівняння ефективності методів машинного навчання для задачі трьохкласової класифікації тональності (negative, positive, neutral). Дослідження фокусується на специфічному домені україномовних текстових звернень громадян до органів міського управління, що є актуальною та практично значущою задачею для розвитку сучасних систем електронного урядування (e-Governance) та підтримки прийняття рішень.

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ІДЕНТИФІКАЦІЇ ПРОПАГАНДИ В КОМЕНТАРЯХ TIKTOK НА ОСНОВІ NLP ТА ГЛИБИННОГО НАВЧАННЯ

У статті досліджено актуальну наукову проблему автоматизованого виявлення пропагандистського впливу в коротких текстових коментарях користувачів соціальної мережі TikTok, що функціонує в умовах гібридної війни та інтенсивних дезінформаційних кампаній. Розроблено гібридну модель (hybrid model) виявлення пропагандистського контенту, яка інтегрує глибокі контекстуальні представлення тексту (transformer-based contextual representations) на основі архітектури  BERT із додатковим вектором семіотичних та структурних ознак (кількість емодзі, повторення символів, використання великих літер).

ПРОГНОЗУВАННЯ ЕМОЦІЙНОГО СТАНУ ОСОБИ НА ОСНОВІ ТЕКСТОВИХ ДАНИХ ІЗ ВИКОРИСТАННЯМ МОДЕЛЕЙ BERT І PAD

Розглянуто прогнозування багатовимірного емоційного стану користувача за текстовими записами в умовах, коли наявні текстові підходи здебільшого зосереджені або на категоріальній класифікації емоцій, або на загальній тональності повідомлень, що обмежує інтерпретованість результату на рівні стійкіших афективних станів.

Standardizing Arabic Dialects for NLP: A BERT-Based Transcoding Approach with a Focus on Moroccan Darija

Processing Arabic dialects in Natural Language Processing (NLP) presents significant challenges due to linguistic diversity and the lack of standardized resources.  While Modern Standard Arabic (MSA) benefits from advanced NLP tools and extensive annotated datasets, dialects such as Moroccan Darija remain underrepresented.  This study introduces a BERT-based transcoding framework that bridges the gap between dialectal Arabic and MSA, enabling the use of pre-trained models optimized for MSA, such as AraBERT.  By integrating contextual multilingual embeddings, the propose

Assessing the Quality of Scientific Publications: A Thorough Analysis of Citation-Based and Content-Oriented Metrics for Evaluating Research Impact and Scholarly Contribution

The evaluation of scientific publications is a cornerstone of scholarly research, providing essential insights into the impact, significance, and intellectual contributions of research outputs.  Traditional bibliometric indicators, including Impact Factor (IF), h-index, and citation counts, have historically been the dominant measures to assess research quality.  However, with the rapid evolution of Artificial Intelligence (AI) and its increasing integration into various scientific disciplines, these conventional evaluation methodologies are being reevaluated due to the

Метод формування набору даних для перевірки якості вивчення мовними моделями транзитивного відношення у контексті задачі логічного висновку

Розроблено метод формування набору даних для перевірки вивчення готовими моделями залежності транзитивності. Сформований набір даних використано для тестування якості вивчення моделями залежності транзитивності у задачі логічного висновку (NLI). Тестування набору даних розміром 10 000 зразків (MultiNLI) відбувалось на моделі RoBerta. Також досліджено, що у задачі логічного висновку клас подібний є більш спрямованим, ніж протиріччя і нейтральний.