кластеризація

Система автоматизованого аналізу природномовних текстів з використанням трансформерів

Статтю присвячено дослідженню розроблення системи автоматизованого аналізу медичних текстів з використанням сучасних технологій штучного інтелекту та опрацювання природної мови. Проаналізовано сучасний стан та перспективи розвитку в галузі автоматизованого аналізу медичних текстів. Розглянуто основні методи та технології, які використовуються у цій сфері, зокрема машинне навчання, глибинне навчання та опрацювання природної мови. Виявлено, що існуючі системи мають певні обмеження щодо точності та швидкості аналізу, а також недостатньо враховують специфіку медичної термінології та контексту.

Аналіз швидкодії методу k-means для декомпозиції задачі комівояжера великих розмірностей

Декомпозиція задачі базується на кластеризації вхідної множини точок відомим методом k- means та алгоритмі розширення часткового розв’язку у кластерах. Саме k-means застосовано для поділу множини вхідних даних для задачі комівояжера великих розмірностей на менші підзадачі. Обгрунтовано доцільність його використання для зменшення розмірності.

Порівняння та кластеризація джерел текстової інформації на основі алгоритму косинусної подібності

У цій статті представлено дослідження, спрямоване на розроблення оптимальної концепції аналізу та порівняння джерел інформації на основі великих обсягів текстової інформації з використанням методів опрацювання природної мови. Об’єктом дослідження стали канали новин Telegram, які використовуються як джерела текстових даних. Була проведене попереднє опрацювання текстів, включаючи очищення, токенізацію та лематизацію, щоб сформувати глобальний словник, що складається з унікальних слів з усіх джерел інформації.

Застосування системи тестового опитування на основі кластерного аналізу та машинного навчання в задачах профвідбору фахівців

Дослідження спрямоване на розробку тестового опитування для ефективного відбору фахівців в ІТ-галузі, що базується на використанні сучасних методів машинного навчання, зокрема кластерного аналізу з застосуванням методу k-середніх. Зважаючи на обмежений доступ до існуючих тестувальних платформ, які зазвичай доступні лише для великих компаній на платній основі, було прийнято рішення створити альтернативний веб-додаток. Цей додаток стане доступним інструментом для більш широкого кола користувачів та дозволить автоматизувати процес оцінки навичок кандидатів.

Дослідження і розроблення методів і алгоритмів неієрархічної кластеризації

Розроблено і досліджено методи й алгоритми неієрархічної кластеризації, які дають змогу визначити оптимальну початкову кількість кластерів без будь-якої початкової інформації про їхнє розміщення. Розроблені методи і алгоритми досліджено на відомому тестовому наборі Iris.

Developed and studied the methods and non-hierarchical clustering algorithms for determining the optimal initial number of clusters without any background information on the location of the clusters. The methods and algorithms are studied in the famous test set Iris.

Особливості опрацювання даних для ієрархічної кластеризації складних схем

Пропонується гнучкий і універсальний підхід для опису електричних схем та дерева згортання, за яким можна оптимізувати виконання ключових етапів ієрархічної кластеризації.

A flexible and universal approach for presentation of electric circuits and reduction tree, which can optimizes the performance of key stages of hierarchical clustering is proposed.

Алгоритми кластеризації робочого поля з обмеженнями для задачі комівояжера

Описано три підходи до кластеризації робочого поля для задачі комівояжера, що забезпечує поділ множини точок на частини з заданими обмеженнями. Один із відомих алгоритмів використовується для отримання розв’язків в кожному кластері з подальшим зшиванням часткових розв’язків.

Article describes three approaches to clustering set of points of TSP into subsets with given constraints. One of the well-known basic algorithms is used for solutions at every cluster with further joining of partial solutions.

Аналіз рішень та підходів кластеризації геопросторових даних для оптимізації продуктивності веб-карти та взаємодії користувача

У сучасну епоху, управління та візуалізація геопросторової інформації у веб-браузерах набули більшого значення. Веб-карти є незамінними інструментами в різних областях, таких як туризм, доставка товарів чи екологія. Важливим є також широка підтримка веб-браузерів на різних пристроях, що робить використання геоданих у веб більш доступним для різних користувачів. Але постійне збільшення геопросторової інформації створює нові виклики у ефективному відображенні даних та навігації по цих даних на веб-картах. Тому при роботі з геоданими важливою є їх кластеризація.

Інтелектуальна система кластеризації користувачів соціальних мереж на основі аналізу тональності даних

Головна мета статті – аналіз інтелектуальної системи кластеризації користувачів со- ціальних мереж на основі аналізу тональності даних. Основна мета цієї інтелектуальної системи – формування загального «образу» користувача системи за допомогою аналізу тональності даних соціальних мереж користувача та їх подальшої кластеризації. Спроєктовано інтелектуальну систему, яка з використанням алгоритмів Identity та Access/Refresh JWT токенів забезпечує швидкі та максимально безпечні функції реєстрації, автентифікації та опрацювання різних сеансів користувачів системи.

Оцінювання соціально-економічного розвитку районів Львівської області: кластерний підхід

Здійснено порівняльний кластерний аналіз соціально-економічного стану та розвитку районів Львівської області за п’ятирічний період. Виявлено показники, які найбільше впливають на формування кластерів. Запропоновано підхід, що може слугувати підґрунтям для розробки ефективних інструментів управління територіями на підставі аналізу статистичних соціально-економічних показників.