інтелектуальний аналіз даних

Дослідження методів інтелектуального аналізу даних для класифікації незбалансованих наборів даних

Завдяки стрімкому розвитку інформаційних технологій, які широко використовуються у всіх сферах людського життя та діяльності, сьогодні накопичено надзвичайно великі обсяги даних. Відповідно застосування методів машинного навчання до цих даних дає змогу отримати нові практично корисні знання, які можуть бути використані для маркетингових, управлінських та дослідницьких цілей. Серед завдань інтелектуального аналізу даних – задачі регресії, прогнозування, кластеризації, класифікації та асоціативних правил. У цьому дослідженні розв’язано задачу бінарної класифікації.

Класифікація повідомлень груп новин у векторному просторі семантичних полів

Розглянуто класифікацію повідомлень груп новин у просторі семантичних полів. Проаналізовано ефективність баєсівського класифікатора та класифікатора за найближчими сусідами для різних навчальних та тестових вибірок повідомлень. Показано існування підмножини груп новин, для яких використання аналізованих класифікаторів є ефективним.

Підвищення точності нейроподібних структур геометричних перетворень

Проаналізовано проблеми підвищення точності нейроподібних структур машини геометричних перетворень (МГП) під час розв’язання завдань передбачення в галузі інтелектуального аналізу даних (ІАД). Розроблений в статті метод передбачення на основі виділення головних компонент шляхом об’єднання вхідних тренувальних та тестових даних ілюструється прикладом.

Архітектура систем озер даних в галузі освіти: аналітичний огляд

Здійснено аналітичний огляд розвитку концепту Data Lakes та його застосування у різних галузях як частини рішень концепту Big data. Розглянуто наявні стандартні архітектурні рішення для організації Data Lake. Також взято до уваги спеціалізовані напрями, що потребують відмінних чи додаткових аспектів для вирішення поставлених завдань, залежно від галузі використання Data Lake. Для правильної організації Data Lake застосовують різноманітні засоби опрацювання даних, зокрема розподілені системи зберігання даних, семантичні мережі та особливо метадані.

Класифікація методів аналізу Великих даних

Описано особливості класифікації методів і технологій аналітики Великих даних, групи методів і технологій аналітики Великих даних, які класифікуються з урахуванням функціональних зв’язків та формальної моделі цієї інформаційної технології. Розв’язано задачу визначення концептів онтології аналітики Великих даних.

Some methods in software development recommendation systems

Проаналізовано сучасний стан моделей і методів побудови рекомендаційних систем. Виділено основні класи задач, які розв’язують рекомендаційні системи. Показано особливості застосування методу спільної фільтрації. Розроблено метод розрахунку коефіцієнтів подібності, який враховує розрідженість векторів рейтингів товарів і користувачів.

Fuzzy Model for Recommender Systems

Проаналізовано поточний стан розробки та застосування рекомендаційних систем, моделей і методів побудови рекомендаційних систем. Показано, що найбільш широко використовується метод колаборативної фільтрації фільтрації. Розроблено метод нечіткої кластеризації, який підвищує точність прогнозування рейтингів продуктів.

Групування тегів користувачів мікроблогів на основі решітки семантичних концептів

Запропоновано модель решітки семантичних концептів для аналізу тегів у повідомленнях, згрупованих за користувачами мікроблогів. Показано, що використання цієї моделі є ефективним під час аналізу груп ключових слів та виявлення асоціативних правил в повідомленнях мікроблогів.

Інтелектуальний аналіз даних

Розглянуто методи інтелектуального аналізу даних. Проаналізовано сферу застосу- вання інтелектуального аналізу даних та існуючі системи. Зроблено висновки стосовно перспектив використання методів інтелектуального аналізу даних.

Застосування засобів інтелектуального аналізу даних для прогнозування використання земельних ресурсів

This article describes the procedures of data mining based on prediction of time series for land cadastre data. Principles, required for the development of the method of forecasting using time series are examined. Mathematical model for serious prediction is developed. The task of prediction of land resources used in Striy District Lviv Region is technically realized.