Research of data mining methods for classification of imbalanced data sets

With the rapid development of information technology, which is widely used in all spheres of human life and activity, extremely large amounts of data have been accumulated today. By applying machine learning methods to this data, new practically useful knowledge can be obtained. The main goal of this paper is to study different machine learning methods for solving the classification problem and compare their efficiency and accuracy.

Класифікація повідомлень груп новин у векторному просторі семантичних полів

Розглянуто класифікацію повідомлень груп новин у просторі семантичних полів. Проаналізовано ефективність баєсівського класифікатора та класифікатора за найближчими сусідами для різних навчальних та тестових вибірок повідомлень. Показано існування підмножини груп новин, для яких використання аналізованих класифікаторів є ефективним.

Підвищення точності нейроподібних структур геометричних перетворень

Проаналізовано проблеми підвищення точності нейроподібних структур машини геометричних перетворень (МГП) під час розв’язання завдань передбачення в галузі інтелектуального аналізу даних (ІАД). Розроблений в статті метод передбачення на основі виділення головних компонент шляхом об’єднання вхідних тренувальних та тестових даних ілюструється прикладом.

Analytical Review of Data Lakes and Perspectives of Application in the Field of Education

An analytical review of the development of Data Lakes and its application in various industries, as part of Big data concept solutions, was conducted. The available standard architectural solutions for the Data Lake organization are considered. Also, specialized areas that require different or additional aspects to solve the tasks, depending on the field of Data Lake use, are taken into account. For the proper organization of Data Lake, various data processing tools are used, including distributed data storage systems, semantic networks, and especially metadata.

Some methods in software development recommendation systems

This article analyzes the current state of the models and methods of building recommendation systems. The basic classes of problems that solve the recommendation system are highlighted. The features of the method collaborative filtering are shown. Developed a method for calculating the similarity coefficients, taking into account the sparseness of ratings vectors of goods and people.

Групування тегів користувачів мікроблогів на основі решітки семантичних концептів

Запропоновано модель решітки семантичних концептів для аналізу тегів у повідомленнях, згрупованих за користувачами мікроблогів. Показано, що використання цієї моделі є ефективним під час аналізу груп ключових слів та виявлення асоціативних правил в повідомленнях мікроблогів.

Інтелектуальний аналіз даних

Розглянуто методи інтелектуального аналізу даних. Проаналізовано сферу застосу- вання інтелектуального аналізу даних та існуючі системи. Зроблено висновки стосовно перспектив використання методів інтелектуального аналізу даних.

Застосування засобів інтелектуального аналізу даних для прогнозування використання земельних ресурсів

This article describes the procedures of data mining based on prediction of time series for land cadastre data. Principles, required for the development of the method of forecasting using time series are examined. Mathematical model for serious prediction is developed. The task of prediction of land resources used in Striy District Lviv Region is technically realized.