ознака

Дослідження методів інтелектуального аналізу даних для класифікації незбалансованих наборів даних

Завдяки стрімкому розвитку інформаційних технологій, які широко використовуються у всіх сферах людського життя та діяльності, сьогодні накопичено надзвичайно великі обсяги даних. Відповідно застосування методів машинного навчання до цих даних дає змогу отримати нові практично корисні знання, які можуть бути використані для маркетингових, управлінських та дослідницьких цілей. Серед завдань інтелектуального аналізу даних – задачі регресії, прогнозування, кластеризації, класифікації та асоціативних правил. У цьому дослідженні розв’язано задачу бінарної класифікації.

ПРОБЛЕМА ЗБІЖНОСТІ ПРОЦЕДУРИ ПОБУДОВИ КЛАСИФІКАТОРІВ У СХЕМАХ ЛОГІЧНИХ І АЛГОРИТМІЧНИХ ДЕРЕВ КЛАСИФІКАЦІЇ

Розглядається проблема збіжності процедури синтезу схем класифікаторів у методах логічних і алгоритмічних дерев класифікації. Запропонована верхня оцінка складності схеми дерева алгоритмів у задачі апроксимації масиву реальних даних набором узагальнених ознак з фіксованим критерієм зупинки процедури розгалуження на етапі побудови дерева класифікації. Даний підхід дає змогу забезпечити необхідну точність моделі, оцінити її складність, знизити кількість розгалужень та досягти необхідних показників ефективності.

МЕТОД ОБМЕЖЕНИХ СТРУКТУР ЛОГІЧНИХ ДЕРЕВ У ЗАДАЧІ КЛАСИФІКАЦІЇ ДИСКРЕТНИХ ОБ'ЄКТІВ

Розглядається проблема побудови моделі логічних дерев класифікації на підставі обмеженого методу селекції елементарних ознак для масивів геологічних даних. Запропоновано метод апроксимації масиву реальних даних набором елементарних ознак з фіксованим критерієм зупинки процедури розгалуження на етапі побудови дерева класифікації. Даний підхід дає змогу забезпечити необхідну точність моделі, знизити її структурну складність та досягти необхідних показників ефективності.