КОНСТРУЮВАННЯ ОЗНАК ДЛЯ ЗАСТОСУВАННЯ НАВЧАННЯ МАШИН ПРИ ОБРОБЦІ КЛІНІЧНИХ ДАНИХ

O. Kyrsanov; S. Krivenko

У цій статті представлено дослідження створення ознак для застосування машинного навчання (ML) при обробці клінічних даних, зосереджуючись на бінарній класифікації даних часових рядів. Дослідження демонструє ефективність використання перетворення Хаара для підвищення значущості ознак і покращення ефективності класифікації. Перетворення Хаара дозволяє підвищити точність прогнозування за рахунок збільшення ваги важливих параметрів, що особливо важливо при обробці складних клінічних даних. Результати дослідження показують значне збільшення площі під кривою робочих характеристик приймача (AUC-ROC) з 0,44 для базової моделі до 0,82 для моделі з перетворенням Хаара, що вказує на значні покращення в точності прогнозування. Методологія, описана в статті, охоплює різні етапи, включаючи попередню обробку даних, навчання моделі за допомогою алгоритму XGBoost та оцінку продуктивності за допомогою кривих AUC-ROC. Попередня обробка включає очищення та нормалізацію даних, що є важливими кроками для забезпечення високої якості результатів машинного навчання. Особливу увагу приділено використанню даних Інтернету речей (IoT) у клінічних умовах, що відкриває нові можливості для прогнозної аналітики та прийняття рішень у сфері охорони здоров'я. Підходи, описані в статті, можуть бути застосовані для аналізу великої кількості інформації, зібраної з різних медичних пристроїв, підключених до мережі IoT. Це дозволяє отримати більш точні прогнози і приймати обґрунтовані рішення на основі реальних даних, що сприяє покращенню якості медичних послуг і підвищенню рівня догляду за пацієнтами. Результати дослідження підкреслюють потенціал методів машинного навчання в закладах охорони здоров'я для підвищення точності прогнозів і прийняття рішень. Майбутні напрямки досліджень можуть передбачати вивчення додаткових методів розробки ознак і використання передових алгоритмів машинного навчання для подальшого підвищення корисності клінічної аналітики даних IoT. Зокрема, вивчення можливостей глибокого навчання і нейронних мереж може відкрити нові горизонти для аналізу і обробки клінічних даних.

Машинне навчання (ML); клінічний Інтернет речей; перетворення Хаара; штучний інтелект; AUC-ROC

[1] T. Thompson, "P2933 - Standard for Clinical Internet of Things (IoT) Data and Device Interoperability with TIPPSS - Trust, Identity, Privacy, Protection, Safety, Security," IEEE EMBC, 21 05 2019. [Online]. Available: https://standards.ieee.org/project/2933.html.

[2] M. Saqib, Y. Sha and M. D. Wang, "Early Prediction of Sepsis in EMR Records Using Traditional ML Techniques and Deep Learning LSTM Networks," 2018 40th Annual International Conference of the IEEE EMBC, 2018, pp. 4038-4041.

[3] K. Järvinen, "Voice Activity Detector (VAD) for Enhanced Full Rate (EFR) speech traffic channels," 21 07 2020. [Online]. Available: https://portal.3gpp.org/...2753. [Accessed 16 12 2024].

[4] V. M. Bezruk, S. A. Krivenko, M. B. Samochernov, L. S. Kryvenko and S. S. Krivenko, "Model Discrete Wavelet Transform for Clinical IoT Data and Device Interoperability," 2022 IEEE 16th International Conference on Advanced Trends in Radioelectronics, Telecommunications and Computer Engineering (TCSET), Lviv-Slavske, Ukraine, 2022, pp. 64-69, doi:10.1109/TCSET55632.2022.9767044.

[5] [K. Järvinen, "Test sequences for the GSM Enhanced Full Rate (EFR) speech codec," 08 04 2022. [Online].

[6] [K. Järvinen, "Enhanced Full Rate (EFR) speech transcoding," 08 04 2022. [Online]. Available: https://portal.3gpp.org//....2748. [Accessed 14 02 2024].

[7] K. Järvinen, "ANSI-C code for the GSM Enhanced Full Rate (EFR) speech codec," 08 04 2022. [Online].

[8] Pulavskyi A., Krivenko S., Krivenko S. “The computation of line spectral frequencies using discrete wavelet transform for electrocardiograms processing”, IEEE 36th International Conference on ELNANO, 2016, pp. 202-205.