Інформаційна система напівконтрольованого навчання для аналізу вибірок даних з високою розмірністю

2024;
: cc. 133 - 144
1
Харківський національний університет радіоелектроніки, кафедра системотехніки
2
Харківський національний університет радіоелектроніки, кафедра системотехніки
3
Харківський національний університет радіоелектроніки, кафедра системотехніки

Дослідження великих обсягів даних для виявлення прихованих закономірностей і тенденцій стає дедалі важливішим і кориснішим у останні роки. Ці великі обсяги даних характеризуються широкою доступністю, складністю структур і значним обсягом інформації.
Ця стаття пропонує детальний опис інформаційної системи напівконтрольованого навчання для аналізу вибірок даних з високою розмірністю. Система розроблена з метою опрацювання великих обсягів даних та використовує методи напівконтрольованого навчання для ефективного аналізу та класифікації. Для цього було проаналізовано існуючі інформаційні системи, які здатні працювати з вибірками даних, які мають високу розмірність, а також методи, що ефективно проводять аналіз та класифікацію цих вибірок даних.
В статті детально описано архітектуру системи, включаючи методи обробки даних, вибір ознак, модулі передпроцесінгу та методи оптимізації навчання.

  1. Xu, L., Abidi, S.R. (2019) Intelligent health data analytics: A convergence of artificial intel- ligence and big data. Healthcare Management Forum 32(4), 178–182. https://doi.org/doi.org/10.1177/0840470419846134.
  2. Wang, X., & Calvanese, D. (2021, July). Editorial for Special Issue of Journal of Big Data Research on “Big Data Meets Knowledge Graphs.” Big Data Research, 25, 202–215. https://doi.org/10.1016/j.bdr.2021.100215.
  3. Philip Chen, C., & Han, R. (2022, June). Graph-based sparse bayesian broad learning system for semi- supervised learning. Information Sciences, 597, 193–210. https://doi.org/10.1016/j.ins.2022.03.037.
  4. Tran, Q. T., Alom, M. Z., & Orr, B. A. (2022, June 8). Comprehensive study of semi-supervised learning for DNA methylation-based supervised classification of central nervous system tumors. BMC Bioinformatics, 23(1), 313-319. https://doi.org/10.1186/s12859-022-04764-1.
  5. Yadav, S. K., & S., V. (2019, April 30). EEG Classification using Semi Supervised Learning. International Journal of Trend in Scientific Research and Development, Volume-3(Issue-3), 1441–1445. https://doi.org/10.31142/ijtsrd23355.
  6. Nasrabadi, N. M. (2007). Pattern Recognition and Machine Learning. Journal of Electronic Imaging, 16(4), 172–178. https://doi.org/10.1117/1.2819119
  7. Nazirova, T. O., & Kostenko, O. B. (2018, October 25). Нейрономережева інформаційна технологія опрацювання медичних даних. Scientific Bulletin of UNFU, 28(8), 141–145. https://doi.org/10.15421/40280828.
  8. Lyrchykov, V. O., & Baybuz, O. H. (2022, December 25). Технологія видобутку даних про ризики захворювання на основі аналізу електронних медичних карток. Actual Problems of Automation and Information Technology, 26(1), 118–129. https://doi.org/10.15421/432208.
  9. Nazirova, T. O., & Kostenko, O. B. (2018, October 25). Нейрономережева інформаційна технологія опрацювання медичних даних. Scientific Bulletin of UNFU, 28(8), 141–145. https://doi.org/10.15421/40280828.
  10. Ключко. (2020, July 13). Електронні інформаційні системи в медицині та в біології: загальний аналіз. Medical Informatics and Engineering, 2, 111–123. https://doi.org/10.11603/mie.1996-1960.2020.2.11183.
  11. Гумен, & Рачек. (2023, December 26). Нейронні мережі та машинне навчання у обробці даних для прогнозування космічної погоди. Applied Questions of Mathematical Modeling, 6(2), 19–23. https://doi.org/10.32782/mathematical-modelling/2023-6-2-2.