ДОСЛІДЖЕННЯ ТА ПРОГРАМНА РЕАЛІЗАЦІЯ МЕТОДІВ РОЗПІЗНАВАННЯ ЖЕСТІВ РУК

Надіслано: Серпень 08, 2025
Переглянуто: Серпень 18, 2025
Прийнято: Вересень 15, 2025
1
Національний університет Львівська політехніка
2
Національний університет Львівська політехніка
3
Національний університет Львівська політехніка
4
Національний університет Львівська політехніка

У статті представлено розробку інтерактивної системи розпізнавання та класифікації жестів рук людини на основі технологій машинного навчання. Запропоновано новий підхід до подання жестів, який поєднує просторові і часові характеристики розташування ключових точок руки, що забезпечує високу точність, стійкість до шумів та адаптивність системи до різних умов використання. Особливістю розробки є метод інтерактивного навчання, який дає змогу користувачам без спеціальних технічних знань швидко додавати нові жести за обмеженої кількості навчальних даних. Проведено серію експериментів, у ході яких було протестовано різні стратегії машинного навчання, що дало змогу виявити оптимальні моделі та підтвердити ефективність запропонованого підходу. Розроблена система легко інтегрується у сучасні інтерфейси людино-комп’ютерної взаємодії та може застосовуватися у сфері віртуальної й доповненої реальності, медичних технологіях, освітніх системах і безконтактних сервісах управління. Отримані результати відкривають перспективи для подальшого вдосконалення системи, зокрема підвищення швидкодії, масштабованості та персоналізації під потреби користувачів.

[1] M. Linardakis, I. Varlamis, і G. Th. Papadopoulos, “Survey on Hand Gesture Recognition from Visual Input,” arXiv preprint arXiv:2501.11992, 2025.

[2] H. Hakim, D. Darmawan, і H. A. Nugroho, “Dynamic Hand Gesture Recognition Using 3D-CNN and LSTM,” у Proc. Int. Conf. on Advanced Computer Science and Information Systems (ICACSIS), 2019, сс. 93–98.

[3] Y. Liu, F. Wang, і J. Chen, “Spatio-Temporal Dynamic Attention Graph Convolutional Network for Skeleton-based Gesture Recognition,” Pattern Recognition Letters, vol. 178, сс. 85–92, 2024.

[4] A. Sultana, “A Systematic Review on sEMG-based Hand Gesture Recognition Using Deep Learning Methods,” Bioengineering, vol. 10, no. 3, сс. 225–239, 2023. https://doi.org/10.3390/bioengineering10030225

[5] K. Zhang, Y. Zhao, і L. Huang, “MuViH: A Multi-View Hand Gesture Dataset for Robust Recognition,” IEEE Access, vol. 13, сс. 45012–45025, 2025. https://doi.org/10.1109/ACCESS.2025.102957

[6] Zhang F., Bazarevsky V., Vakunov A., et al. MediaPipe Hands: On-device Real-time Hand Tracking. arXiv preprint arXiv:2006.10214, 2020.

[7] Chang W., Hsu F., Cherng S. Deep Learning Recognition Method for Hand Gestures. Applied Sciences, 2021, 11(6), 2735.

[8] Wang Y., Lin Z., Liang X., et al. GestureRecognizer: A Toolbox for Gesture Recognition Built with Temporal Convolution Networks. In Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems, 2019, pp. 1-4.

[9] Li Y., Sun X., Zhang Y., et al. Human-computer interaction using dynamic hand gestures based on deep learning. Information Sciences, 2021, 545, pp. 713-730.

[10] Pomorova O.V., Hovorushchenko T.O. Intelektualnyi analiz ta obrobka danykh. Khmelnytskyi: KhNU, 2018. 236 s.

[11] MediaPipe - ofitsiinyi sait biblioteky dlia rozpiznavannia obiektiv. [Elektronnyi resurs]. – Rezhym dostupu: https://developers.google.com/mediapipe

[12] TensorFlow - ofitsiina dokumentatsiia freimvorku dlia mashynnoho navchannia. [Elektronnyi resurs]. – Rezhym dostupu: https://www.tensorflow.org/api_docs

[13] OpenCV - biblioteka kompiuternoho zoru z vidkrytym kodom. [Elektronnyi resurs]. – Rezhym dostupu: https://opencv.org/

[14] Scikit-learn - biblioteka mashynnoho navchannia dlia Python. [Elektronnyi resurs]. – Rezhym dostupu: https://scikit-learn.org/

[15] PyTorch - biblioteka dlia mashynnoho navchannia z vidkrytym kodom. [Elektronnyi resurs]. – Rezhym dostupu: https://pytorch.org/

[16] Molchanov P., Yang X., Gupta S., et al. Online Detection and Classification of Dynamic Hand Gestures with Recurrent 3D Convolutional Neural Networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp. 4207-4215.

[17] GitHub repozytorii proiektu MediaPipe. [Elektronnyi resurs]. – Rezhym dostupu: https://github.com/google/mediapipe

[18] Kaggle - dataset zhestiv ruk dlia mashynnoho navchannia. [Elektronnyi resurs]. – Rezhym dostupu: https://www.kaggle.com/datasets/gti-upm/leapgestrecog

[19] NumPy - biblioteka dlia naukovykh obchyslen u Python. [Elektronnyi resurs]. – Rezhym dostupu: https://numpy.org/

[20] Martynenko S.S., Kot T.M. Metody rozpiznavannia dynamichnykh zhestiv dlia keruvannia interfeisamy. Systemy obrobky informatsii, 2019, 2(157), s. 74-82.

[21] Python Software Foundation - ofitsiinyi sait movy prohramuvannia Python. [Elektronnyi resurs]. – Rezhym dostupu: https://www.python.org/

[22]  Natsionalna biblioteka Ukrainy imeni V.I. Vernadskoho - elektronnyi arkhiv naukovykh publikatsii. [Elektronnyi resurs]. – Rezhym dostupu: http://www.nbuv.gov.ua/

[23] Stack Overflow - forum dlia rozrobnykiv prohramnoho zabezpechennia. [Elektronnyi resurs]. – Rezhym dostupu: https://stackoverflow.com/

[24] Kharchenko V.S., Yakovlev S.V. Metody mashynnoho navchannia dlia kiberfizychnykh system: analiz ta perspektyvy. Radioelektronni i kompiuterni systemy, 2020, 1(93), s. 24-36.

[25] Real Python - Resurs dlia vyvchennia Python ta yoho zastosuvannia v realnykh proiektakh. [Elektronnyi resurs]. – Rezhym dostupu: https://realpython.com/

[26] GitLab - platforma dlia rozrobky prohramnoho zabezpechennia. [Elektronnyi resurs]. – Rezhym dostupu: https://about.gitlab.com/

[27] W3Schools - Resurs dlia vyvchennia veb-tekhnolohii. [Elektronnyi resurs]. – Rezhym dostupu: https://www.w3schools.com/