Системам розпізнавання об’єктів часто важко підтримувати точність у динамічних середовищах через такі проблеми, як варіації освітлення, оклюзії та обмежені навчальні дані. Традиційні згорточні нейронні мережі (CNN) вимагають великих маркованих наборів даних і не здатні адаптуватися до нових умов. Це дослідження спрямоване на розробку адаптивної системи розпізнавання об’єктів, яка покращує узагальнення моделі та швидку адаптацію в мінливих середовищах. Використовуючи методи метанавчання, зокрема Model-Agnostic Meta-Learning (MAML), дослідження зосереджено на покращенні продуктивності розпізнавання з мінімальними навчальними даними. Методологія передбачає інтеграцію MAML з різними архітектурами CNN, включаючи ResNet, EfficientNet і MobileNet. Було проведено ряд експериментів, щоб оцінити адаптивність моделі, точність класифікації та ефективність обчислень у різних умовах. Такі показники продуктивності, як точність і час відгуку, виміряли шляхом порівняння традиційних CNN з їхніми аналогами з розширеним метанавчанням. Результати демонструють, що включення метанавчання значно покращує точність розпізнавання об’єктів. Наприклад, моделі ResNet продемонстрували підвищення точності з 78,5% до 87,2% у поєднанні з MAML, тоді як EfficientNet продемонструвала покращену продуктивність зі зниженими обчислювальними витратами. Результати підтверджують ефективність метанавчання у покращенні адаптивності без потреби у тривалій перенавчанні. Новизна цього дослідження полягає в систематичній інтеграції метанавчання з CNN, оптимізуючи розпізнавання об’єктів для динамічних сценаріїв реального світу. На відміну від звичайних моделей, запропонований підхід забезпечує швидку адаптацію з обмеженими даними, що робить його дуже придатним для програм реального часу. Практична цінність цього дослідження поширюється на розгортання систем розпізнавання об’єктів на пристроях з обмеженими ресурсами, таких як периферійне апаратне забезпечення ШІ та мобільні платформи. Поєднання метанавчання та полегшеної архітектури CNN забезпечує як високу точність, так і ефективність обчислень, що робить його застосовним у таких сферах, як автономні системи, відеоспостереження та робототехніка. Майбутні дослідження будуть зосереджені на вдосконаленні методів оптимізації метанавчання, покращенні ефективності навчання та розширенні підходу до більш складних завдань розпізнавання об’єктів у середовищах відстеження кількох об’єктів у реальному часі.
[1] N. Dalal and B. Triggs, "Histograms of oriented gradients for human detection," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), San Diego, CA, USA, 2005, pp. 886-893 vol. 1, https://doi.org/10.1109/CVPR.2005.177.
[2] R. Q. Lu, Y. Xu and R. D. Zhang, "A new design of model predictive tracking control for networked control system under random packet loss and uncertainties", IEEE Trans. Ind. Electron., vol. 63, no. 11, pp. 6999-7007, Nov.
[3] He, Kaiming & Zhang, Xiangyu & Ren, Shaoqing & Sun, Jian. (2016). Deep Residual Learning for Image Recognition. 770-778. https://doi.org/10.1109/CVPR.2016.90.
[4] Deng, Jia & Dong, Wei & Socher, Richard & Li, Li-Jia & Li, Kai & Li, Fei-Fei. (2009). ImageNet: a Large-Scale Hierarchical Image Database. IEEE Conference on Computer Vision and Pattern Recognition. 248-255. https://doi.org/10.1109/CVPR.2009.5206848.
[5] A. Younesi, M. Ansari, M. Fazli, A. Ejlali, M. Shafique and J. Henkel, "A Comprehensive Survey of Convolutions in Deep Learning: Applications, Challenges, and Future Trends," in IEEE Access, vol. 12, pp. 41180-41218, 2024, https://doi.org/10.1109/ACCESS.2024.3376441.
[6] J. Shi, A. Chan and G. Bertasius, "Egocentric Basketball Motion Planning from a Single First-Person Image," 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018, pp. 5889-5898, https://doi.org/10.1109/CVPR.2018.00617.
[7] Rodrigo, Marcos & Cuevas, Carlos & García, Narciso. (2024). Comprehensive comparison between vision transformers and convolutional neural networks for face recognition tasks. Scientific Reports. 14. https://doi.org/10.1038/s41598-024-72254-w.
[8] Kachouane, M., et al. "HOG based fast human detection." 2012 24th International Conference on Microelectronics (ICM). IEEE, 2012.
[9] D. J. Li and D. P. Li, "Adaptive tracking control for nonlinear time-varying delay systems with full state constraints and unknown control coefficients", Automatica, vol. 93, pp. 444-453, Jul. 2018.
[10] N. Perwaiz, M. Shahzad and M. M. Fraz, "Unveiling the Potential of Vision Transformer Architecture for Person Re-identification," 2022 24th International Multitopic Conference (INMIC), Islamabad, Pakistan, 2022, pp. 1-6, https://doi.org/10.1109/INMIC56986.2022.9972908.
[11] L. Liu, Y. -J. Liu and S. Tong, "Neural Networks-Based Adaptive Finite-Time Fault-Tolerant Control for a Class of Strict-Feedback Switched Nonlinear Systems," in IEEE Transactions on Cybernetics, vol. 49, no. 7, pp. 2536-2545, July 2019, https://doi.org/10.1109/TCYB.2018.2828308.
[12] Y. M. Li and S. C. Tong, "Adaptive fuzzy output constrained control design for multi-input multioutput stochastic nonstrict-feedback nonlinear systems", IEEE Trans. Cybern., vol. 47, no. 12, pp. 4086-4095, Dec. 2017.
[13] L. Tang, Y. J. Liu and C. L. P. Chen, "Adaptive critic design for pure-feedback discrete-time MIMO systems preceded by unknown backlashlike hysteresis", IEEE Trans. Neural Netw. Learn. Syst..
[14] Z. Wang, R. Q. Lu, F. R. Gao and D. R. Liu, "An indirect data-driven method for trajectory tracking control of a class of nonlinear discrete-time systems", IEEE Trans. Ind. Electron., vol. 65, no. 5, pp. 4121-4129, May 2017.
[15] L. Liu, Y.-J. Liu and C. L. P. Chen, "Adaptive neural network control for a DC motor system with dead-zone", Nonlin. Dyn., vol. 72, no. 1, pp. 141-147, 2013.
[16] Y. M. Li, S. Sui and S. C. Tong, "Adaptive fuzzy control design for stochastic nonlinear switched systems with arbitrary switchings and unmodeled dynamics", IEEE Trans. Cybern., vol. 47, no. 2, pp. 403-414, Feb. 2017.
[17] Z. W. Gao, X. X. Liu and M. Z. Q. Chen, "Unknown input observer-based robust fault estimation for systems corrupted by partially decoupled disturbances", IEEE Trans. Ind. Electron., vol. 63, no. 4, pp. 2537-2547, Apr. 2016.
[18] X. Huang, X. Liu, G. Wang and M. Su, "A Robust Image Hashing with Enhanced Randomness by Using Random Walk on Zigzag Blocking," 2016 IEEE Trustcom/BigDataSE/ISPA, Tianjin, China, 2016, pp. 14-18, https://doi.org/10.1109/TrustCom.2016.0040
[19] J. Chen, Z. Liu and X. Fu, "A Sensitivity Analysis Method of Physiological Signals for Assessing Pilot Workload," 2020 IEEE 16th International Conference on Control & Automation (ICCA), Singapore, 2020, pp. 737-742, https://doi.org/10.1109/ICCA51439.2020.9264315.