Метод розпізнавання об’єктів на тепловізійних зображеннях

2026;
: cc. 213 - 229
ISSN: 2524-065Х (рrint); 2663-0001 (оnline)

https://doi.org/10.23939/sisn2026.19.213
Надіслано: Лютий 15, 2026
Прийнято: Квітень 22, 2026
1
Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж, Львів, Україна
ORCID: 0000–0002–7481–8628
2
Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж, Львів, Україна
ORCID: 0009–0006–3215–2086
3
Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж, Львів, Україна
ORCID: 0000–0002–0536–3252
4
Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж, Львів, Україна
ORCID: 0000-0002-8355-461X

У статті розв’язана задача підвищення точності автоматизованого виявлення об’єктів на тепловізійних зображеннях в умовах низького контрасту, шумів сенсора та структурної невиз-наченості місцевості. Актуальність дослідження зумовлена зростаючим використанням безпілотних літальних апаратів для моніторингу та розвідки, де тепловізійні системи є ключовим джерелом інформації в умовах обмеженої видимості. Стандартні архітектури згорткових нейронних мереж, зокрема детектори сімейства YOLO, демонструють високу швидкодію, однак їх ефективність зни-жується при роботі з інфрачервоними зображеннями через специфіку теплових сигнатур та наявність імпульсних шумів. У цій роботі запропоновано метод спектральної агрегації ознак на основі сингулярного розкладу матриць (SVD), інтегрований у механізм пулінгу нейронної мережі YOLOv8. На відміну від традиційних операцій Max Pooling та Average Pooling, розроблений SVD-пулінг виконує локальну спектральну фільтрацію карт ознак із виділенням найбільшої сингулярної компоненти, що відповідає структурно значущій частині сигналу. Такий підхід дозволяє ефективно пригнічувати високочастотний тепловий шум і зберігати просторові патерни об’єктів. Розроблено модифіковану архітектуру YOLOv8-EPB-Lite-SVD на базі EfficientNet-B0 та BiFPN із впровадженими модулями спектральної фільтрації. Проведено експериментальну верифікацію моделі на наборі тепловізійних зображень, отриманих з безпілотних платформ. Встановлено, що інтеграція SVD-пулінгу забезпечує підвищення метрики Precision до 0,881 та досягнення mAP@50 на рівні 0,852 при збереженні кількості параметрів моделі на рівні 4,56 млн. Отримані результати є статистично еквівалентними показникам «важких» архітектур із чотириразово більшою кількістю параметрів. Досліджено вплив точності обчислень на стабільність алгоритму. Показано, що використання повної точності (FP32) є критично необхідним для уникнення втрати значущості малих сингулярних чисел у режимі змішаної точності (FP16).

  1. Dash, Y., Gupta, V., Abraham, A., & Swati Chandna. (2025). Improving Object Detection in High-Altitude Infrared Thermal Images Using Magnitude-Based Pruning and Non-Maximum Suppression. Journal of Imaging, 11(3), 69. https://doi.org/10.3390/jimaging11030069
  2. Gupta, R., Jain, S., Kumar, M., & Kumar, M. (2025). An Enhanced Algorithm for Small Object Detection based on Thermal Imaging Using YOLOv8-EPB. Journal of Computer Science, 21(6), 1391–1403. https://doi.org/10.3844/jcssp.2025.1391.1403
  3. Han, K., Wang, Y., Tian, Q., Guo, J., Xu, C., & Xu, C. (2020). GhostNet: More Features From Cheap Operations. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 1577–1586. https://doi.org/10.1109/cvpr42600.2020.00165
  4. Howard, A., Sandler, M., Chen, B., Wang, W., Chen, L.-C., Tan, M., Chu, G., Vasudevan, V., Zhu, Y., Pang, R., Adam, H., & Le, Q. (2019). Searching for MobileNetV3. In Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 1314–1324. https://doi.org/10.1109/ICCV.2019.00140
  5. Li, C., Liang, X., Lu, Y., Zhao, N., & Tang, J. (2019). RGB-T object tracking: Benchmark and baseline. Pattern Recognition, 96, 106977. https://doi.org/10.1016/j.patcog.2019.106977
  6. Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., Killeen, T., Lin, Z., Gimelshein, N., Antiga, L., Desmaison, A., Köpf, A., Yang, E., DeVito, Z., Raison, M., Tejani, A., Chilamkurthy, S., Steiner, B., Fang, L., & Bai, J. (2019). PyTorch: An Imperative Style, High-Performance Deep Learning Library. In H. Wallach et al. (Eds.), Advances in Neural Information Processing Systems Vol. 32, 8024–8035. https://arxiv.org/abs/1912.01703
  7. Roboflow. (2023). HUV Termal dataset (Version 2) [Dataset]. Roboflow Universe. https://universe.roboflow.com/dersi/huv-termal/dataset/2
  8. Tan, M., & Le, Q. V. (2019). EfficientNet: Rethinking model scaling for convolutional neural networks. In Proceedings of the International Conference on Machine Learning (ICML), 6105–6114. https://proceedings.mlr.press/v97/tan19a.html
  9. Tan, M., & Le, Q. V. (2021). EfficientNetV2: Smaller models and faster training. In Proceedings of the International Conference on Machine Learning (ICML), 10096–10106. https://proceedings.mlr.press/v139/tan21a/tan21a.pdf
  10. Tan, M., Pang, R., & Le, Q. V. (2020). EfficientDet: Scalable and efficient object detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 10781–10790. https://openaccess.thecvf.com/content_CVPR_2020/papers/Tan_EfficientDet_...
  11. Tu M. D., Le K. T., & Phung M. D. (2024). Object Detection in Thermal Images Using Deep Learning for Unmanned Aerial Vehicles. 2024 IEEE/SICE International Symposium on System Integration (SII), Ha Long, Vietnam, 2024, 687-692. https://doi.org/10.1109/SII58957.2024.10417611
  12. Upadhyay, A., Sharma, M., Mukherjee, P., Singhal, A., & Lall, B. (2025). A comprehensive survey on synthetic infrared image synthesis. Infrared Physics & Technology, Vol. 147, 105745. https://doi.org/10.1016/j.infrared.2025.105745
  13. Üstün, İ. E., & Çiğla, C. (2025). The Power of Augmentations in IR Object Detection. 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 6593–6602. https://doi.org/10.1109/cvprw67362.2025.00656
  14. Wang, C.-Y., Alexey Bochkovskiy, & Hong-Yuan Mark Liao. (2023). YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors, 7464–7475. https://doi.org/10.1109/cvpr52729.2023.00721
  15. Wang, C.-Y., Mark Liao, H.-Y., Wu, Y.-H., Chen, P.-Y., Hsieh, J.-W., & Yeh, I-Hau. (2020). CSPNet: A New Backbone that can Enhance Learning Capability of CNN. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 1571–1580. https://doi.org/10.1109/cvprw50498.2020.00203
  16. Wang, X., Sheng, Y., Hao, Q., Hou, H., & Nie, S. (2025). YOLO-HVS: Infrared Small Target Detection Inspired by the Human Visual System. Biomimetics, 10(7), 451. https://doi.org/10.3390/biomimetics10070451
  17. Xue, C., Xia, Y., Wu, M., Chen, Z., Cheng, F., & Yun, L. (2024). EL-YOLO: An efficient and lightweight low-altitude aerial objects detector for onboard applications. Expert Systems with Applications, 256, 124848. https://doi.org/10.1016/j.eswa.2024.124848