У статті розв’язана задача підвищення точності автоматизованого виявлення об’єктів на тепловізійних зображеннях в умовах низького контрасту, шумів сенсора та структурної невиз-наченості місцевості. Актуальність дослідження зумовлена зростаючим використанням безпілотних літальних апаратів для моніторингу та розвідки, де тепловізійні системи є ключовим джерелом інформації в умовах обмеженої видимості. Стандартні архітектури згорткових нейронних мереж, зокрема детектори сімейства YOLO, демонструють високу швидкодію, однак їх ефективність зни-жується при роботі з інфрачервоними зображеннями через специфіку теплових сигнатур та наявність імпульсних шумів. У цій роботі запропоновано метод спектральної агрегації ознак на основі сингулярного розкладу матриць (SVD), інтегрований у механізм пулінгу нейронної мережі YOLOv8. На відміну від традиційних операцій Max Pooling та Average Pooling, розроблений SVD-пулінг виконує локальну спектральну фільтрацію карт ознак із виділенням найбільшої сингулярної компоненти, що відповідає структурно значущій частині сигналу. Такий підхід дозволяє ефективно пригнічувати високочастотний тепловий шум і зберігати просторові патерни об’єктів. Розроблено модифіковану архітектуру YOLOv8-EPB-Lite-SVD на базі EfficientNet-B0 та BiFPN із впровадженими модулями спектральної фільтрації. Проведено експериментальну верифікацію моделі на наборі тепловізійних зображень, отриманих з безпілотних платформ. Встановлено, що інтеграція SVD-пулінгу забезпечує підвищення метрики Precision до 0,881 та досягнення mAP@50 на рівні 0,852 при збереженні кількості параметрів моделі на рівні 4,56 млн. Отримані результати є статистично еквівалентними показникам «важких» архітектур із чотириразово більшою кількістю параметрів. Досліджено вплив точності обчислень на стабільність алгоритму. Показано, що використання повної точності (FP32) є критично необхідним для уникнення втрати значущості малих сингулярних чисел у режимі змішаної точності (FP16).
- Dash, Y., Gupta, V., Abraham, A., & Swati Chandna. (2025). Improving Object Detection in High-Altitude Infrared Thermal Images Using Magnitude-Based Pruning and Non-Maximum Suppression. Journal of Imaging, 11(3), 69. https://doi.org/10.3390/jimaging11030069
- Gupta, R., Jain, S., Kumar, M., & Kumar, M. (2025). An Enhanced Algorithm for Small Object Detection based on Thermal Imaging Using YOLOv8-EPB. Journal of Computer Science, 21(6), 1391–1403. https://doi.org/10.3844/jcssp.2025.1391.1403
- Han, K., Wang, Y., Tian, Q., Guo, J., Xu, C., & Xu, C. (2020). GhostNet: More Features From Cheap Operations. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 1577–1586. https://doi.org/10.1109/cvpr42600.2020.00165
- Howard, A., Sandler, M., Chen, B., Wang, W., Chen, L.-C., Tan, M., Chu, G., Vasudevan, V., Zhu, Y., Pang, R., Adam, H., & Le, Q. (2019). Searching for MobileNetV3. In Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 1314–1324. https://doi.org/10.1109/ICCV.2019.00140
- Li, C., Liang, X., Lu, Y., Zhao, N., & Tang, J. (2019). RGB-T object tracking: Benchmark and baseline. Pattern Recognition, 96, 106977. https://doi.org/10.1016/j.patcog.2019.106977
- Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., Killeen, T., Lin, Z., Gimelshein, N., Antiga, L., Desmaison, A., Köpf, A., Yang, E., DeVito, Z., Raison, M., Tejani, A., Chilamkurthy, S., Steiner, B., Fang, L., & Bai, J. (2019). PyTorch: An Imperative Style, High-Performance Deep Learning Library. In H. Wallach et al. (Eds.), Advances in Neural Information Processing Systems Vol. 32, 8024–8035. https://arxiv.org/abs/1912.01703
- Roboflow. (2023). HUV Termal dataset (Version 2) [Dataset]. Roboflow Universe. https://universe.roboflow.com/dersi/huv-termal/dataset/2
- Tan, M., & Le, Q. V. (2019). EfficientNet: Rethinking model scaling for convolutional neural networks. In Proceedings of the International Conference on Machine Learning (ICML), 6105–6114. https://proceedings.mlr.press/v97/tan19a.html
- Tan, M., & Le, Q. V. (2021). EfficientNetV2: Smaller models and faster training. In Proceedings of the International Conference on Machine Learning (ICML), 10096–10106. https://proceedings.mlr.press/v139/tan21a/tan21a.pdf
- Tan, M., Pang, R., & Le, Q. V. (2020). EfficientDet: Scalable and efficient object detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 10781–10790. https://openaccess.thecvf.com/content_CVPR_2020/papers/Tan_EfficientDet_...
- Tu M. D., Le K. T., & Phung M. D. (2024). Object Detection in Thermal Images Using Deep Learning for Unmanned Aerial Vehicles. 2024 IEEE/SICE International Symposium on System Integration (SII), Ha Long, Vietnam, 2024, 687-692. https://doi.org/10.1109/SII58957.2024.10417611
- Upadhyay, A., Sharma, M., Mukherjee, P., Singhal, A., & Lall, B. (2025). A comprehensive survey on synthetic infrared image synthesis. Infrared Physics & Technology, Vol. 147, 105745. https://doi.org/10.1016/j.infrared.2025.105745
- Üstün, İ. E., & Çiğla, C. (2025). The Power of Augmentations in IR Object Detection. 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 6593–6602. https://doi.org/10.1109/cvprw67362.2025.00656
- Wang, C.-Y., Alexey Bochkovskiy, & Hong-Yuan Mark Liao. (2023). YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors, 7464–7475. https://doi.org/10.1109/cvpr52729.2023.00721
- Wang, C.-Y., Mark Liao, H.-Y., Wu, Y.-H., Chen, P.-Y., Hsieh, J.-W., & Yeh, I-Hau. (2020). CSPNet: A New Backbone that can Enhance Learning Capability of CNN. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 1571–1580. https://doi.org/10.1109/cvprw50498.2020.00203
- Wang, X., Sheng, Y., Hao, Q., Hou, H., & Nie, S. (2025). YOLO-HVS: Infrared Small Target Detection Inspired by the Human Visual System. Biomimetics, 10(7), 451. https://doi.org/10.3390/biomimetics10070451
- Xue, C., Xia, Y., Wu, M., Chen, Z., Cheng, F., & Yun, L. (2024). EL-YOLO: An efficient and lightweight low-altitude aerial objects detector for onboard applications. Expert Systems with Applications, 256, 124848. https://doi.org/10.1016/j.eswa.2024.124848