У статті наведено дослідження застосування сучасних методів машинного навчання для задачі передиктивного технічного обслуговування на основі відкритого датасету AI4I Predictive Maintenance. Основні цілі роботи – побудова та порівняння моделей бінарної та багатокласової класифікації, що дають змогу передбачати як сам факт відмови обладнання, так і конкретний тип поломки. Враховуючи високий дисбаланс даних (частка відмов становить близько 3 %), було реалізовано підхід cost-sensitive оптимізації, за яким пропуск реальної відмови оцінюють як значно критичніший за хибну тривогу.
Для побудови моделей використано алгоритми Logistic Regression, Random Forest, XGBoost та LightGBM. Особливу увагу приділено ансамблевим методам градієнтного бустингу. Під час дослідження здійснено попереднє опрацювання даних, із масштабуванням числових ознак та інженерією нових ознак (Power, DeltaTemp, індикатор високого зношування інструменту). Для оцінювання якості моделей у бінарній класифікації використано метрику PR-AUC та показник Recall@Precision≥0,90, найрелевантніші в умовах критично важливих систем. У багатокласовій постановці застосовано confusion matrix та макроусереднені значення precision, recall та F1-score.
Як свідчать результати, серед базових моделей найкраще себе проявив XGBoost із PR-AUC = 0,64, а після гіперпараметричної оптимізації значення зросло до понад 0,90, що свідчить про високу здатність алгоритму виявляти потенційні відмови. У багатокласовій класифікації XGBoost також продемонстрував найвищу збалансованість між класами, тоді як LightGBM стикався із проблемами відсутності подальших сплітів за жорстких обмежень параметрів. Аналіз важливості ознак за допомогою SHAP-значень підтвердив ключову роль показників Tool wear, Power та Rotational speed у прогнозуванні.
Практична значущість дослідження полягає у можливості впровадження розроблених моделей у системи моніторингу обладнання для раннього виявлення ризиків та мінімізації економічних втрат. Робота демонструє ефективність поєднання cost-sensitive оптимізації та ансамблевих методів у сфері predictive maintenance та закладає основу для подальших досліджень, зокрема інтеграції time-to-failure прогнозування та глибоких нейронних мереж.
1. Ahmed, N., Aljahdali, H. M., & Siddiqui, M. H. (2021). Predictive maintenance using machine learning for industrial machinery: A survey. Journal of King Saud University – Computer and Information Sciences, 33(10), 1189-1201. https://doi.org/10.1016/j.jksuci.2021.01.007
2. Zonta, T., da Costa, C. A., da Rosa Righi, R., de Lima, M. J., da Trindade, E. S., & Li, G. P. (2020). Predictive maintenance in the Industry 4.0: A systematic literature review. Computers & Industrial Engineering, 150, 106889. https://doi.org/10.1016/ j.cie.2020.106889
3. Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785-794). ACM. https://doi.org/10.1145/ 2939672. 2939785
4. Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T. Y. (2017). LightGBM: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30, 3146-3154. https://papers.nips.cc/ paper/2017/hash/6449f44a102fde848669bdd9eb6b76fa-Abstract.html
5. Haque, M. A., Hasan, M. K., Islam, S., & Alhumyani, H. (2022). Handling imbalanced data in machine learning: A survey. Knowledge-Based Systems, 248, 108759. https://doi.org/10.1016/j.knosys.2022.108759
6. Lundberg, S. M., & Lee, S. I. (2017). A unified approach to interpreting model predictions. In Proceedings of the 31st International Conference on Neural Information Processing Systems (pp. 4765-4774). Curran Associates Inc. https://doi.org/10.48550/arXiv.1705.07874
7. Zhang, H., Zhao, R., Wang, J., & Li, X. (2023). Multi-failure mode prediction in predictive maintenance: A deep learning approach. Reliability Engineering & System Safety, 232, 109032. https://doi.org/10.1016/j.ress.2023.109032
8. Carvalho, T. P., Soares, F. A. A. M. N., Vita, R., Francisco, R. P., Basto, J. P., & Alcalá, S. G. S. (2019). A systematic literature review of machine learning methods applied to predictive maintenance. Computers & Industrial Engineering, 137, 106024. https://doi.org/10.1016/j.cie.2019.106024
9. Zhang, C., Xu, X., Wang, J., & Zhong, R. Y. (2022). Data-driven predictive maintenance for complex equipment: A review. Engineering Applications of Artificial Intelligence, 109, 104653. https://doi.org/10.1016/j.engappai.2021.104653
[10] Tuli, S., Casale, G., & Jennings, N. R. (2022). TranAD: Deep transformer networks for anomaly detection in multivariate time series data. Proceedings of the VLDB Endowment, 15(6), 1201-1214. https://doi.org/10.14778/3514061.3514067