Application of Pseudorandom Number Generators in Machine Learning

2025;
: pp. 79 - 90
1
Lviv Polytechnic National University, 1Department of Information Protection
2
Lviv Polytechnic National University, кафедра безпеки інформаційних технологій
3
Lviv Polytechnic National University, Department of Information Technology Security

The paper analyzes the role of pseudorandom number generators in ensuring the efficiency and stability of machine learning algorithms. The key areas and forms of such application are identified.
Particular attention is paid to the impact of the quality of PRNGs on the performance of models, in particular in the tasks of initializing neural networks, synthetic data augmentation, stochastic optimization, and reproducibility of results. The problems of periodicity, predictability, and low adaptability of generators to specific ML tasks are considered. Modern approaches to assessing the quality of PRNGs, including empirical, theoretical, and applied tests, are analyzed. The study also highlights the prospects of using deep learning to analyze PRNGs and identify patterns in pseudo- random sequences.
Recommendations for improving the efficiency of machine learning systems by optimizing the use of PRNGs are proposed. The results of the study contribute to a deeper understanding of the role of PRNGs in modern machine learning and identify new directions for improving model performance.

  1. Gnatyuk S., Burmak Y., Berdibayev R., Aleksander M., Ospanova D. Метод побудови генераторів псевдовипадкових послідовностей для криптографічних  застосувань у  5G  мережах. Електронне фахове наукове  видання  “Кібербезпека:  освіта,  наука,  техніка”.  Червень  2021.  Вип.  4,  Вип.  12.  С.  151-62.  DOI:   10.28925/2663-4023.2021.12.151162.
  2. Гарасимчук О. І., Максимович В. М. Генератори псевдовипадкових чисел, їх застосування, класифікація, основні методи побудови і оцінка якості. Захист інформації. 2002. 5(3 (16)). С. 29-36.
  3. Хомік   М.   А.,   Гарасимчук   О.   І.   Застосування   генераторів   псевдовипадкових   чисел   та послідовностей в кібербезпеці, методи їх побудови та оцінки якості. Захист інформації. Липень-вересень2023. Т. 25. № 3. DOI: 10.18372/2410-7840.25.17940.
  4. Поперешняк С. В. Застосування генератора псевдовипадкових чисел для підвищення ефективності технології smart dust в управлінні розумним будинком. Телекомунікаційні та інформаційні технології. 2022. № 4 (77). DOI: 10.31673/2412-4338.2022.045362.
  5. Orúe A. B., Hernández Encinas L., Fernández V., Montoya F. A Review of Cryptographically Secure PRNGs in Constrained  Devices for the IoT. In  Proceedings of the SOCO 2017, ICEUTE 2017, CISIS 2017: International Joint Conference SOCO’17-CISIS’17-ICEUTE’17 León, Spain, 6–8 September 2017. DOI: 10.1007/978-3-319-67180-2_65.
  6. Maksymovych V., Shabatura M., Harasymchuk O., Shevchuk R., Sawicki P., Zajac T. Combined Pseudo- Random Sequence Generator for Cybersecurity. Sensors (Basel). 2022. 22. 9700. DOI: 10.3390/s22249700.
  7. Maksymovych V., Shabatura M., Harasymchuk O., Karpinski M., Jancarczyk D., Sawicki P. Development of Additive Fibonacci Generators with Improved Characteristics for Cybersecurity Needs. Appl. Sci. (Basel). 2022. 12. 1519. DOI: 10.3390/app12031519.
  8. Almaraz Luengo E. A brief and understandable guide to pseudo-random number generators and specific models for security. Statistic Surveys. 2022. 16. 137-181. DOI: 10.1214/22-SS136.
  9. Горбенко С. І., Шапочка Н. В., Гріненко Т. О., Нейванов А. В., Мордвінов Р. І. Методи та засоби генерування псевдовипадкових послідовностей. 2011.
  10. Горбенко І. Д., Шапочка Н. В., Козулін О. О. Обґрунтування вимог до генераторів випадкових бітів згідно ISO/IEC 18031. Радіоелектронні і комп’ютерні системи. 2009. 6. С. 94-97.
  11. Knuth Donald E. The Art of Computer Programming. 3rd ed., Addison Wesley, 1997.
  12. A Statistical Test Suite for Random and Pseudorandom Number Generators for Cryptographic Applications. Andrew Rukhin, Juan Soto, James Nechvatal, Miles Smid, Elaine Barker, Stefan Leigh, Mark Levenson, Mark Vangel, David Banks, Alan Heckert, James Dray, San Vo. NIST Special Publication 800-22, Revision 1a, April, 2010.
  13. Соколовська Г. В. Статистичний аналіз генераторів псевдовипадкової послідовності у програмних середовищах Matlab та Mathcad. Моделювання та інформаційні технології. 2013. Вип. 66. С. 26– 30.
  14. Alani M. M. Testing randomness in ciphertext of block-ciphers using DieHard tests. International Journal of Computer Science and Network Security (IJCSNS). 2010. 10(4). 53–57.
  15. NIST SP 800-22 Version 1a. A Statistical Test Suite for Random and Pseudorandom Number Generators for Cryptographic Applications; NIST: Gaithersburg, MD, USA, 2010, p. 131. URL: https://nvlpubs.nist.gov/ nistpubs/Legacy/SP/ nistspecialpublication800-22r1a.pdf (accessed on 20 April 2023).
  16. Min Lequan et al. Analysis of FIPS 140-2 Test and Chaos-Based Pseudorandom Number Generator.2013.
  17. Susan Athey. The Impact of Machine Learning on Economics. In The economics of artificial intelligence.University of Chicago Press, 2019. 507–552.
  18. Партика А., Михайлова О., Шпак С. Виявлення, аналіз та захист конфіденційних даних за допомогою технології машинного навчання сервісу AMAZON MACIE. Електронне фахове наукове видання “Кібербезпека: освіта, наука, техніка”. 2024. 3(23). 132–144. DOI: 10.28925/2663-4023.2024.23.132144.
  19. Kovalchuk O., Karpinski M., Banakh S., Kasianchuk M., Shevchuk R., Zagorodna N. Prediction Machine Learning Models on Propensity Convicts to Criminal Recidivism. Information. 2023. 14. 161. DOI: 10.3390/info14030161.
  20. Партика А., Гарасимчук О., Нємкова О., Совин Я., Дудикевич В. Розроблення методу дослідження кіберзлочинів за типом вірусів-вимагачів з використанням моделей штучного інтелекту в системі менеджменту інформаційної безпеки критичної інфраструктури. Social Development and Security. 2024. 14(2). 52-63. DOI: 10.33445/sds.2024.14.2.6.
  21. Deineka O., Harasymchuk O., Partyka A., Kozachok V. Information classification framework according to SOC 2 Type II. Cybersecurity Providing in Information and Telecommunication Systems II. 2024. 3826. Pp. 182-189.  ISSN  1613-0073.
  22. Hanin Boris, Rolnick David. How to Start Training: The Effect of Initialization and Architecture. 2018.DOI: 10.48550/arXiv.1803.01719.
  23. Miranskyy A., Sorrenti A., Thakar V. On Using Quasirandom Sequences in Machine Learning for Model Weight Initialization, 2024. DOI: 10.48550/arXiv.2408.02654.
  24. Antunes B., Hill D. R. C. Random Numbers for Machine Learning: A Comparative Study of Reproducibility and Energy Consumption. Journal of Data Science and Intelligent Systems. 2024. DOI: 10.47852/bonviewJDSIS42024012.
  25. Jason Brownlee. How to Choose an Activation Function for Deep Learning, 2021.
  26. Catapang J. K. Optimizing Speed and Accuracy Trade-off in Machine Learning Models via Stochastic Gradient Descent Approximation. 2022 9th International Conference on Soft Computing & Machine Intelligence (ISCMI), Toronto, ON, Canada, 2022. Pp. 124-128. DOI: 10.1109/ISCMI56532.2022.10068476.
  27. Wan K., Tuninetti D., Ji M., Piantanida P. Fundamental Limits of Distributed Data Shuffling. 2018 56th Annual Allerton Conference on Communication, Control, and Computing (Allerton), Monticello, IL, USA, 2018. Pp. 662-669.  DOI: 10.1109/ALLERTON.2018.8635882.
  28. Chang C. Y., Lee C. H., Chiang K. N. Using Grid Search Methods and Parallel Computing to Reduce AI
  29. Training Time for Reliability Lifetime Prediction of Wafer-Level Packaging. 2023 24th International Conference on Thermal, Mechanical and Multi-Physics Simulation and Experiments in Microelectronics and Microsystems (EuroSimE), Graz, Austria, 2023. Pp. 1-5. DOI: 10.1109/EuroSimE56861.2023.10100751.
  30. Shingade S. D., Mudhalwadkar R. P., Masal K. M. Random Forest Machine Learning Classifier for Seed Recommendation. 2022 International Conference on Edge Computing and Applications (ICECAA), Tamilnadu, India, 2022. Pp. 1385-1390. DOI: 10.1109/ICECAA55415.2022.9936120.
  31. Proskurin D. et al. Predicting pseudo-random number generator output with sequential analysis. CSDP-2024: Cyber Security and Data Protection, June 30, 2024, Lviv, Ukraine. Pp. 42-57.
  32. Proskurin D. et al. Hybrid RNN-CNN-based model for PRNG identification, CQPC-2024: Classic, Quantum, and Post-Quantum Cryptography, August 6, 2024, Kyiv, Ukraine. Pp. 47–53.
  33. Amigo G., Dong L., Marks Ii R. J. Forecasting Pseudo Random Numbers Using Deep Learning. 2021 15th International Conference on Signal Processing and Communication Systems (ICSPCS), Sydney, Australia, 2021. Pp. 1-7. DOI: 10.1109/ICSPCS53099.2021.9660301.
  34. Лесик  В.  О.,  Дорошенко  А.  Ю.  Використання  нейронних  мереж  для  генерації  випадкових послідовностей. Проблеми програмування. 2024. № 2-3. С. 280–287. DOI: 10.15407/pp2024.02-03.280.