ТРЕНУВАННЯ НЕЙРОННОЇ МЕРЕЖІ ДЛЯ ПРОГНОЗУВАННЯ ПОПИТУ НА ПАСАЖИРСЬКІ ПЕРЕВЕЗЕННЯ ТАКСІ ЗА ДОПОМОГОЮ ГРАФІЧНИХ ПРОЦЕСОРІВ

https://doi.org/10.23939/ujit2020.02.029
Надіслано: Жовтень 15, 2020
Прийнято: Жовтень 25, 2020

Цитування за ДСТУ: Згоба М. І., Грицюк Ю. І. Тренування нейронної мережі для прогнозування попиту на пасажирські пере­ве­зення таксі за допомогою графічних процесорів. Український журнал інформаційних технологій. 2020, т. 2, № 1. С. 29–36.

Citation APA: Zghoba, M. I., & Hrytsiuk, Yu. I. (2020). Neural network training for forecasting the demand for passenger transportation by taxi using graphics processors. Ukrainian Journal of Information Technology, 2(1), 29–36. https://doi.org/10.23939/ujit2020.02.029

1
Національний університет "Львівська політехніка, кафедра програмного забезпечення
2
Національний університет «Львівська політехніка»

Розглянуто особливості тренування нейронної мережі для прогнозування попиту на пасажирські перевезення таксі за допомогою графічних процесорів, що дало змогу пришвидшити процедуру навчання за різних наборів вхідних даних і конфігурацій апаратного забезпечення та його потужності. З'ясовано, що послуги таксі стають доступнішими для більшої кількості людей. Найважливішим завданням будь-якої компанії та водія таксі є мінімізація тривалості очікування нових замовлень та відстані до клієнтів на момент їх замовлення. Аби досягти цієї мети, потрібно мати розуміння транспортної логістики та вміння оцінити географічний попит на перевезення залежно від багатьох чинників. Розглянуто приклад тренування нейронної мережі для передбачення попиту на пасажирські перевезення таксі. Встановлено, щоб нейронна мережа давала хороші прогнози, необхідно обробити великий набір вхідних даних. Оскільки навчання нейронної мережі – це довготривалий процес, то для вирішення цієї проблеми було застосовано розпаралелювання процедури навчання мережі з використанням графічних процесорів.

Проведено навчання нейронної мережі на центральному процесорі, одному та двох графічних процесорах відповідно, виконано порівняння тривалості процедури навчання мережі для однієї епохи. Оцінено вплив кількості використаних графічних процесорів на тривалість тренування нейронної мережі у двох різних конфігураціях апаратного забезпечення та його потужності. Тренування мережі здійснено за допомогою набору даних, який містить 4.5 млн поїздок у межах одного міста. Результати дослідження показують, що пришвидшення процедури навчання за допомогою графічних процесорів не завжди дає позитивний результат, позаяк залежить від багатьох чинників – розміру вибірки вхідних даних, правильного поділу вибірки даних на менші підвибірки, а також характеристик апаратного забезпечення та його потужності.

  1. Biao Leng, Heng Du, Jianyuan Wang, Li Li, & Zhang Xiong. (2016). Analysis of Taxi Drivers Behaviors Within a Battle Between Two Taxi Apps. IEEE Transactions on Intelligent Transportation Systems, 17(1), 296–300. https://doi.org/10.1109/TITS.2015.2461000
  2. Bruce Schaller. (2005). A regression model of the number of taxicabs in US cities. Journal of Public Transportation, 8(5), 4–11. http://doi.org/10.5038/2375-0901.8.5.4
  3. Dhiraj, K. (2019). 10 reasons why PyTorch is the deep learning framework of the future. Retrieved from: https://heartbeat.fritz.ai/10-reasons-why-pytorch-is-the-deep-learning-framework-of-future-6788bd6b5cc2
  4. Dipanjan Sarkar, Raghav Bali, & Tushar Sharma. (2018). Practical Machine Learning with Python. Springer Science+Business Media. New York.
  5. Du, K.-L., & Swamy, M.N.s. (2014). Multilayer Perceptrons: Architecture and Error Backpropagation. Neural Networks and Statistical Learning, pp. 83–126. https://doi.org/10.1007/978-1-4471-5571-3_4
  6. Fei Miao, Shuo Han, Shan Lin, Qian Wang, John A. Stankovic, Abdeltawab Hendawi, Desheng Zhang, Tain He, & George J. Pappas. (2019). Data-Driven Robust Taxi Dispatch Under Demand Uncertainties. IEEE Transactions on Control Systems Technology, 17(1), 175–191. https://doi.org/10.1109/TCST.2017.2766042
  7. Firmino, P., de Mattos, Neto P., & Ferreira, T. (2014). Correcting and combining time series forecasters. Neural Networks, 50, 1–11.
  8. Girshick, R., Donahue, J., Darrell, T., & Malik, J. (2016). Region-Based Convolutional Networks for Accurate Object Detection and Segmentation. In: IEEE Transactions on Pattern Analysis and Machine Intelligence, 38(1), 142–158. https://doi.org/10.1109/TPAMI.2015.2437384
  9. Grossberg, S. Z. (2010). Neural Networks and Natural Intelligence. Cambridge, MA: MIT Press, 651 p.
  10. Haykin, S. (2008). Neural Networks and Learning Machines. New Jersey: Prentice Hall, 936 p.
  11. Jason Dsouza. (2020). What is a GPU and do you need one in Deep Learning? Retrieved from: https://towardsdatascience.com/what-is-a-gpu-and-do-you-need-one-in-deep-learning-718b9597aa0d
  12. John Grinberg, Arzav Jain, & Arzav Vivek (2014). Predicting Taxi Pickups in New York City. Retrieved from: http://robots.stanford.edu/cs221/2016/restricted/projects/vhchoksi/final.pdf.
  13. Jun Xu, Rouhollah Rahmatizadeh, Ladislau Bölöni, & Damla Turgut. (2018). Real-Time Prediction of Taxi Demand Using Recurrent Neural Networks. IEEE Transaction on Intelligent transport system, 19(8), 2572–2581. https://doi.org/10.1109/TITS.2017.2755684
  14. Kennedy, R. K., Khoshgoftaar, T. M., Villanustre, F., & Humphrey, T. (2019). A parallel and distributed stochastic gradient descent implementation using commodity clusters. Journal of Big Data, 6(1), 16. https://doi.org/10.1186/s40537-019-0179-2
  15. Kiani, K. (2005). Detecting business cycle asymmetries using artificial neural networks and time series models. Computational Economics, 26(1), 65–89.
  16. Kim, Yoon. (2014). Convolutional neural networks for sentence classification. IEMNLP, 1746–1751.
  17. Kingma, D. P., & Ba, J. (2014). Adam: A method for stochastic optimization. arXiv – preprint arXiv: 1412.6980.
  18. Krizhevsky Alex, Sutskever Ilya, Hinton Geoffrey E. (2012). Imagenet classification with deep convolutional neural networks. NIPS, 1106–1114.
  19. Krizhevsky, A. (2014). One weird trick for parallelizing convolutional neural networks. CoRR, abs/1404.5997.
  20. Lam, M. (2004). Neural network techniques for financial performance prediction: integrating fundamental and technical analysis. Decision Support Systems, 37(4), 567–581.
  21. Li, J., Nicolae, B., Wozniak, J., & Bosilca, G. (2019). Understanding scalability and fine-grain parallelism of synchronous data parallel training. IEEE/ACM Workshop – Machine Learning in High Performance Computing Environments (MLHPC) IEEE, pp. 1–8. https://doi.org/10.1109/MLHPC49564.2019.00006
  22. Lopatko, O., & Mykytyn, I. (2016). Neural networks as the means of forecasting the temperature value of a transient process. Measuring Equipment and Metrology, 77, 65–69.
  23. Luis Moreira-Matias, et al. (2012). A predictive model for the passenger demand on a taxi network. International IEEE Conference on. IEEE, 15, 1014–1019. https://doi.org/10.1109/ITSC.2012.6338680
  24. Naoto Mukai, & Naoto Yoden. (2012). Taxi Demand Forecasting Based on Taxi Probe Data by Neural Network. Intelligent Interactive Multimedia: Systems and Services. Ed. by Toyohide Watanabe et al. Smart Innovation, Systems and Technologies 14. Springer Berlin Heidelberg, pp. 589–597. https://doi.org/10.1007/978-3-642-29934-6_57
  25. Nicholas Jing Yuan, Yu Zheng, Liuhang Zhang, & Xing Xie. (2013). T-Finder: A Recommender System for Finding Passengers and Vacant Taxis. IEEE Transactions on Knowledge and Data Engineering, 25(10), 2390–2403. https://doi.org/10.1109/TKDE.2012.153
  26. Önder, E., Fɪrat, B., & Hepsen, A. (2013). Forecasting Macroeconomic Variables using Artificial Neural Network and Traditional Smoothing Techniques. Journal of Applied Finance & Banking, 3(4), 73–104.
  27. Pal, S., Ebrahimi, E., Zulfiqar, A., Fu, Y., Zhang, V., Migacz, S., Nellans, D., & Gupta, P. (2019). Optimizing multi-gpu parallelization strategies for deep learning training. EEE Micro, 39(5), 91–101. https://doi.org/10.1109/MM.2019.2935967
  28. PyTorch. (2020). PyTorch documentation. Retrieved from: https://pytorch.org/docs/stable/index.html
  29. Ren, S., He, K., Girshick, R., & Sun, J. (2017). Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. In: IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(6), 1137–1149. https://doi.org/10.1109/TPAMI.2016.2577031
  30. Simonyan, K., & Zisserman, A. (2014). Very Deep Convolutional Networks for Large–Scale Image Recognition. CoRR, abs/1409.1556. https://doi.org/10.1.1.740.6937
  31. YouTube. (2020). Consumer assessment of taxi services in large cities. Retrieved from: https://www.youtube.com/watch?v=RE2j1B7EdQM. [In Ukrainian].
  32. Zhang Xiang, Zhao Junbo, LeCun Yann. (2015). Character-level convolutional networks for text classification. In: Advances in Neural Information Processing Systems, pp. 649–657.