ПОКРАЩЕННЯ МОЖЛИВОСТЕЙ ПОШУКУ ВІДЕО: ІНТЕГРАЦІЯ НЕЙРОННОЇ МЕРЕЖІ ПРЯМОГО ПОШИРЕННЯ ДЛЯ ЕФЕКТИВНОГО ФРАГМЕНТНОГО ПОШУКУ

https://doi.org/10.23939/cds2024.01.149
Надіслано: Березень 12, 2024
Переглянуто: Березень 28, 2024
Прийнято: Квітень 01, 2024
1
Національний університет Львівська політехніка
2
Національний університет Львівська політехніка

В умовах стрімкого збільшення обсягів відеоданих актуалізується проблема їх ефективного пошуку та аналізу. Це дослідження має на меті розробку та апробацію інноваційної системи для покращення швидкості та точності пошуку відео, використовуючи можливості глибоких згорткових нейронних мереж (DCNN) та нейронних мереж прямого поширення (FFNN). У рамках методології, розробленої для цього дослідження, відеодані обробляються через декілька послідовних етапів: від вилучення ознак до ідентифікації ключових кадрів і формування абстрактного векторного представлення. Центральне місце в системі відводиться глибоким згортковим нейронним мережам для аналізу зображень та нейронним мережам прямого пошорення для оптимізації процесу пошуку. Основними результатами дослідження є підвищення ефективності пошуку відео за рахунок зниження часу обробки даних та підвищення точності ідентифікації відповідних фрагментів. Оригінальність роботи полягає в інтеграції двох типів нейронних мереж для структурованого аналізу відеоданих, що є новим кроком у розвитку технологій пошуку відео. Практичне значення дослідження виражається у можливості застосування розробленої системи у різноманітних сферах, де потрібен швидкий та точний пошук відео: від медіаіндустрії до систем безпеки. Масштаби подальших досліджень включають адаптацію системи під специфічні типи відеоконтенту та розширення можливостей штучного інтелекту для глибшого розуміння відеоданих.

[1] Indriyani and P. Dewanti, “Analysis of the Effect of Social Media on the Marketing Process in a Store  or  Business Entity ‘Social Media Store’,” Budapest International Research and Critics Institute-Journal, vol. 4, no. 4, pp. 9804-9814, 2021

[2] A. W. Bridges, “Skills, content  knowledge,  and  tools  needed in  a 21st century university-level graphic design program,” Visual Communications Journal, vol. 52, no. 2, pp. 1–12, 2016.

[3] M. Y. Saragih and A. I. Harahap, “The Challenges of Print Media Journalism in the Digital Era. Budapest International  Research  and  Critics  Institute,”  BIRCI-Journal,  vol.  3,  no.  1,  pp.  540-548, 2020.

[4] Konrad J, Wang M, Ishwar P, Wu C, Mukherjee D. LearningBased, Automatic 2D-to-3D Image and Video Conversion. IEEE Transactions on Image Processing. 2013; 22(9):3485–96.

[5] B. Gong, W.-L. Chao, K. Grauman, and F. Sha. Diverse sequential subset selection for supervised video summarization. In Advances in Neural Information Processing Systems, pages 2069–2077, 2014.

[6] Zhang HJ, Wu J, Zhong D, Smoliar SW (1997) An integrated system for content-based video retrieval and browsing. Pattern Recognit 30(4):643–658

[7] C. Cotsaces, N. Nikolaidis, and I. Pitas. Shot detection and condensed representation – a review. IEEE Signal Processing Magazine, 23:28–37, 2006.

[8] D. Mohammad, I. Aljarrah, and M. Jarrah. Searching surveillance video contents using convolutional neural network. IJECE, vol. 11, no. 2, pp. 1656-1665, 2021

[9] D. Varshni, K. Thakral, L. Agarwal, R. Nijhawan and A. Mittal, "Pneumonia Detection Using CNN based Feature Extraction", 2019 IEEE International Conference on Electrical Computer and Communication Technologies (ICECCT), pp. 1-7, 2019.

[10]  G. Huang, Z. Liu, L. V. D. Maaten and K. Q. Weinberger, "Densely connected convolutional networks", CVPR, pp. 2261-2269, July 2017.

[11]. L. Shao, F. Zhu, X. Li, Transfer learning for visual categorization: A survey, IEEE transactions on neural networks and learning systems vol. 26, pp. 1019–1034, 2014.

[12]. P. Naveen and B. Diwan, "Relative Analysis of ML Algorithm QDA LR and SVM for Credit Card Fraud Detection Dataset", 2020 Fourth International Conference on I-SMAC (IoT in Social Mobile Analytics and Cloud) (I-SMAC), pp. 976-981, 2020.

[13]. Y. Zhuang, Y. Rui, T. S. Huang, and S. Mehrotra. Adaptive key frame extracting using unsupervised clustering. Proc. of IEEE Int Conf on Image Processing, pages 866–870, 1998.

[14]. Wolf. Key frame selection by motion analysis. IEEE International Conference on Acoustics, Speech and Signal Processing, pages 1228–1231, 1996.

[15]. Li, D.; Wang, R.; Xie, C.; Liu, L.; Zhang, J.; Li, R.; Wang, F.; Zhou, M.; Liu, W. A Recognition Method for Rice Plant Diseases and Pests Video Detection Based on Deep Convolutional Neural Network. Sensors 2020, 20, 578.

[16]. Liu, Z.G., Zhang, X.Y., Wu, C.C.: A flame detection algorithm based on bag-of-features in the YUV color space. In: Proceedings on International Conference on Intelligent Computing and Internet of Things, Harbin, pp. 64–67 (2015).

[17]. Divya Shree, Chander Kant. Building Efficient Neural Networks For Brain Tumor Detection. Journal of Positive School Psychology, vol. 6, no. 11, 2022.

[18]. Z. Qiumei, T. Dan and W. Fenghua, "Improved Convolutional Neural Network Based on Fast Exponentially Linear Unit Activation Function," in IEEE Access, vol. 7, pp. 151359-151367, 2019, doi: 10.1109/ACCESS.2019.2948112.

[19]. L. Li, M. Doroslovački and M. H. Loew, "Approximating the Gradient of Cross-Entropy Loss Function," in IEEE Access, vol. 8, pp. 111626-111635, 2020, doi: 10.1109/ACCESS.2020.3001531.

[20]. N. Ohadi, A. Kamandi, M. Shabankhah, S. M. Fatemi, S. M. Hosseini and A. Mahmoudi, "SW-DBSCAN: A Grid-based DBSCAN Algorithm for Large Datasets," 2020 6th International Conference on Web Research (ICWR), Tehran, Iran, 2020, pp. 139-145, doi: 10.1109/ICWR49608.2020.9122313.

[21]. T. Kwon, "Average Data Rate Analysis for Hierachical Cell Structure under Nakagami-m Fading Channel with a Two-layer Feed-Forward Neural Network," 2019 International Conference on Wireless and Mobile Computing, Networking and Communications (WiMob), Barcelona, Spain, 2019, pp. 1-4, doi: 10.1109/WiMOB.2019.8923280.

[22]. L. D. Medus, T. Iakymchuk, J. V. Frances-Villora, M. Bataller-Mompeán and A. Rosado-Muñoz, "A Novel Systolic Parallel Hardware Architecture for the FPGA Acceleration of Feedforward Neural Networks," in IEEE Access, vol. 7, pp. 76084-76103, 2019, doi: 10.1109/ACCESS.2019.2920885.

[23]. X. Luo, O. Ye and B. Zhou, "An Modified Video Stream Classification Method Which Fuses Three-Dimensional Convolutional Neural Network," 2019 International Conference on Machine Learning, Big Data and Business Intelligence (MLBDBI), Taiyuan, China, 2019, pp. 105-108, doi: 10.1109/MLBDBI48998.2019.00026.