Методи пошуку та розпізнавання об'єктів у відеозображеннях на мобільній платформі IOS в реальному часі

2019;
: сс. 24-34
1
Національний університет «Львівська політехніка», кафедра електронних обчислювальних машин
2
Національний університет «Львівська політехніка», кафедра електронних обчислювальних машин

Досліджено особливості найпоширеніших методів і систем пошуку та розпізнавання об'єктів у відеозображеннях. За результатами дослідження показано доцільність побудови засобів пошуку та розпізнавання для платформи iOS у реальному часі. Запропоновано метод функціональної адаптації алгоритму пошуку та розпізнавання об'єктів до особливостей відеозображень, який полягає в опрацюванні відеозображення згладжуючим та мінімізаційним фільтрами, що забезпечує зменшення часу пошуку та розпізнавання об'єктів. Розроблено базову структурну схему таких засобів та алгоритм функціонування. Розроблено алгоритмічнопрограмні засоби для розв'язання завдання на знаходження та оперативне розпізнавання об'єктів у режимі реального часу мовою Swift під мобільну платформу iOS. Використано особливості згорткової нейронної мережі з архітектурою YOLOv3 та фреймворку для роботи з нейронними мережами під мобільні додатки CoreML. Запропоновано метод поліпшенняащення роботи такої нейронної мережі, який оснований на квантизації вагових коефіцієнтів нейромережі та забезпечує мінімізацію розміру моделі та часу пошуку її об'єктів. Досліджено значення частоти оброблення кадрів зображень із використанням запропонованої моделі YOLOv3-KD та моделей нейронних мереж типу YOLOv3-tiny та YOLOv3-416. Доведено можливість функціонування запропонованих засобів у режимі реального часу.

[1] Wikipedia.  Binary  classification  [Elektronnyj  resurs]  /  Chicago  2019.  Rezhym  dostupu: https://en.wikipedia.org/wiki/Binary_classification.

[2] Wikipedia. Support-vector machine [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Support-vector_machine.

[3] Wikipedia. Artificial neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Artificial_neural_network.

[4] Wikipedia. Convolutional neural network [Elektronnyj resurs] / Chicago 2019. Rezhym dostupu: https://en.wikipedia.org/wiki/Convolutional_neural_network.

[5-7]. Rohith Gandhi. R-CNN, Fast R-CNN, Faster R-CNN, YOLO. Object Detection Algorithms [Elektronnyj resurs] / San-Francisco 2018 – Rezhym dostupu: https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yoloobject-....

[8]  Wikipedia.  Keras  [Elektronnyj  resurs]  /  Chicago  2019.  Rezhym  dostupu: https://en.wikipedia.org/wiki/Keras.

[9-10]. Hao Gao. Understand Single Shot MultiBox Detector (SSD) and Implement It in Pytorch [Elektronnyj resurs] / San-Francisco 2018. Rezhym dostupu: https://medium.com/@smallfishbigsea/understand-ssd-andimplement-your-own....

[11] Juan Garcia, Reza Bakhshandeh. Methods and systems for object recognition. [Elektronnyjresurs] / MenloPark2016-Rezhym dostupu: https://patents.google.com/patent/US948940.

[12] Wikipedia.  Google  Translate  [Elektronnyj  resurs]  /  Chicago  2019.  Rezhym  dostupu: https://en.wikipedia.org/wiki/Google_Translate