Abstract
One of the major applications of computer vision is the analysis of the traffic scene on the road, and how pedestrian traffic affects traffic in general. Road sizes and traffic signals must constantly adapt. Counting and classifying vehicles and pedestrians at an intersection is an exhausting task, and despite the use of traffic control systems, human interaction is very necessary to perform such a task. The object of study of Deep Learning is to try to solve problems that require artificial intelligence. Artificial intelligence has been working in this field for years, with different approaches and algorithms. It has achieved an important emergence in the recognition of patterns in images and videos using these techniques, to the point of surpassing human capacity in some problems. An important factor in this development is the ability to process large volumes of information in applications, which has resulted in the devices used for this purpose, such as GPU’s and multi-core CPU’s, requiring a large amount of power to operate. For the development of the application of vehicle and pedestrian detection in traffic videos, YOLO V3 was used, which is a neural network model of the latest generation of real-time objects. Keywords: yoloV3, Deep Learning, Convolucional Network. Resumen Una de las mayores aplicaciones de la visión por computadora es el análisis de la escena de tráfico en la carretera, y cómo el tráfico de peatones afecta al tráfico en general. Los tamaños de las carreteras y las señales de tráfico deben adaptarse constantemente. Contar y clasificar vehículos y peatones en una intersección es una tarea agotadora y, a pesar del uso de sistemas de control de tráfico, la interacción humana es muy necesaria para realizar dicha tarea. El objeto de estudio de Deep Learning, es intentar resolver problemas que requieren inteligencia artificial. La inteligencia artificial ha trabajado en este campo durante años, con diferentes enfoques y algoritmos. Ha logrado un surgimiento importante en el reconocimiento de patrones en imágenes y videos usando estas técnicas, hasta el punto de superar la capacidad humana en algunos problemas. Un importante factor de este desarrollo es la capacidad de procesar grandes volúmenes de información en aplicaciones, lo que ha dado como resultado que los dispositivos utilizados para este propósito, como GPU’s y CPU’s multinúcleo, requieran una gran cantidad de energía para operar. Para el desarrollo de la aplicación de Detección de vehículos y peatones en videos de tráfico, fue utilizado YOLO V3, que es un modelo de red neuronal de la última generación de objetos en tiempo real. Palabras Clave: yoloV3, Aprendizaje profundo, Red convolucional
Cite
CITATION STYLE
Arroba-Villacis, P., Maiza Pérez, W., Carrión-Paladines, C., & Revelo-Aguilar, F. (2022). Vehicle and Pedestrian Detection in Traffic Videos Using Convolutional Neural Networks. ESPOCH Congresses: The Ecuadorian Journal of S.T.E.A.M., 2(5), 1301–1312. https://doi.org/10.18502/espoch.v2i5.11734
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.