RESUMEN La accidentalidad vial es un serio problema de salud pública en el mundo. El estudio de datos abiertos sobre este tema puede estimular decisiones más oportunas e informadas. El objetivo es proponer una metodología para estudiar datos abiertos sobre accidentalidad vial (caso Medellín) usando Ciencia de Datos, considerando desde la planificación del estudio hasta la visualización web. La metodología consta de cuatro macroprocesos: 1. Planificación, 2. Preparación de datos, 3. Análisis automático y 4. Visualización de datos (aplicación web). Estos constan de una o más etapas, desagregadas en 15 subetapas con alcances univariado, bivariado y multivariado. Los macroprocesos 2-4 fueron automatizados en lenguaje R. Como resultado, el analista puede familiarizarse con el tema (descriptivos), explorar relaciones entre variables, localizar sucesos, inducir patrones de agrupación e identificar algunos factores asociados con los eventos de accidentalidad. Todos estos, combinando variables para una segmentación más detallada. El caso de estudio también tiene valor para otros ámbitos, ya que la accidentalidad vial genera mayores efectos en países en desarrollo, lo cual está atrayendo el interés de los investigadores. Palabras clave: Accidentalidad vial, ciencia de datos, visualización web, metodología de análisis, programación en R. ABSTRACT Road crashes is a serious public health problem in the world. The study of open data on this subject can stimulate more timely and informed decisions. The objective is to propose a methodology to study open data on road accident (Medellín case) using Data Science, considering from the planning of the study to the web visualization. The methodology consists of four macroprocesses: 1. Planning, 2. Data preparation, 3. Automatic analysis and 4. Data visualization (web application). These consist of one or more stages, disaggregated into 15 sub-stages with univariate, bivariate and multivariate scopes. Macroprocesses 2-4 were automated in R language. As a result, the analyst can become familiar with the topic (descriptive), explore relationships between variables, locate events, induce patterns of grouping and identify some factors associated with the events of accidents. All these, combining variables for a more detailed segmentation. The case study also has value for other areas, since road accidents generate greater effects in developing countries, which is attracting the interest of researchers.
CITATION STYLE
Pérez-Rave, J., Correa Morales, J. C., & González Echavarría, F. (2019). Metodología para explorar datos abiertos de accidentalidad vial usando Ciencia de Datos: Caso Medellín. Ingeniare. Revista Chilena de Ingeniería, 27(3), 495–509. https://doi.org/10.4067/s0718-33052019000300495
Mendeley helps you to discover research relevant for your work.