En el presente proyecto se desarrolló un modelo de regresión logística para estimar la deserción estudiantil del Instituto Superior Tecnológico Luis A. Martínez Agronómico. Se analizaron los datos de 849 estudiantes, evaluándose las variables: género, estado civil, edad, carrera, repitencia, ocupación e ingresos económicos. Para desarrollar el modelo matemático se utilizó la metodología KDD, que permite generar información a partir de una base de datos con los registros a estudiarse. Dentro el período evaluado el 82,45 % de los estudiantes no desertaron y el 17,55% sí. Para el estudio se establecieron cuatro modelos de regresión logística, sin embargo, se escogió el modelo de regresión logística 4, el cual incluye las variables ‘carrera’ y ‘repitencia’, que fueron las únicas significativas. El modelo de regresión logística 4 clasificó correctamente el 83 % de los datos de entrenamiento y el 79 % de los datos de testeo. Adicionalmente, se determinó un modelo de predicción con árboles de decisión, que estableció como variable explicativa ‘carrera’. El valor F1_Score del modelo de regresión logística 4 fue mayor que el valor del F1_Score del modelo con árbol de decisión.
CITATION STYLE
Vinueza López, C., Toscano Guerrero, E., Salazar Noroña, C., & Flores Cadena, C. (2022). Identificación de variables significativas en la deserción estudiantil, mediante un modelo matemático de regresión lineal KDD. Revista Científica Ciencia y Tecnología, 22(36). https://doi.org/10.47189/rcct.v22i36.493
Mendeley helps you to discover research relevant for your work.