Cómo citar: Parra-Sánchez, J. S., Torres, I. D. y Martínez, C. Y. (2023). Factores explicativos de la deserción universitaria abordados mediante inteligencia artificial. Revista Electrónica de Investigación Educativa, 25, e18, 1-17. https://doi.org/10.24320/redie.2023.25.e18.4455
Este artículo identifica los principales estudios relacionados con los factores que contribuyen a explicar la deserción universitaria, y cómo estos son abordados desde el campo de la inteligencia artificial (IA). El estudio describe la metodología adoptada para seleccionar 31 documentos sobre un repositorio de 2745 reportados en la literatura. El análisis se realizó desde los principales métodos de IA adoptados, así como desde los factores explicativos de la deserción universitaria agrupados en cuatro categorías: académicos, relacionados con la motivación y hábitos de estudio, institucionales, y económicos y sociodemográficos. La revisión de la literatura permite concluir que la tarea más común desde la IA es la clasificación mediante árboles de decisión y que la mayoría de los trabajos predicen la deserción universitaria desde los factores que la explican.
Palabras clave: deserción escolar, tasa de deserción escolar, estudiante universitario, inteligencia artificial
El concepto de desertor estudiantil hace referencia a “aquel individuo que siendo estudiante de una institución de educación superior no presenta actividad académica durante dos semestres académicos consecutivos, lo cual equivale a un año de actividad académica” (Ministerio de Educación Nacional, 2008, p. 18). Es importante tener en cuenta que la deserción universitaria en sí misma es una problemática estructural, tanto por las condiciones sociales que se generan en las instituciones de educación superior, como por el contexto propio del estudiante (Bravo y Mejía, 2010) y, además, conlleva otras implicaciones sociales, tales como la disminución del aporte intelectual y el potencial aumento de la pobreza (González y Espinoza, 2016).
El abandono de los estudios universitarios es un fenómeno global. Según la Organización para la Cooperación y el Desarrollo Económico (OECD, 2016), la media de la deserción en educación superior alcanza el 31% entre los países miembros de esta organización, siendo los países con mayor deserción Hungría, Nueva Zelanda y Estados Unidos; Nueva Zelanda es quien alcanza un 46%, a diferencia de países con menor tasa de deserción, entres los que se encuentran Australia, Dinamarca, Francia y Japón, que alcanzan un 20% (Gallegos et al., 2018). Es responsabilidad de la universidad, la sociedad y el Estado asumir esta problemática en un contexto de pocas opciones laborales y constantes crisis económicas y sociales (Barragán y Patiño, 2016).
Ante esto, si bien es cierto que que en los últimos años las matrículas en las Instituciones de Educación Superior (IES) han incrementado debido el aumento de oferta en los programas gubernamentales, la consolidación e inclusión de nuevas instituciones privadas de alta calidad y la múltiple oferta de programas de becas y créditos, la deserción es un problema que aún persiste.
En promedio, la tasa bruta de matrícula en educación superior en América Latina y el Caribe creció del 17% en 1991 al 21% en el año 2000, y al 40 % en el 2010 (Ferreira et al., 2017). Entre tanto, mientras que este indicador en Asia Central era similar al de América Latina y el Caribe en el año 2000, en el 2010 había llegado sólo al 27%. Por otra parte, el Observatorio Iberoamericano de la Ciencia, la Tecnología y la Sociedad (García de Fanelly, 2019) y la Red Iberoamericana de Indicadores de Educación Superior (Red INDICES), indicaron que el crecimiento anual promedio de la matrícula en educación superior en América Latina, de 2010 a 2017, fue del 4%.
Investigaciones como la de Manrique et al. (2019) y Silva et al. (2019) se han dedicado a estudiar las causas del fenómeno de la deserción universitaria para predecir en qué momento un estudiante, dadas ciertas condiciones, puede desertar o no, con el fin de plantear estrategias focalizadas que aborden los factores determinantes de esta problemática. Sobre el particular, el ritmo actual de aplicación de técnicas de la inteligencia artificial (IA), aumenta vertiginosamente, como un enfoque desafiante en el ámbito de la educación y una herramienta para reconocer patrones en los datos y crear reglas basadas en grandes cantidades de información, lo cual difícilmente puede realizarse de forma manual. La IA es la rama de la ciencia computacional que trata de emular algunos comportamientos y patrones humanos, pero desde las máquinas, y un subconjunto particular de la IA es la representada por la analítica de datos, la cual se define como un proceso computacional para analizar grandes cantidades de datos, descubrir patrones, extraer conocimiento y predecir variables de salida o eventos futuros (Romero et al., 2007).
Las problemáticas evidenciadas en la educación formal, como la deserción universitaria, brindan un potencial investigativo para aplicar la IA (León y Viña, 2017), específicamente desde el ámbito del aprendizaje es posible potencializar la aplicabilidad de este enfoque desde la analítica de datos.
En este artículo se revisan algunos estudios que analizan datos educativos, las técnicas de IA adoptadas, las tareas más utilizadas y los enfoques de trabajo, para finalmente destacar cuáles son los factores que contribuyen a explicar la deserción universitaria. Se busca con ello ser el punto de partida para mostrar cómo la IA se utiliza para describir patrones importantes y obtener información relevante del fenómeno de la deserción universitaria, que pueda ser útil en la toma de decisiones (Bedregal-Alpaca et al., 2020).
En este apartado se explican las tareas de búsqueda y selección de documentos paso a paso, teniendo en cuenta los criterios de inclusión y exclusión. Las preguntas de investigación propuestas para la revisión fueron: ¿Cuáles son los factores que más influyen en la deserción universitaria?, y ¿cuáles son los enfoques y tareas comúnmente adoptados desde las técnicas de IA?
Se ejecutó una búsqueda sistemática de estudios en español e inglés, utilizando las bases de datos Scopus, Web of Science (WoS), Dialnet y Redalyc. La búsqueda se limitó a artículos en revistas indexadas, memorias de congresos internacionales y capítulos de libro resultados de investigación. Los descriptores de la búsqueda incluyeron las palabras “deserción universitaria”, “university dropout”, “student(s) dropping out”, “Artificial intelligence”, “IA techniques” “data analytics”, “data mining”, “análisis de datos”. Con operadores booleanos se excluyeron los documentos que no respondieron a las preguntas de investigación propuestas para la revisión. Los criterios de elegibilidad se muestran en la Tabla 1.
Criterios de inclusion | Criterios de exclusión |
---|---|
Documentos que incluyen como temática factores asociados a la deserción. | Documentos que explican los efectos de la deserción debido a políticas o reformas de países en específico. |
Documentos que responden a las preguntas de investigación propuestas para la revisión. | Documentos cuya población de estudio son estudiantes de educación primaria, secundaria o de posgrado. |
Documentos que presentan estadísticas y metodologías cuantitativas de investigación. | Documentos que expresan trastornos sicológicos asociados a la deserción. |
Estudios relacionados con análisis de datos en la temática. | Estudios en cursos a distancia o virtuales. |
Artículos y capítulos de libro resultados de investigación, memorias de congresos internacionales de los últimos 5 años. |
Una vez claros los criterios de exclusión e inclusión, se realizó la búsqueda de acuerdo con la metodología PRISMA (Preferred Reported Items for Systematic Review and Metanalyses). La Figura 1 muestra un resumen gráfico de la selección de documentos. La búsqueda arrojó inicialmente 2745 documentos, de los cuales 89 cumplieron con los criterios de elegibilidad; sin embargo, después de la revisión del texto completo se excluyeron aquellos que no expresan explícitamente las métricas, las variables explicativas o cuya variable objetivo no está en relación con la deserción universitaria. Finalmente, fueron 31 los documentos utilizados en el análisis de esta revisión sistemática. Cabe destacar que en la búsqueda se consideraron las variables objetivo de abandono e inactividad, con el fin de revisar los diferentes enfoques de estudio en el desarrollo de la temática.
Después de una revisión sistemática se determinó el número de documentos elegibles publicados en cada año, desde 2016. Se observa que hay un incremento considerable de documentos que involucran análisis de datos en relación con el fenómeno de la deserción universitaria. En la Figura 2 se muestra el comportamiento del número de publicaciones respecto a los últimos años, lo que indica un creciente interés por estudiar la deserción universitaria utilizando métodos de análisis de datos, uno de los campos de IA.
Dentro de las tareas principales que se citan bajo la IA, concretamente el análisis de datos, están la clasificación, la regresión y el agrupamiento (Gironés et al., 2017). La clasificación consiste en asignar instancias de un dominio dado a un conjunto de clases. Una clase se define como una etiqueta categórica y discreta, previamente conocida y definida comúnmente como método supervisado. Por ejemplo, si un estudiante es desertor o no es desertor. Esto implica que el conjunto de datos debe contener X datos de entrada (variables explicativas) con los valores de salida (variable objetivo) correspondientes Y (deserta o no deserta), para encontrar una dependencia entre ellos. La clasificación permite asignar una clase a un nuevo dato. Por su parte, la regresión consiste en la predicción de valores numéricos en lugar de etiquetas con clases discretas. Se supone que la asignación se acerca a una función objetiva. En este caso, sería una probabilidad o el riesgo de que un estudiante deserte. El agrupamiento consiste en la división de un conjunto de datos de un dominio determinado. A diferencia de la clasificación y la regresión, el agrupamiento (o clustering) no es una tarea de predicción, sino de descripción, y como no tiene etiquetas previas de categorización, consiste en un metodo no supervisado. El descubrimiento se basa en patrones de similitud identificados en los datos.
Cuando se trata de predecir una variable se utilizan métodos supervisados, es decir, métodos donde se conocen las variables de entrada (predictoras) con su respectiva variable de salida (objetivo). En esta etapa en la cual se crean modelos, se articulan las variables de entrada (predictoras) y se evalúa su relación con la variable de salida (objetivo), por lo tanto, es posible evaluar qué porcentaje podrían explicar las variables de entrada el comportamiento de una determinada salida. En la Figura 3 se muestra un esquema explicativo de las tareas del análisis de datos en el contexto de la deserción universitaria.
Desde el conjunto de datos que se utiliza para la realización del modelo se distingue: primero, un conjunto de entrenamiento que generalmente corresponde al 60 a 70% de los datos. Segundo, un conjunto de evaluación al cual se aplica las métricas y en algunos casos, cuando es posible un tercer conjunto de evaluación se destina para la validación del modelo. En este caso, los datos son diferentes a los del conjunto de entrenamiento, pero se conoce la variable objetivo con el fin de comparar la veracidad del modelo.
En el caso del fenómeno de estudio, la variable objetivo es la deserción universitaria. Es importante destacar que algunos estudios no se refieren directamente al término “deserción”, sino al de “abandono” e “inactividad”. Aunque las definiciones son similares varían en cuanto a la temporalidad con la que se mide; por ejemplo, se puede considerar que un estudiante abandonó o se encuentra inactivo, pero que no es desertor. Esto está relacionado con las diferentes definiciones de deserción que adoptan los autores, desde el contexto y las regulaciones de los países. Al respecto, los términos abandono y deserción estudiantil se han utilizado de manera indistinta para definir la acción de desincorporación de los estudios formales por parte de los estudiantes (Ramírez et al., 2016).
En la Tabla 2 se muestran los métodos utilizados y algoritmos, ordenados de forma descendente, de acuerdo con el porcentaje de documentos revisados, teniendo en cuenta que la tarea principal evidenciada es la de clasificación (método supervisado) con el fin de predecir la deserción universitaria.
Métodos | Porcentaje de documentos que aplican el método | Supervisado | No supervisado |
---|---|---|---|
Clasificación | Agrupamiento | ||
Árboles de decisión | 84% | X | |
Métodos probabilísticos (Naive Bayes) | 36% | X | |
Regresión logística | 28% | X | |
Redes neuronales | 20% | X | |
k-means | 8% | X | |
k-vecinos | 4% | X |
En cuanto a la clasificación, la mayoría de los estudios presentados (92%) se enfoca a predecir si un estudiante desertará o no, dadas algunas condiciones de ingreso, y con esto es posible evidenciar qué tanto influyen ciertas variables en el desenlace. El 84% de los estudios revisados utilizó el algoritmo de árboles de decisión, seguido de los métodos probabilísticos (36%) y la regresión logística (28%). Por otro lado, no se encontraron estudios que evalúen el riesgo de deserción desde un punto de vista numérico; es decir, en los estudios no se encuentran modelos de regresión, dado que el desenlace se transforma en una variable dicotómica (sí o no) o se examina el riesgo como una variable categórica (alto, medio, bajo) siguiendo una tarea de clasificación. En cuanto al agrupamiento, hay un gran potencial para estudiar perfiles de estudiantes con características particulares que permita focalizar estrategias para grupos en específico, aunque sólo en el 8% de los estudios se utilizan algoritmos de aprendizaje no supervisado aplicados a la deserción universitaria.
Por otra parte, no todos los estudios que se encontraron hacen uso de las técnicas de IA, específicamente de minería de datos. También se encontraron algunos estudios correlacionales que utilizan modelos estadísticos en los cuales se pretende estudiar cuánto influye una variable explicativa en la variable objetivo, tales como el análisis bivariado.
A continuación se muestran los resultados de los factores explicativos más relevantes en la variable objetivo, en relación con la deserción universitaria. Los estudios fueron ordenados según el año de publicación y en orden alfabético (por autor). Después de realizada la búsqueda y selección de los documentos incluidos, se sistematizaron los resultados de cada estudio (ver Tabla 3), teniendo en cuenta la población, el tipo de tarea, los métodos que presentan mejores resultados de acuerdo con las métricas de evaluación que presentaron los autores, la variable objetivo en relación con la deserción o conceptos asociados (abandono, inactividad, permanencia, etc.) y, por último, un listado de los factores y atributos explicativos que, según los resultados de los estudios, tienen mayor relevancia a la hora de explicar la variable objetivo. Los atributos son descritos tal cual los autores los han nombrado en cada uno de sus estudios, con el fin de revisar las diferentes perspectivas y variedad de nombres dados a una misma categoría, lo cual se discutirá más adelante.
Autor | Población | Inteligencia Artificial | Tipo de tarea: Método | Variable objetivo | Factores y atributos explicativos más relevantes | |
---|---|---|---|---|---|---|
Sí | No | |||||
Bedregal-Alpaca et al. (2020) | 970 estudiantes de Ingeniería | X |
Clasificación Árboles de decisión Redes Neuronales |
Deserción (Sí-No) Riesgo de Deserción (Incipiente, Moderado, Alto) |
Académicos: Puntaje de prueba de admisión Promedio de calificaciones y promedio crédito |
|
Behr et al. (2020) | 10,010 estudiantes universitarios | X |
Clasificación Árboles de decisión |
Deserción (Sí-No) |
Académico: Calificaciones en la escuela secundaria Motivacionales: Satisfacción del estudiante, Autoconcepto académico subjetivo |
|
Castro-Montoya et al. (2020) | 1002 estudiantes universitarios | X | Análisis bivariado | Desenlace de la trayectoria académica (graduación, deserción o rezago) |
Sociodemográficos: Sexo y edad de ingreso Nivel educativo de la madre Ingreso familiar y estrato socioeconómico Académico: Puntaje estandarizado en el examen de ingreso y desvinculación por al menos una vez |
|
Kemper et al. (2020) | 3176 estudiantes de Ingeniería | X |
Clasificación Regresión Árboles de decisión |
Deserción (Sí-No) |
Académicos: Promedio de calificaciones Promedio de exámenes aprobados |
|
Lázaro et al. (2020) | 485 estudiantes de Ingeniería | X |
Clasificación Regresión Logística |
Deserción (Sí-No) |
Sociodemográficos: Provincia de procedencia Académico: Nota examen de ingreso en matemáticas |
|
Silva et. Al (2020) | 10,486 estudiantes universitarios | X |
Clasificación Árboles de decisión |
Deserción (Sí-No) |
Sociodemográficos: Estrato socioeconómico Académico: Examen de admisión, promedio de notas en la educación media. |
|
Viloria et al. (2020) | 20,124 estudiantes universitarios | X |
Clasificación Árboles de decisión Bayesiano |
Deserción (Sí-No) |
Académicos: Cursos aprobados Cantidad y resultados de cursos cursados Sociodemográficos: Origen y edad de ingreso del alumno |
|
Camacho et al. (2019) | 1547 estudiantes universitarios | X |
Modelo probit Modelo de riesgo proporcional |
Deserción (Sí-No) |
Sociodemográficos: Sexo Institucional: Modalidad Académico: Clasificación baja en las pruebas Saber 11 |
|
Díaz et al. (2019) | 2741 estudiantes universitarios | X | Correlación de variables | Intención de permanencia |
Motivacionales: Motivación intrínseca Expectativas de autoeficacia Percepción de desempeño Satisfacción con la carrera |
|
Fernández-Martín et al. (2019) | 4989 estudiantes universitarios | X | X |
Regresión multinomial Clasificación Árboles de decisión |
Deserción (Sí-No) |
Académicos: Habilidades matemáticas y rendimiento obtenido por el estudiantado en el colegio Económico: Condición económica |
Forero et al. (2019) | 3201 estudiantes universitarios de Ingeniería | X |
Clasificación Árboles de decisión |
Deserción (Sí-No) | Académicos: Rendimiento académico | |
Hutagaol y Suharjito (2019) | 17,432 estudiantes universitarios | X |
Clasificación K-vecinos Naive Bayes Árboles de decisión |
Deserción (Sí-No) |
Académicos: Promedio de calificaciones y créditos totales Económico: Ingresos de los padres Sociodemográficos: Nivel educativo de los padres, Género y Edad Motivacional: Asistencia del alumno. |
|
Manrique et al. (2019) | 2175 estudiantes universitarios | X |
Clasificación Naive Bayes Árboles de decisión |
Deserción (Sí-No) |
Académicos: Fallas en cursos de matemáticas Calificaciones de cursos específicos en primeros semestres |
|
Silva et al. (2019) | 940 estudiantes universitarios en Ingeniería | X |
Agrupamiento Reglas de asociación |
Deserción (Sí-No) |
Académico: Promedio académico Motivacional: Desmotivación por elección de la carrera Económico: Preferencia por laborar en vez de estudiar |
|
Vila et al. (2019) | 12,620 estudiantes | X |
Clasificación Bayesiano Árboles de decisión |
Activo/Inactivo |
Sociodemográficos: Estado civil Lugar de procedencia Académico: Promedio de calificaciones Institucional:Tipo de carrera universitaria y modalidad |
|
Viloria et al. (2019) | 19,300 estudiantes universitarios | X |
Clasificación Bayesiano Redes neuronales Árboles de decisión |
Deserción (Sí-No) |
Académicos: Puntaje prueba de admisión Institucional: Beneficios económicos de los estudiantes |
|
Alban y Mauricio (2018) | 1178 estudiantes universitarios | X |
Clasificación Regresión Logística Árboles de decisión |
Deserción (Sí-No) |
Motivacionales y hábitos de estudio: Adicción al internet Uso del internet sin fines académicos |
|
Casanova et al. (2018) | 2970 estudiantes universitarios | X |
Clasificación Árboles de decisión |
Deserción (Sí-No) |
Académicos: Rendimiento académico Institucional: Tipo de estudios realizados Sociodemográfico: Nivel de estudios de la madre |
|
Carvajal et al. (2018) | 169 estudiantes universitarios | X | Regresión multinomial | Deserción (Sí-No) |
Académicos: Posición de la lista al ingreso de la carrera Rendimiento académico |
|
Hernández et al. (2018) | 655 estudiantes de primeros semestres | X |
Clasificación Árboles de decisión |
Obtención del título profesional (Sí/No) |
Académicos: Número de créditos aprobados Promedio aritmético ponderado acumulado Sociodemográfico: Estrato |
|
Hori (2018) | 410 estudiantes universitarios | X |
Clasificación Regresión Logística |
Deserción (Sí-No) | Académico: Rendimiento académico en cursos específicos. | |
Ortiz-Lozano et al. (2018) | 7405 estudiantes de Ingeniería | X |
Clasificación Árbol de decisión |
Deserción (Sí-No) | Académico: Resultados académicos | |
Perez-Castellanos et al. (2018) | 802 estudiantes de ingeniería | X |
Clasificación Árboles de decisión Regresión Logística Bayesiano |
Deserción (Sí-No) | Académico: Rendimiento en los cursos de física y matemáticas | |
Pérez, Grandón et al. (2018) | 4519 estudiantes universitarios | X |
Clasificación Árbol de decisión Regresión Logística |
Deserción (Sí-No) | Académico: Puntaje de ingreso a la universidad en Matemáticas | |
Bungǎu et al. (2017) | 3042 estudiantes universitarios | X | Análisis bivariado | Deserción (Sí-No) |
Académico: Promedio en las calificaciones Sociodemográfico: Lugar de procedencia |
|
Miranda y Guzmán (2017) | 9195 estudiantes de Ingeniería | X |
Clasificación Naive Bayes Redes neuronales Árboles de decisión |
Abandono/no abandono |
Académico: El puntaje de ingreso a la universidad (PSU) Sociodemográficos y económicas: Razones socioeconómicas |
|
Sultana et al. (2017) | 128 estudiantes de Ingeniería eléctrica | X |
Clasificación Árboles de decisión Naive Bayes Regresión Logística Redes neuronales |
Rangos (Deserción, Advertencia, Persistencia) |
Académico: Resultados académicos Motivacional y hábitos de estudio: Calidad del tiempo dedicado a estudiar Institucional: Apoyo de la comunidad universitaria |
|
Timaran y Caicedo (2017) | 6870 estudiantes universitarios | X | Reglas de asociación | Deserción (Sí-No) |
Económico: Cuota de inscripción universitaria Académicos: Promedio en las calificaciones Cursos perdidos en los primeros semestres |
|
Fernández-Chinguel y Díaz-Vélez (2016) | 92 estudiantes universitarios | X | Análisis descriptivo | Deserción (Sí-No) |
Sociodemográficos: Edad de inicio de estudios Desaprobación de asignaturas específicas Motivacional y hábitos de estudio: Horas de estudio por semana Puntaje de fuerza de motivación |
|
Hernandez et al. (2016) | 134 estudiantes universitarios | X |
Clasificación Clustering Árbol de decisión |
Deserción (Sí-No) |
Sociodemográfico: Lugar de procedencia Académico: Resultado académico en asignaturas específicas |
|
Zaria et al. (2016) | 5547 estudiantes universitarios | X |
Clasificación Árboles de decisión Métodos bayesianos y redes neuronales |
Deserción (Sí-No) | Académico: Aprobación y promedio final de asignaturas |
De acuerdo con los estudios revisados, los factores determinantes de la deserción universitaria se pueden clasificar en cuatro aspectos: académicos, los relacionados con la motivación y hábitos de estudio, económicos y sociodemográficos, e institucionales. En la Tabla 4 se categorizan las variables explicativas en estos cuatro factores y se especifica el porcentaje de estudios para los cuales dicho atributo es relevante en la variable objetivo, en relación con la deserción universitaria. Es decir, que el porcentaje corresponde a los documentos que consideran los mismos factores de estudio como los más relevantes. Se enlistan además las denominaciones que utilizan los autores, por ejemplo, para referirse a los resultados académicos de un estudiante.
Variables explicativas (atributos de estudio) | Porcentaje de estudios |
---|---|
Factores académicos | |
Promedio de calificaciones (promedio académico) | 70.9 % |
Resultados académicos | |
Rendimiento académico en asignaturas específicas | |
Cursos aprobados | |
Prueba de admisión a la universidad o pruebas estandarizadas | 29.0% |
Calificaciones en la secundaria | 3.2% |
Factores relacionados con motivación y hábitos de estudio | |
Satisfacción del estudiante | 22.4 % |
Autoconcepto académico subjetivo | |
Motivación por elección de la carrera | |
Expectativas de autoeficacia | |
Percepción del desempeño | |
Motivación intrínseca | |
Adicción al internet | |
Horas de estudio por semana | |
Calidad de las horas de estudio | |
Factores institucionales | |
Tipo de carrera | 12.9% |
Modalidad de estudio | |
Apoyo institucional | |
Beneficios económicos a los estudiantes | |
Factores económicos y sociodemográficos | |
Edad de ingreso del alumno | 51.6% |
Estado civil | |
Preferencia por laborar en vez de estudiar | |
Sexo | |
Nivel educativo de los padres | |
Ingresos económicos familiares |
Dentro de los factores académicos, en el 70.9% de los estudios se evidencia que uno de los atributos más importantes para tomar la decisión de desertar es el rendimiento académico. No obstante, no se encuentra igualdad de criterios respecto a los conceptos de resultados académicos, calificaciones, promedio académico, rendimiento académico, por lo que es usual encontrar la perspectiva en la que el rendimiento académico se asocia con el resultado de las calificaciones en las asignaturas, así fueron agrupados en esta revisión. Por otra parte, los factores relacionados con motivación y hábitos de estudio se asocian principalmente con atributos tales como la satisfacción con la carrera, la autoeficacia, el autoconcepto académico y la calidad del tiempo dedicado a estudiar. Respecto a los factores económicos, la edad, el nivel de ingresos y el nivel educativo de los padres, son los atributos más estudiados. Y por último, dentro del factor institucional, sólo el 12.9% de los documentos analiza la modalidad de estudio, los beneficios económicos desde las instituciones hacia los estudiantes y el apoyo institucional.
Por otro lado, es importante resaltar que el enfoque de los estudios está destinado a explicar los factores académicos luego de un período de ingreso en la universidad, en donde es posible evidenciar los resultados académicos, cursos aprobados y, por tanto, el promedio académico, mientras que los resultados de las pruebas de admisión o las notas de la secundaria no son tan influyentes en el desenlace. Esto coincide con Zaria et al. (2016), quienes demostraron que las variables académicas de ingreso no resultaron ser tan significativas a la hora de predecir la deserción en el primer año, mientras que las variables de desempeño académico trascurrido en por lo menos un semestre (aprobación y promedio final) tienen una alta significancia a la hora de explicar la deserción.
Los resultados de la Tabla 4 sugieren que se deben tener en cuenta factores como la motivación y la autorregulación al diseñar planes de estudio y los planes de orientación de los estudiantes deben incluirse con el fin de lograr el éxito estudiantil (Díaz et al., 2019). En esta revisión se encontró que una causa frecuente del abandono es el desinterés de los estudiantes por las materias. La motivación está estrechamente relacionada con la seguridad con que el estudiante enfrenta las materias, el interés de terminar exitosamente sus estudios y posteriormente graduarse (Donoso-Díaz et al., 2018). Se encontró, además, que uno de los factores más importantes para tomar la decisión de desertar es la falta de motivación por la carrera, seguida de haber desaprobado uno o más cursos y, en tercer lugar, la decisión de los padres (Fernández y Díaz, 2016). Además, los factores adicción al internet, adicción a las redes sociales y adicción a la tecnología podrían afectar la deserción de los estudiantes en las universidades (Alban y Mauricio, 2018).
Es evidente que también en este caso la voluntad de completar los estudios juega un papel importante, pero no debe olvidarse que hay circunstancias que hacen que la continuación de los estudios sea imposible, a pesar de la motivación (Serra et al., 2018). En relación con las variables motivacionales en torno a la deserción se asoció principalmente con el poco interés por la carrera de admisión, la matrícula a una carrera no deseada y que no era parte de la oferta académica de la universidad o el deseo de estudiar en otra institución de educación superior (Hernández et al., 2019).
Con estos resultados, es importante determinar de forma objetiva el nivel de las habilidades que poseen los estudiantes al ingreso, teniendo en cuenta el plan de estudio al cual se enfrentan. Esta información podría ser una herramienta valiosa, junto con la motivación, para tomar decisiones más apropiadas. De igual manera, los estudiantes podrían emprender iniciativas para fortalecer y mejorar sus hábitos de estudio (Vargas y Montero, 2016).
Otro enfoque de estudio encontrado es el seguimiento a la trayectoria de cada estudiante con el fin de observar las desvinculaciones y el desenlace (graduación, deserción o rezago). En su estudio, Castro et al. (2020) concluyeron que la mitad de los estudiantes deserta en los tres primeros semestres, y señalan que aunque los estudios de trayectoria son de gran utilidad porque logran abarcar todo el ciclo que realiza un estudiante desde el ingreso, tránsito y egreso, exige largos períodos de seguimiento, lo que dificulta este tipo de investigaciones.
Se observa un gran potencial de las técnicas de minería de datos respecto a los análisis estadísticos convencionales. El problema principal en la identificación de factores tan significativos en la deserción es que en muchas ocasiones hay más factores candidatos que estudiantes. En este caso, los métodos estadísticos convencionales no funcionan y es pertinente el uso de la minería de datos (Hori, 2018).
Respecto a la técnica, resulta interesante revisar las reglas de asociación. En éstas, se encuentran patrones o dependencias ocultas que pueden indicar cómo la mayoría de desertores están actuando. Por ejemplo, Silva et al. (2019) encontraron que la mayoría de estudiantes que ingresan a carreras de ingeniería tienen una idea errónea del enfoque al momento de inscribirse, además de situaciones económicas para el pago de matrículas. En este sentido, es trabajo de la institución abordar ese problema, por ejemplo, con estrategias tan sencillas como la publicación de convocatorias entre estudiantes.
Tal y como se evidencia en los resultados (ver Tabla 2), el algoritmo más utilizado son los árboles de decisión –un enfoque de división de datos binarios de arriba hacia abajo–, populares debido a su fácil interpretación y bajo sesgo (Behr et al., 2020). Además, se concluye que el método del árbol de decisión es un método más preciso de predicción en comparación con el análisis de regresión (Sultana et al., 2017).
Otro aspecto que vale la pena destacar es que se encuentran muy pocos estudios en los que se evalúa el resultado de una estrategia particular aplicada a mitigar la deserción, es decir, la influencia de una intervención con respecto a los factores explicativos de la deserción. Entre algunos estudios se encuentran planes de tutoría que podrían incluir acciones como videoconferencias, recomendaciones para repetir diferentes actividades, sesiones adicionales de clase; los cursos de recuperación y la creación de comunidades de aprendizaje demostraron tener un fuerte impacto en la retención de estudiantes (Burgos et al., 2018). En este sentido, existe una evidente necesidad de investigar las expectativas de los estudiantes de alto riesgo con respecto a las relaciones entre estudiantes y maestros, debido a que es poco probable que las universidades puedan controlar el fenómeno de la deserción sin estrategias académicas contextuales (Bungǎu et al., 2017).
Entre otras estrategias propuestas, los investigadores insisten en la necesidad de implementar un curso inicial obligatorio, incluido en los planes de estudio para los estudiantes de primer año. Dicho curso debe ser intensivo y ofrecido por los maestros que darán el curso posterior de matemáticas (Aboltins et al., 2019). Como se ha destacado antes, hay una fuerte influencia de la motivación con respecto al rendimiento académico. Otra estrategia planteada por los autores y que puede mejorar los modelos predictivos es la de identificar perfiles motivacionales, diseñar estudios causales, desarrollar programas de aprendizaje de talento y estrategias activas que mejorarían la calidad del aprendizaje universitario (Tipismana, 2019).
Por último, en la mayoría de estudios revisados, se recomienda a las instituciones de educación superior crear programas de acompañamiento y orientación a aquellos estudiantes que se identifiquen con mayor riesgo de deserción (Rueda et al., 2020).
Dentro de los estudios revisados el 92% se enfoca en predecir si un estudiante desertará o no, mediante la realización de una tarea de clasificación, utilizando modelos supervisados en el marco de la IA. El 84% de los estudios analizados utilizó el algoritmo de árboles de decisión, seguido de los métodos probabilísticos (36%) y la regresión logística (28%). De acuerdo con la revisión, los resultados encontrados en esta investigación son similares a los de Agrusti et al. (2019), quienes hallaron que el algoritmo más utilizado fueron los árboles de decisión (67%), seguido de clasificación Bayesiana (49%), redes neuronales (40%) y regresión logística (34%), pero no evidencian cuáles son los factores determinantes de la deserción ni hacen una caracterización de estos procesos desde el punto de vista educativo.
La investigación evidenció que sólo el 6% de los estudios hacen referencia a la evaluación de intervenciones en torno a la deserción. En contraste con lo expuesto por Munizaga et al. (2018), se concluyó que es poco usual encontrar un análisis de los factores explicativos de la deserción, una vez se realiza una intervención concreta; además, no se especifican los algoritmos utilizados, las tareas específicas referentes al análisis de datos ni cuáles son las variables explicativas más influyentes en el fenómeno de la deserción.
Los resultados de esta investigación coinciden con el estudio presentado por Liz-Domínguez et al. (2019), en el que los autores determinaron una prevalencia general de los clasificadores sobre los algoritmos de regresión en estas aplicaciones. En este caso, los algoritmos de regresión se utilizaron principalmente para estimaciones de las calificaciones de los estudiantes y no para la deserción.
Además de los resultados revisados en comparación con estudios similares al que se presentó, se realizaron los siguientes hallazgos: Primero, es importante definir el concepto de deserción, debido a que la variable explicativa no siempre hace referencia al mismo fenómeno. En la revisión se encontraron conceptos como “abandono” y “activo/inactivo”, e incluso hacen referencia a la graduación de los estudiantes; es importante destacar que el concepto de deserción universitaria es diferente al de desvinculación y abandono en ciertos contextos. Segundo, los estudios indican que los factores que más influyen en la deserción universitaria son los relacionados con los aspectos académicos; sin embargo, se evidencia la necesidad de estudiar el rendimiento académico no sólo desde las notas promedio sino bajo un esquema más amplio. No se realiza una diferenciación entre estos conceptos en el nivel de los estudios revisados.
Por otro lado, se encuentra que la mayor cantidad de documentos realiza la clasificación de la variable dicotómica para la deserción o no deserción. Es importante analizar las ventajas y oportunidades que pueden brindar otras técnicas, tales como el agrupamiento y la regresión para evaluar el riesgo en diferentes niveles y crear perfiles de estudiantes que permitan una intervención temprana.
Por último, si bien es cierto que hay un auge en el estudio de este fenómeno por medio de técnicas de inteligencia artificial, se observa que aún es incipiente la evaluación de intervenciones concretas al rendimiento académico para mitigar la deserción y respecto a los aspectos motivacionales, dejando así la puerta abierta para futuras investigaciones en este campo.
Aboltins, A., Atslega, S., Sergejeva, N. y Strupule, L. (2019). One of opportunities to reduce student dropouts. Proceeding of 18th International Scientific Conference Engineering for Rural Development, 1941-1946. http://www.tf.llu.lv/conference/proceedings2019/Papers/N479.pdf
Agrusti, F., Bonavolontà, G. y Mezzini, M. (2019). University dropout prediction through educational data mining techniques: a systematic review. Journal of E-Learning and Knowledge Society, 15(3), 161-182. https://doi.org/10.20368/1971-8829/1135017
Alban, M. S. y Mauricio, D. (2018). Prediction of university dropout through technological factors: a case study in Ecuador. Espacios, 39(52), 1-8. https://www.revistaespacios.com/a18v39n52/a18v39n52p08.pdf
Barragán, D. y Patiño, L. (2016). Elementos para la comprensión del fenómeno de la deserción universitaria en Colombia. Más allá de las mediciones. Cuadernos Latinoamericanos de Administración, 9(16), 55-66. https://revistas.unbosque.edu.co/index.php/cuaderlam/article/view/1248
Bedregal-Alpaca, N., Cornejo-Aparicio, V., Zarate-Valderrama, J. y Yanque-Churo, P. (2020). Classification models for determining types of academic risk and predicting dropout in university students. International Journal of Advanced Computer Science and Applications, 11(1), 266-272. https://doi.org/10.14569/ijacsa.2020.0110133
Behr, A., Giese, M., Teguim, H. y Theune, K. (2020). Early prediction of university dropouts: a random forest approach. Jahrbücher für Nationalökonomie und Statistik, 240(6), 743-789. https://doi.org/10.1515/jbnst-2019-0006
Bravo, M. y Mejía, A. (2010). Los retos de la educación superior en Colombia: una reflexión sobre el fenómeno de la deserción universitaria. Revista Educación en Ingeniería, 5(10), 85-98. https://educacioneningenieria.org/index.php/edi/article/view/101
Bungău, C., Pop, A. P. y Borza, A. (2017). Dropout of first year undergraduate students: a case study of engineering students. Balkan Region Conference on Engineering and Business Education, 2(1), 349-356. https://doi.org/10.1515/cplbu-2017-0046
Burgos, C., Campanario, M. L., Peña, D., Lara, J. A., Lizcano, D. y Martínez, M. A. (2018). Data mining for modeling students’ performance: a tutoring action plan to prevent academic dropout. Computers and Electrical Engineering, 66, 541-556. https://doi.org/10.1016/j.compeleceng.2017.03.005
Camacho, M., Montalvo, A. y Galezo, P. (2019). Determinantes de la deserción estudiantil en estudiantes universitarios. Panorama Económico, 27(1), 134 -162. https://cutt.ly/1nrbc74
Carvajal, C. M., González, J. A. y Sarzoza, S. J. (2018). Variables sociodemográficas y académicas explicativas de la deserción de estudiantes en la facultad de ciencias naturales de la Universidad de Playa Ancha (Chile). Formación Universitaria, 11(2), 3-12. https://doi.org/10.4067/s0718-50062018000200003
Casanova, J. R., Cervero, A., Núñez, J. C., Almeida, L. S. y Bernardo, A. (2018). Factors that determine the persistence and dropout of university students. Psicothema, 30(4), 408-414. https://doi.org/10.7334/psicothema2018.155
Castro-Montoya, B. A., Manrique-Hernández, R. D., Gonzalez-Gómez, D. y Segura-Cardona, A. M. (2020). Trayectoria académica y factores asociados a graduación, deserción y rezago en estudiantes de programas de pregrado de una universidad privada de Medellín (Colombia). Formacion Universitaria, 13(1), 43-54. https://doi.org/10.4067/S0718-50062020000100043
Díaz, A., Pérez, M. V., Bernardo, A. B., Fernández, A. C. y González, J. A. (2019) Affective and cognitive variables involved in structural prediction of university dropout. Psicothema, 31(4), 429-436. https://doi.org/10.7334/psicothema2019.124
Donoso-Díaz, S., Neira, T. y Donoso, G. (2018). Sistemas de alerta temprana para estudiantes en riesgo de abandono de la educación superior. Ensaio: Avaliação e Políticas Públicas Em Educação, 26(100), 944-967. https://doi.org/10.1590/s0104-40362018002601494
Fernández-Chinguel, J. E. y Díaz-Vélez, C. (2016). Factores asociados a la deserción en estudiantes de medicina en una universidad peruana. Educacion Médica Superior, 30(1). https://ems.sld.cu/index.php/ems/article/view/740/322
Fernández-Martín, T., Solís-Salazar, M., Hernández-Jiménez, M. T. y Moreira-Mora, T. E. (2019). A multinomial and predictive analysis of factors associated with university dropout. Revista Electrónica Educare, 23(1), 1-25. https://doi.org/10.15359/ree.23-1.5
Ferreira, M. M., Avitabile, C., Botero, J., Haimovich, F. y Urzúa, S. (2017). Momento decisivo: la educación superior en América Latina y el Caribe. Banco Mundial. http://hdl.handle.net/10986/26489
Forero, L. D., Piñeros, Y. F. y Rodríguez, J. J. (2019). Machine learning for the identification of students at risk of academic desertion. En L. Uden, D. Liberona, G. Sanchez, S. Rodríguez-González (Eds.), Learning Technology for Education Challenges. LTEC 2019. Communications in computer and information science (vol 1011, pp. 462-473). Springer. https://doi.org/10.1007/978-3-030-20798-4_40
Gallegos, J. A., Campos, N. A., Canales, K. A. y González, E. N. (2018). Factores determinantes en la deserción universitaria. Caso Facultad de Ciencias Económicas y Administrativas de la Universidad Católica de la Santísima Concepción (Chile). Formación Universitaria, 11(3), 11-18. https://doi.org/10.4067/s0718-50062018000300011
García de Fanelly, A. (2019). Panorama de la Educación Superior en Iberoamérica. Panorama, portal a la educación. Red Índice-OEI. https://cutt.ly/PnwEEGB
Gironés, J., Casas, J., Minguillón, J. y Caihuelas, R. (2017). Minería de datos: modelos y algoritmos. Universitat Oberta de Catalunya.
González, L. E. y Espinoza, O. (2016). Deserción en educación superior en América Latina y el Caribe. Paideia, Revista De Educación, 45, 33 -46. https://cutt.ly/FnwElzj
Hernandez, A. G., Melendez, R. A., Morales, L. A., Garcia, A., Tecpanecatl, J. L. y Algredo, I. (2016). Comparative study of algorithms to predict the desertion in the students at the ITSM-Mexico. IEEE Latin America Transactions, 14(11), 4573 -4578. https://doi.org/10.1109/TLA.2016.7795831
Hernandez, E. J., Duque, N., Quintero, D. P., Escobar, J. C. y Ramirez, J. (2018). Educational data mining for the analysis of student desertion. https://cutt.ly/inwEvaa
Hernández-Jiménez, M. T., Moreira-Mora, T. E., Solís-Salazar, M. y Fernández-Martín, T. (2019). Estudio descriptivo de variables sociodemográficas y motivacionales asociadas a la deserción: la perspectiva de personas universitarias de primer ingreso. Revista Educación, 44(1), 108-127. https://doi.org/10.15517/revedu.v44i1.37247
Hori, G. (2018). Identifying factors contributing to university dropout with sparse logistic regression. 2018 7th International Congress on Advanced Applied Informatics (IIAI-AAI), 430-433. https://doi.org/10.1109/IIAI-AAI.2018.00091
Hutagaol, N. y Suharjito, S. (2019). Predictive modelling of student dropout using ensemble classifier method in higher education. Advances in Science, Technology and Engineering Systems, 4(4), 206 -211. https://doi.org/10.25046/aj040425
Kemper, L., Vorhoff, G. y Wigger, B. U. (2020). Predicting student dropout: a machine learning approach. European Journal of Higher Education, 10(1), 28-47. https://doi.org/10.1080/21568235.2020.1718520
Lázaro, N., Callejas, Z. y Griol, D. (2020). Factores que inciden en la deserción estudiantil en carreras de perfil Ingeniería Informática. Revista Fuentes, 22(1), 105 -126. https://doi.org/10.12795/revistafuentes.2020.v22.i1.09
León, G. de la C. y Viña, S. M. (2017). La inteligencia artificial en la educacion superior. Oportunidades y amenazas. INNOVA Research Journal, 2(8), 412 -422. https://doi.org/10.33890/innova.v2.n8.1.2017.399
Liz-Domínguez, M., Caeiro-Rodríguez, M., Llamas-Nistal, M. Y Mikic-Fonte, F. A. (2019). Systematic literature review of predictive analysis tools in higher education. Applied Sciences, 9(24), 1-26. https://doi.org/10.3390/app9245569
Manrique, R., Nunes, B. P., Marino, O., Casanova, M. A. y Nurmikko-Fuller, T. (march, 2019). An analysis of student representation, representative features and classification algorithms to predict degree dropout. LAK19: Proceedings of the 9th International Conference on Learning Analytics & Knowledge (pp. 401 -410). https://doi.org/10.1145/3303772.3303800
Ministerio de Educación Nacional. (2008). Deserción estudiantil en la educación superior colombiana. Elementos para su diagnóstico y tratamiento. Ministerio de Educación Nacional. Colombia. https://cutt.ly/InwRvLz
Miranda, M. A. y Guzmán, J. (2017). Análisis de la deserción de estudiantes universitarios usando técnicas de minería de datos. Formacion Universitaria, 10(3), 61-68. https://doi.org/10.4067/S0718-50062017000300007
Munizaga, F. R., Cifuentes, M. B. y Beltrán, A. J. (2018). Retención y abandono estudiantil en la educación superior universitaria en América Latina y el Caribe: una revisión sistemática. Education Policy Analysis Archives, 26, 61. https://doi.org/10.14507/epaa.26.3348
OECD. (2016). Education in Colombia. Reviews of National Policies for Education. https://www.oecd.org/colombia/education-in-colombia-9789264250604-en.htm
Ortiz-Lozano, J. M., Rua-Vieites, A., Bilbao-Calabuig, P. y Casadesús-Fa, M. (2018). University student retention: best time and data to identify undergraduate students at risk of dropout. Innovations in Education and Teaching International, 57(1), 74 -85. https://doi.org/10.1080/14703297.2018.1502090
Pérez, A., Grandón, E. E., Caniupán, M. y Vargas, G. (nov, 2018). Comparative analysis of prediction techniques to determine student dropout: logistic regression vs decision trees. 2018 37th International Conference of the Chilean Computer Science Society (SCCC), 1-8. https://doi.org/10.1109/SCCC.2018.8705262
Pérez, B., Castellanos, C. y Correal, D. (mayo de 2018). Applying data mining techniques to predict student dropout: a case study. 2018 IEEE 1st Colombian Conference on Applications in Computational Intelligence (ColCACI), 1-6. https://doi.org/10.1109/ColCACI.2018.8484847
Ramírez, T., Díaz, R. y Salcedo, A. (2016). El Uso de los términos abandono y deserción estudiantil y sus consecuencias al momento de definir políticas institucionales. Congreso CLABES VI, Quito,Ecuador. https://revistas.utp.ac.pa/index.php/clabes/article/view/1391
Romero, J., Dafonte, C., Gómez, Á. y Penousal, F. (2007). Inteligencia Artificial y computación avanzada. Colección Informática.
Rueda, S. M., Urrego, D., Páez, E., Velásquez, C. y Hernández, E. M. (2020). Perfiles de riesgo de deserción en estudiantes de las sedes de una universidad colombiana. Revista De Psicología, 38(1), 275-297. https://doi.org/10.18800/psico.202001.011
Serra, A., Perchinunno, P. y Bilancia, M. (julio 2-5 de 2018). Predicting student dropouts in higher education using supervised classification algorithms. En O. Gervasi et al. (Eds.), Computational science and its applications- ICCSA 2018. Lecture Notes in Computer Science (vol. 10962, pp. 18-33). Springer. https://doi.org/10.1007/978-3-319-95168-3_2
Silva, J., Arrieta, L., Mosquera, C., Vargas C., Barrios, R., Orellano, N. y Pineda, O. (2020). Prediction of academic dropout in university students using data mining: engineering Case. En V. Gunjan, S. Senatore, A. Kumar, XZ. Gao y S. Merugu (Eds.), Advances in cybernetics, cognition, and machine learning for communication technologies. Lecture Notes in Electrical Engineering (vol. 643, pp. 495-500). Springer. https://doi.org/10.1007/978-981-15-3125-5_17
Silva, J., Castro, A., María, N., Márquez, N., Cadavid, W., Hernández, H., Navarro, J., de la Hoz, J. y Romero, L. (2019). Data mining to identify risk factors associated with university students dropout. In: Y. Tan, & Y. Shi (eds), Data Mining and Big Data. DMBD 2019. Communications in Computer and Information Science (vol. 1071, pp. 44-52). Springer. https://doi.org/10.1007/978-981-32-9563-6_5
Sultana, S., Khan, S. y Abbas, M. A. (2017). Predicting performance of electrical engineering students using cognitive and non-cognitive features for identification of potential dropouts. International Journal of Electrical Engineering Education, 54(2), 105-118. https://doi.org/10.1177/0020720916688484
Timaran, R. y Caicedo, J. (2017). Application of decision trees for detection of student dropout profiles. 16th IEEE International Conference on Machine Learning and Applications (ICMLA), 528 -531. https://doi.org/10.1109/ICMLA.2017.0-107
Tipismana, O. (2019). Factores de resiliencia y afrontamiento como predictores del rendimiento académico de los estudiantes en universidades privadas.Revista Iberoamericana sobre Calidad, Eficacia y Cambio en Educacion, 17(2), 147-185. https://revistas.uam.es/reice/article/view/reice2019.17.2.008
Vargas, M. y Montero, E. (2016). Factores que determinan el rendimiento académico en matemáticas en el contexto de una universidad tecnológica: aplicación de un modelo de ecuaciones estructurales. Universitas Psychologica, 15(4), 1-11. https://doi.org/10.11144/Javeriana.upsy15-4.fdra
Vila, D., Cisneros, S., Granda, P., Ortega, C., Posso, M. y García, I. (2019, agosto 29-31). Detection of desertion patterns in university students using data mining techniques: a case study [Revised Selected Papers 4]. Technology Trends: 4th International Conference, CITT. Babahoyo, Ecuador.
Viloria, A., García, J., Vargas-Mercado, C., Hernández-Palma, H., Orellana, N. y Arrozola, M. (2019). Integration of data technology for analyzing university dropout. Procedia Computer Science, 155, 569-574. https://doi.org/10.1016/j.procs.2019.08.079
Viloria, A., Sierra, D., Garcia, M., Basto, W., Pichón, A., Hernández, H., Diago, V. y Kamatkar, S. (2020). Dropout-Permanence Analysis of University Students Using Data Mining. Intelligent Computing, Information and Control Systems, 1, 374-383. https://doi.org/10.1007/978-3-030-30465-2_42
Zaria, C., Arce, C., y Lam, J. (2016). Estudio de variables que influyen en la deserción de estudiantes universitarios de primer año , mediante minería de datos. Ciencia Amazónica, 6(1), 73 -84. https://doi.org/10.22386/ca.v6i1.110