Modelos de machine learning para predecir el no logro de sustentación de tesis al año de egresado en una universidad pública del Perú

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Nacional de Huancavelica

Abstract

El objetivo fue identificar el modelo que predice el no logro de sustentación de tesis al año de egreso en la Facultad de Zootecnia–UNCP. Se analizó una cohorte de 67 egresados, con variables académicas (PPA, TDP, repitencias), personales (motivación, estado emocional, eventos familiares), socioeconómicas (ingresos, apoyo familiar) e institucionales (investigación, tutorías, apoyo del asesor). Las variables continuas se estandarizaron; los ítems Likert se codificaron con one-hot; las dicotómicas se mantuvieron sin transformación. Se compararon Regresión Logística, Random Forest, Gradient Boosting, Árbol de Decisión y SVM-RBF. Con validación estratificada 70/30, se evaluaron AUC, accuracy, F1, recall, precision y métricas de error (MSE, CV). Random Forest mostró el mejor desempeño (AUC=0.79; accuracy=0.76; F1=0.71), con IC bootstrap [0.544–0.959] sobre el azar. La Regresión Logística alcanzó AUC=0.764 y alta precisión para la clase positiva, con sensibilidad moderada. SVM-RBF, Gradient Boosting y Árbol de Decisión tuvieron rendimientos menores. La importancia de variables destacó duración del pregrado, ingreso familiar, pérdida de un familiar, participación en investigación, motivación y apoyo del asesor como predictores-clave. Se concluye que Random-Forest es la herramienta más fiable y que intervenciones focalizadas en acortar el pregrado, fortalecer la motivación y mejorar el acompañamiento académico podrían aumentar las tasas de sustentación.

Description

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess