心理因素与学业表现:机器学习分类预测模型 |
| |
引用本文: | 丁欣放,聂晶,张斌.心理因素与学业表现:机器学习分类预测模型[J].心理科学,2021,0(2):330-339. |
| |
作者姓名: | 丁欣放 聂晶 张斌 |
| |
作者单位: | 1. 首都医科大学;2. 北京大学; |
| |
摘 要: | 随着高等教育规模的扩大,学业表现不良逐渐成为一个不容忽视的现象,对学业表现不良的学生进行预测并提早给予干预可降低退学率并减少教育资源的损失。由于导致学业表现不良的因素众多且关系复杂,传统的基于相关分析的研究方法很难建立早期预测模型并进行应用。本研究旨在利用机器学习算法,对数据进行挖掘,并建立学业表现预测模型。研究对653名大一新生的心理健康状况、应对方式、人格、内外控倾向和相关人口统计学信息进行了收集,并在一年后采集了其学业成绩,利用随机森林(RF)、K邻近(KNN)、支持向量机(SVM)、决策树(DT)、朴素贝叶斯(NB)等机器学习算法建立了分类模型。结果显示,随机森林算法在识别学业表现不良学生时有最好的表现,其中准确率95.86%, 召回率91.83%,f1分数为93.80%。特征重要性分析显示,前10个对模型有最高贡献度的特征包括:年龄、性别、是否为独生子、内外控倾向、神经质倾向、积极应对倾向、宜人性倾向、一般症状指数、开放性倾向和焦虑水平。为避免过度拟合问题,本研究在一年后收集的166名新生样本中进行了模型验证,结果显示模型在新数据集上有较好的泛化表现,其中f1分数90.90%,准确率92.60%,召回率89.26%。研究提示基于人口统计学和心理测评信息,机器学习算法有助于及早识别学业表现不良学生并为开展早期干预提供启示。
|
关 键 词: | 学业表现 机器学习 预测 心理因素 分类预测模型 |
收稿时间: | 2020-05-16 |
修稿时间: | 2020-12-17 |
|
| 点击此处可从《心理科学》浏览原始摘要信息 |
| 点击此处可从《心理科学》下载免费的PDF全文 |
|