ADM2017 的代码仓库是那种你看一眼就会想 fork 下来的资源。它围绕STEM 职业预测这个话题,结合了深度知识跟踪(DKT)和机器学习模型,目标挺有意思:预测一个学生未来是不是会从事 STEM 相关的工作。更妙的是,它不是拍脑袋预测,而是用学生在中学阶段的点击流数据来做,挺实在。

用过DKT的人会知道,它是个专门拿来跟踪学生知识掌握状态的模型。作者还整合了一个增强版DKT+,效果上有不少提升。你可以先拿这些模型把学生的知识状态给估出来,再搭配学生背景信息,喂进机器学习模型,比如逻辑回归随机森林之类,去预测学生将来的职业方向。

整个流程蛮清晰:先建知识状态、再拼特征、跑预测。而且代码写得还不错,不臃肿,注释也清楚。如果你正在研究教育数据挖掘或者想做点关于学生行为预测的项目,这份资源还是挺值得一看的。

对了,它用的数据是 ASSISTments 平台的,公开可获取,适合复现和改造。如果你想自己试一把,不妨从这个仓库下手。