分类论坛帖子的利器 edxclassify,是个还挺实用的机器学习工具包,尤其适合搞 MOOC 教育研究的朋友。它是斯坦福一年研究的成果,拿来论坛里学生的情绪、行为都比较靠谱,准确率也还不错。

edxclassify 的分类器挺通用的,不光能识别情绪,比如混乱、积极、求助,还能侦测学习行为变化。像想搞点自动干预逻辑的,这工具就方便。比如学生一发帖一脸懵,你的代码就能自动推个 FAQ 过去,挺省事的。

训练数据是从斯坦福 MOOC 论坛里扒出来的,质量还行。里面封装好的模型基本能直接上手用,省了不少调参数的麻烦。你要是有自己的语料,也能改一改,模型结构比较灵活。

嗯,还有一点,这工具里打包的分类器不是死板的规则匹配,都是机器学习训练出来的。你可以直接拿edxclassify去跑自己的数据,稍微改下格式就行。

如果你平时要学习社区,或者给教学系统加点“智能”,这个项目可以当个好的起点。感兴趣的话,可以顺带看看他们在教育数据挖掘会议上的论文,会更有感觉。