Coursera 的课程评论数据集挺有意思的,适合用来做一些关于课程评价的研究。数据集包含了来自 Coursera 的 10 万多条课程评论,基于评分将评论划分为积极、积极、中性、负面和差五个等级。对于研究不平衡数据集的同学,这个数据集还挺有挑战的哦。你可以通过review.tsv文件查看单条评论和评分,也可以用reviewbycourse.tsv按课程 ID 查看评论分组。如果你要类似的评论分类问题,这个数据集会帮到你。
如果你有兴趣深入了解,还可以参考一些相关文章来优化你的算法和模型,例如PCBoostlibsvm的使用。