选择模型评估方法的 PPT,讲得挺接地气,适合做实验参考用。用训练集、测试集、交叉验证、比例切分这几种方式来评估模型,说得比较明白,是交叉验证的折数设置,讲得还挺细。做机器学习实验的你,拿来当个思维框架还挺有。
交叉验证的部分说得蛮实用,像 10 折、5 折怎么选,用在哪些情况,这 PPT 里基本都提到了。结合下面的相关代码资源,像 EEG 用 KNN 做 10 折验证的例子,就挺有借鉴意义。
训练集和测试集的对比也讲得清楚,尤其是Percentage split
的做法,多新手容易忽略这个评估方式,但在数据量比较大时,这种分法其实蛮高效。
你要是用 Weka、Matlab 这类工具跑模型,不妨看看相关资源,比如Weka 加载数据、Eka 训练测试这些,配合着 PPT 理解更顺手。
还有一点,虽然 PPT 是中文写的,术语翻译也比较口语,但理解起来没啥压力,适合想快点上手模型评估的同学。
如果你正准备做数据挖掘实验或者搞机器学习模型优化,建议把这个 PPT 和后面这些资源结合着看,思路更清晰,效率也高不少。