中文文本里的情感分类,说白了就是判断一句话是褒义还是贬义。正面情感词语这份资源用起来挺方便的,词覆盖面也比较广。常见的褒义词像“赞美”、“优秀”、“贴心”这些都囊括了,适合你做关键词提取或情感打分模型。

情感模型的效果,大程度上就看你词库靠不靠谱。这个正面词库是配套的,跟负面情感词、极值表那些能一起搭着用,效果更稳定。如果你用的是朴素贝叶斯、TF-IDF 这类传统模型,那更要配一个干净的词表。

哦对了,除了词语本身,还有不少相关资源我觉得也值得收藏,比如中文情感词库(含极值表)大连理工大学的情感本体库,对标注和分类都蛮有参考价值。你可以点下面链接去看看,资源都可以直接下载:

中文情感词库(含极值表)首版详解
大连理工大学中文情感词汇本体库
中文负面情感词语
中文情感文本标注语料库

如果你是做舆情、评论抽取这种方向的,强烈建议把这个正面词库和其他情感资源搭配使用。嗯,效果会比单独用模型好不少。