中文情感里的情感词汇库资源,极值表算是比较实用的一类。基于词典的方法情感,不需要大量训练数据,直接就能上手。而且它还结合了像知网 Hownet和NTUSD这类成熟词典,覆盖面挺广,词性也得比较细。你想要快速跑个评论分类、微博倾向判断,用它省事多了。
词语、句子、段落级都能用,灵活性蛮高,像你要电影评论、产品评价,直接扩展出行业词典就更精了,提升还挺。哈工大的《同义词词林》也能用,拓展词表的覆盖率。
而且你看它结合MySQL结构,还有一堆相关优化资源,比如数据库里的同义词设计、视图应用,配合起来效率也不错。链接也一应俱全,情感的词典汇总、情感词优化代码这些都能直接上手。
如果你正在做中文文本的情感,尤其想少踩坑、不想一开始就上机器学习那一套,先用这种词典法试试,效果还真不赖。