情感项目的词典资源用过不少,这份整理真的挺全。常用的知网 HowNet中文极性词表PySentiment都有,甚至连微博情感标注语音情感库也收录了。你要是做文本情感分类或者评论情绪识别,用它打底蛮稳的。

情感词典的种类覆盖挺广,从词语极性语音特征,你可以按项目需求自由组合。比如想做短文本,中文负面词语就蛮实用的;要是搞社交平台内容,那个微博评论情感标注也别错过。

PySentiment的好处是可以直接嵌到Python代码里跑模型,省不少时间。嗯,如果你还在做Spark流程,文档里那篇Spark 文本情感指南也比较清晰,挺适合大规模数据。

几个资源都是.zip格式的词典包,下载完解压就能用,结构也比较直观。注意有些文件里带的情感极值表别忘了参考,调模型的时候权重分得更准。

如果你平时搞的是民宿、商品类评论,可以看看Python 构建情感平台那篇,用例实在,能直接套思路。要玩得深点,那个SAofReddit也挺有意思,挖掘+一体。

,这些资源整合起来用,能帮你搭起个不错的情感词典系统。做中文文本的你,建议赶紧收藏。