C#写的统计工具你用过吗?SATI3.2这玩意儿还挺适合搞文献题录的那一套。能各种格式的数据,像EndNoteNoteExpress啥的,甚至连Web of Science的 HTML 都能整进来,直接一键转成 XML,效率高不少。

文献导进来之后,提关键词、数频率、建矩阵这些事它都能干。你要是搞共词或者是想画个网络图,它也支持。图形化能力蛮强,像是多维尺度、战略图啥的,配合SPSSUcinet这些工具一起用,效果更好。

初学者用 SATI 也不用怕,按步骤来就行:导数据、转 XML、选字段、做统计,图出来一看就明白了。比如几千篇图书情报类的论文,就能看到三个研究主题是怎么聚起来的,哪个领域热点在哪儿一目了然。

比较贴心的是,它还带预功能,能把那些没营养的词先过滤了,像停用词词干提取这些都能搞定,省得你手动折腾。你要搞知识图谱、做推荐系统之类的,也有不少配套资源可以参考。

如果你正在做文献,又不想一头扎进复杂的大数据框架,那SATI3.2其实是个还不错的选择,轻量又实用。对了,官方文档不多,建议边用边看网上的案例,效率高多了。