C#写的统计工具你用过吗?SATI3.2这玩意儿还挺适合搞文献题录的那一套。能各种格式的数据,像EndNote
、NoteExpress
啥的,甚至连Web of Science
的 HTML 都能整进来,直接一键转成 XML,效率高不少。
文献导进来之后,提关键词、数频率、建矩阵这些事它都能干。你要是搞共词
或者是想画个网络图,它也支持。图形化能力蛮强,像是多维尺度、战略图啥的,配合SPSS
、Ucinet
这些工具一起用,效果更好。
初学者用 SATI 也不用怕,按步骤来就行:导数据、转 XML、选字段、做统计,图出来一看就明白了。比如几千篇图书情报类的论文,就能看到三个研究主题是怎么聚起来的,哪个领域热点在哪儿一目了然。
比较贴心的是,它还带预功能,能把那些没营养的词先过滤了,像停用词
、词干提取
这些都能搞定,省得你手动折腾。你要搞知识图谱、做推荐系统之类的,也有不少配套资源可以参考。
如果你正在做文献,又不想一头扎进复杂的大数据框架,那SATI3.2其实是个还不错的选择,轻量又实用。对了,官方文档不多,建议边用边看网上的案例,效率高多了。