matlab 操作 MediaWiki 的利器 MatWiki,用起来还挺顺手的。这个库专门搞定跟MediaWiki HTTP API打交道那些事儿,尤其是在登录时要Cookie和重定向,平时用手撸真的挺麻烦,用它省心多了。

MatWiki 的用法也简单,像下面这段:

url = 'http://some.wiki.org/wiki/api.php';
mw = MWSite(url).login('Ankostis@test', 'qu8hqc8f07se3ra05ufcn89keecpmgtk');
results = mw.askargs('Category:Cars', 'Vehicle OEM', 'limit=3');
disp(jsonencode(results));

你就能直接查 Semantic Wiki 分类下的数据了。响应也快,返回的内容结构清晰,做数据也方便。

还有一点值得一提,它记录求日志方便,调试的时候看看mw.History就行,出错也好定位。对于搞Semantic MediaWiki数据提取的项目来说,真的蛮好用。

如果你平时用 Matlab 做知识图谱、数据抓取,或者 Wiki 结构化内容,MatWiki 还是值得一试的,安装也简单,不依赖额外包。