中文分词用的ik-analyzer-8.4.0.jar,说实话,用过一次就不太想换别的了。兼容Elasticsearch,中文搜索还挺准,适合那种搜索需求比较复杂的业务场景。

ik 的分词逻辑走的是词典匹配路线,尤其适合人名、地名这种有明确边界的词。你用它搭配Elasticsearch一起搞全文搜索,效果还蛮不错的,查询速度也不慢。

文件是个.jar包,装起来挺方便,扔进plugins目录重启一下就行。之前用 6.x、7.x 版本的分词器也不错,现在 8.4.0 的这个更新支持性更好,稳定性也提升了。

想更深入搞清楚怎么用,可以看看下面这几个链接:

如果你在用Elasticsearch做中文搜索,或者老觉得系统分词不靠谱,可以试试这款,稳定、兼容性也强。