1 万 4 千多条汉字拆分数据的 ACCESS+EXCEL 合集,适合搞汉字教学、识字辅助、自然语言的朋友用。每个字都拆得挺细,比如“数”是“娄/攴”,“敝”还细到了“丷/巾/八/攴”。拆得这么透,做汉字真的省不少事。
结构清晰的 ACCESS 数据文件,字段命名直白,用 SQL 查数据也顺手。配的 Excel 表也挺贴心,平时浏览或小范围就靠它,响应也快,导出方便。用vlookup
配合其他词库也没啥压力。
如果你在做汉字识别、OCR 预、或者汉字教学系统,这份数据绝对值。比如你想知道哪些字带“攴”部首?查一下就出来,别说用来做字频,搞部首分类题库也合适。
嗯,还有个更多数据.txt
,是附加注释或特殊拆法,建议别忽略。研究古文字、对比手写字体的朋友应该会用得上。
如果你本身在用Matlab
、SQLServer
、Python
搞文字,这套数据挺适合对接成你自己的数据源。想联动五笔、拼音也有现成资料,顺着相关链接就能找。
哦对了,ACCESS 文件别忘了备份下,防止误操作;Excel 别超 6 万行,毕竟也不是数据库。
如果你正好在做字库、汉字教学、甚至汉字游戏,不妨下来看下,能省你不少整理功夫。