英文文章修正的实验项目,用的是 NLP 技术来自动改文章里的定冠词,挺适合做语法或者教育类产品的。代码全是用 Python 3 写的,依赖也比较常见,像是NumPy、Pandas这些。如果你用过Anaconda,那安装环境就更轻松了,基本一装就能跑。数据方面用的是UMBC WebBase 语料库,内容量蛮大的,适合训练模型。
项目目录下的代码结构还算清晰,适合快速上手。要是你想试试自动校正文法,是英文文章里的冠词(像“a”和“the”这种小词),这个项目可以说是现成的起点。改改模型结构或者调整语料也都挺方便。
哦对了,如果你对数据感兴趣,可以顺手看看这些资源:
如果你刚好在做英文语法纠错或是教育类 AI方向的东西,这个代码资源真的蛮值得看一眼的。
注意:代码运行需要Python 3环境,推荐直接装个Anaconda,省事不少。语料库用的是UMBC Ebiquity WebBase Corpus
,要提前下载好。