Python携程评论爬虫

携程的评论页结构还挺规整的，用 Python 写个爬虫抓评论其实不难。这份代码就是干这个的，逻辑清楚，模块也拆得比较利索。用的是requests加正则文本，再配合json解析，响应也快，代码也简单，挺适合你快速上手做数据采集。

评论内容分页加载？没关系，代码里已经了翻页逻辑。抓下来的内容可以直接转成结构化数据，接到你自己的脚本上也方便。你要是想用在机器学习里做情感，这个就比较省事了。

而且哦，它没用什么复杂的框架，全程纯 Python，配个环境就能跑。如果你比较熟 Hadoop，可以搭到自己的数据平台上跑大批量。

顺带给你几个相关链接，像GitHub 项目评论的爬虫和情感预测代码，都挺有参考价值的。如果你还没接触过携程的数据结构，也可以看看大数据平台实践，会更有感觉。

如果你最近正好在做旅游类数据，或者想练练数据采集的手感，不妨试试这段代码。记得加个异常，网络波动或者页面结构变了也不怕崩。