爬虫联系二的练习文档,格式清爽,内容是偏基础的那种,适合刚接触爬虫的同学拿来练手。嗯,虽然只是个.docx
文档,但该有的基本流程都有,比如如何发求、解析数据这些。你要是平时用requests
和BeautifulSoup
,看这个还挺顺的。
文档里的例子不复杂,大多是从静态页面抓取内容,适合一边看一边自己敲一遍试试,效率高不少。对了,还有几个相关链接我觉得也挺实用的,比如那个抓动物农场数据的练习,场景更实战。
,想学爬虫但不知道从哪下手的,先从这个入门级的练练手准没错。别忘了配合一些网络调试工具用,比如Fiddler
或者浏览器的开发者工具,看求走没走对,思路会清晰多。
如果你已经能写xpath
或者搞ajax
接口了,那就觉得这个有点太入门了。但用来给新人、带学,或者当作模板参考,还是蛮方便的。