数据挖掘领域的老朋友,Web 数据挖掘这本书的第二版,内容更新得还挺及时。Bing Liu 写的,逻辑清晰,思路也实用,适合想搞清楚爬虫、信息整合这些常见任务的你。
结构化数据的抽取讲得蛮细,还带着一点实际操作的味道,不会太学术。像观点挖掘这种听着高大上但做起来接地气的技术,这本书也有,属于那种“看得懂又能用”的类型。
书分两部分,前半段是数据挖掘基础,后半段就往 Web 上靠了,讲用户行为、链接这些内容,思路比较系统,看下来不会东一块西一块。
如果你平时有写数据可视化或做后台的需求,这书还挺值得一翻的。有空的时候翻翻,不亏。如果你还想深入了解,比如非结构化内容怎么搞,这几篇相关文章你也可以看看。