企业数据架构的痛点,数据湖是个挺好的解法。能放结构化、半结构化,甚至乱七八糟的原始数据,先存起来再说,灵活性高。

Practical Enterprise Data Lake Insights》就是专门聊这个的,从底层架构、数据集成到治理、安全、元数据、,几乎一网打尽。

有意思的是,它不光说概念,还配了多案例实操建议,比如怎么选技术栈、怎么搞数据迁移,甚至连企业预算和性能优化都讲了。

你要是搞大数据平台、做数据工程或者想搭个企业级的数据湖,这本书挺能帮上忙的。书里的思路、踩坑经验都接地气,适合实战。

哦对了,书里还讲了和HDFSNoSQL数据仓库打交道的技巧,不是一味堆技术名词,而是教你怎么选、怎么用。

如果你对数据湖项目还不太熟,可以先看下这个大数据与机器学习算法的资料,入门快。