华为的 FusionInsight HD 6.5.1 文档是个还不错的资源,适合做大数据的你翻一翻。分布式架构支持各种类型的数据整合,查询也不含糊。嗯,像那种每天和 PB 级数据打交道的项目,用它还挺稳当的。
数据、调度优化都做得比较系统,支持可视化、原始数据建模,还有个开发环境直接嵌进去。你可以把多个业务系统的日志拉进来,原样塞进 HDFS,配合MapReduce或者Spark跑,响应也快。
文档是CHM
格式的,查找内容方便,索引、目录啥的也都有,懒得翻官网时拿它补补还挺香。尤其是新手刚接触FusionInsight,先看看文档了解它的组件、任务调度方式和权限模型,再动手不容易踩坑。
要是你平时也折腾Python数据、搞点可视化,不妨搭配下列资源一起看,像Python 数据与可视化示例这种,挺有的。也别忘了看看Hadoop,毕竟整个系统底子是靠它起的。
如果你最近正打算搞企业级的数据中台建设,或者项目要跑复杂 ETL 流程,可以先翻一翻这文档。了解清楚调度机制、资源池配置啥的,后面项目推进会轻松多。