AEL Spark最佳实践指南（配套PDI 2.0）

AEL Spark 引擎的最佳实践指南，讲得挺细。配合 Pentaho Data Integration（PDI）用，还能跑在 Spark 上，挺适合搞大数据的你。如果你用过 Kettle，对 ETL 流程比较熟，文档里那套并行和案例会让你豁然开朗。像是统计 WordCount 那段，就挺直观，帮你理解怎么在 YARN 和 HDFS 上扩展能力。PDI 怎么配、AEL 怎么装、Spark 怎么接，全都有，而且步骤蛮清晰。想试试从传统 Kettle 切 Spark？这份文档你得好好看看。