Oozie 的 workflow 案例集,比较全,适合你开发调度流程的时候参考。里打包的是 Cloudera 贡献给 Apache 的 Oozie 官方案例,用来跑Hadoop作业的。嗯,说白了就是你不用从 0 搭流程了,直接拿来改挺省事儿。

Oozie 本身是跑在Tomcat里的Java Servlet程序,用XML写 workflow,比较像你在画流程图那种思路——定义干啥、顺序怎么走。你要是做过Airflow或者Azkaban,会发现它们思路也差不多。

这个压缩包里包括了各种类型的 workflow 案例,比如MapReduceHiveShell任务,连coordinatorbundle也有,对新手还挺友好,老手也能直接复用一些结构。

你调试 workflow 的时候,可以先看下这些案例的结构,变量怎么传、job.properties怎么写都挺有参考价值的。别忘了配好环境变量,路径和Hadoop集群地址那些要注意。

如果你还在摸索Oozie的配置或者 workflow 语法,建议你也看看这几个文章,里面有不少细节讲得蛮实用的:

如果你正准备用Oozie做 Hadoop 作业调度,直接上手这套 workflow 案例会省不少时间。代码清晰、结构规范,蛮适合实战演练。