Oozie 的 workflow 案例集,比较全,适合你开发调度流程的时候参考。Hadoop
作业的。嗯,说白了就是你不用从 0 搭流程了,直接拿来改挺省事儿。
Oozie 本身是跑在Tomcat
里的Java Servlet
程序,用XML
写 workflow,比较像你在画流程图那种思路——定义干啥、顺序怎么走。你要是做过Airflow
或者Azkaban
,会发现它们思路也差不多。
这个压缩包里包括了各种类型的 workflow 案例,比如MapReduce
、Hive
、Shell
任务,连coordinator
和bundle
也有,对新手还挺友好,老手也能直接复用一些结构。
你调试 workflow 的时候,可以先看下这些案例的结构,变量怎么传、job.properties
怎么写都挺有参考价值的。别忘了配好环境变量,路径和Hadoop
集群地址那些要注意。
如果你还在摸索Oozie
的配置或者 workflow 语法,建议你也看看这几个文章,里面有不少细节讲得蛮实用的:
如果你正准备用Oozie
做 Hadoop 作业调度,直接上手这套 workflow 案例会省不少时间。代码清晰、结构规范,蛮适合实战演练。