Azkaban 的单机模式编译包,蛮适合自己折腾或者小团队试水用的。你只要下载个azkaban-solo-server-3.33.0-1-g23f0cf2.tar.gz
,解压一下,改几个配置,基本就能跑起来了,连数据库都可以用内置的 H2,真的挺省事。
单机模式就是图个方便,Web 界面、执行器、数据库都装在一台机器上,测试任务、搞流程演示都挺顺。你像开发 Spark 或 Hive 任务,整完直接丢上去跑一下,也不怕配置一堆分布式环境。
包里该有的都有,Web Server、Executor、配置文件、JAR 包、脚本、文档,结构也清晰,文件不乱,挺好上手。像conf/azkaban.properties
这些,改端口、日志路径什么的都靠它。
你启动服务后,浏览器里打开默认端口(一般是8081
),登录进去就能开始创建项目、上传.job
文件、配置依赖,整套流程下来蛮丝滑。想调度定时任务?用 cron 表达式就能搞定。
不过你要是跑着跑着发现单机扛不住,后面也可以平滑迁移成多 Executor 架构,支持集群、负载均衡啥的。加个 Prometheus 或 Grafana 还能做监控,日志这块用log4j
也挺方便。
哦对,编译包里自带的文档还挺良心,快速上手不是问题。如果你是刚开始用 Azkaban,这个包真的推荐一试。要是你有兴趣深挖,也可以看看 Azkaban 编译包详解 这种资料,对理解架构也有。
如果你平时搞大数据调度,或者想找个不那么复杂的工作流引擎,Azkaban 单机模式真的是个不错的起点。