Kettle 的资源库表结构,还挺值得研究的,尤其是你要在团队里做流程版本管理或者同步开发的话。资源怎么存、怎么调,用好了真的省不少事。这个资料里讲得蛮细的,表结构、字段含义、还有怎么配合 Kettle 图形化界面来理解,基本都能对上。你要是平时都是本地存.ktr、.kjb 文件,那用资源库能不少协作问题,挺香。

Kettle 的资源库其实就一套数据库表,用来存你画好的转换和作业。比如表r_transformation里存的就是转换流程的基本信息,r_step对应每个步骤,字段命名比较直白。查这些表,能帮你更清楚地了解底层是怎么组织的。

r_jobr_jobentry这些表,看名字你就知道是搞作业流程的,配合图形化界面一用,嗯,还挺直观。文档里有表结构图和字段解释,对照起来比较轻松,调试时也好用。

要是你在折腾多环境部署、或者想做点自动化管理,比如把流程自动同步到资源库,那这个资料就挺实用。顺手提一句,别忘了做个resource-backup脚本,数据库挂了恢复也快。

如果你还没入门,推荐先看看ETL 工具 Kettle 用户手册详解,再啃资源库部分会顺点。如果你已经开始用资源库了,强烈建议研究下Kettle 图形化 ETL 工具这篇,也有多实践细节。

嗯,提醒下:资料是学习用的,版权方面你看下原地址,别直接商用哈。