Hadoop 的 ResourceManager API 挺实用的,尤其是在你想实时掌握集群状态的时候。

比如ClusterInformationAPI,直接告诉你集群的基本信息,版本号、构建时间这些全都有,调用方式也简单,GET 一下/ws/v1/cluster/info就行,接口响应快、结构也清爽。

再说ClusterMetricsAPI,它是我比较常用的一个,集群有多少 App 在跑?内存用了多少?节点健康不健康?通通一目了然。监控、告警都能靠它搞定,省得你再手动去查日志。

调度信息的事就交给ClusterSchedulerAPI。不管你用的是 FIFO 还是 CapacityScheduler,它都能把各个队列的容量、使用情况、类型一一列出来。你要优化资源分配,这个接口信息还挺关键的。

接口统一用 GET,基本不用带参数,返回的内容结构化得不错,JSON 格式友好,用curl测试也方便。如果你在做集群监控系统或者故障工具,推荐你直接接这些 API。

嗯,想深入一点的,还可以看看Hadoop 2 API 文档,有更全的接口。