自动化运维平台的核心是自适应 MapReduce,挺适合做那种网络设备量大、更新频繁的场景。你要是平时折腾宽带接入设备,老是跑命令、拉数据,那这个平台真挺省事的。
平台的亮点在于它会根据服务器负载自动分配计算资源,像是动态调度一样,任务多了就开更多线程,任务少了就休息下,响应也快,资源也不浪费。
比如做设备信息采集、清理冗余数据这些事,一般都要写脚本、调命令、对表格。但这平台一接入后,多都能自动化搞定,还支持并发计算,速度快不少。
实际效果也还不错,多电信项目上线后,用这个平台跑任务,一次能管一大片设备,不用一个个操作,效率翻好几倍。你要想进一步研究,推荐你看看这些资源:
Hadoop YARN 框架及其资源调度机制了解下它底层调度逻辑,和这平台的思路像。
自动化部署 MySQL 脚本和Redis 自动化部署方案,你要是搞数据库相关的运维,也能无缝接入。
还有一个比较全能的运维工具是CacheCloud 自动运维工具搭建指南,可以参考下怎么组织模块。
如果你也在做批量设备管理、减少手工操作,那这个平台思路值得借鉴,可以按你业务特点做定制化改造。