Strom实时流处理大数据框架

Strom组件Topology定义了一个实时应用程序在storm中的运行结构。Nimbus负责分配资源和调度任务，Supervisor负责管理worker进程的启动和停止。Worker是执行具体组件逻辑的进程，每个spout/bolt的线程称为一个task。Spout生成源数据流，Bolt接收并处理数据。Tuple是消息传递的基本单位。Stream grouping定义了消息的分组方法。