Streaming 开发的特点挺有意思的,简单来说,Hadoop Streaming 让你通过标准输入传递数据给 map/reduce 程序,再通过标准输出将结果返回给 Hadoop。这种方式主要是通过将问题转化成(key, value)对来进行,感觉符合大数据的逻辑。你可以把整个过程分成多个(map, reduce)阶段进行,而默认情况下,key 和 value 之间是 分隔的,简单明了。如果你有需要做数据流,Hadoop Streaming 简直是个不错的选择。