系统架构的类比挺实用的,MapReduce 和 Samza 的对比讲得比较清晰。你要是想搞明白流和批的差别,这篇文章适合上手。KafkaYARNSamza API这些核心模块都有讲,理解架构思路不再靠猜。文中还提到执行层和流层是可插拔的,这点挺关键,灵活性强,能根据项目需求换组件。对比来看,MapReduce搞批,Samza做流,各有优势,搭配得当能少踩不少坑。