实时计算的机会和挑战,一直是做流的朋友绕不开的话题。Flink的流式能力,真的是业界里比较能打的那一档。不光吞吐高,响应也快,而且还能灵活扩展,批量任务也不含糊。

文章里讲得挺全,从性能实时性可扩展性,连遇到的难点也没绕过去,比如速度准确性这种卡脖子问题,说得还挺接地气。

对我来说,比较实用的是它对Flink 发展史的梳理。像什么 Incremental Checkpoint、Credit Based Flow Control 这些,放在实际项目里,能帮你定位性能瓶颈。

另外推荐你顺手看看几个相关资源,比如Flink 实时计算框架Learning Apache Flink,对理解它的应用场景和用法还挺有的。

如果你最近正好在搞流或者想把实时数仓搞起来,那这份 PDF 还蛮值得一读的。记得注意下系统的扩展能力延迟,这俩是做实时计算绕不过去的坑。