一般我们说微批,是指spark这种 一条stream里,如果有多个stateful之类的操作,需要一个batch一个batch 处理并造成 链越长,积累效果越厉害的 后果(假设平均链里的一个节点处理一个batch需要时间为x,链里有100个节点,那么latency至少是100x;而flink的 设计是没有这个缺点的,也就是说即使source是微批,整条stream的latency也不过是x而已;这也是为什么现在spark 新一代continous tream改成和flink一样的设计的原因;
spark和flink对比