什么是Flink
Apache Flink 是一种分布式流处理引擎,它允许实时处理数据流。
在Flink框架当中,所有的任务当成流来处理,因此实现了更低延迟的实时流处理。
Flink特点
1.处理无界和有界数据
能够运行任何处理无界流的应用,有界流则由一些专为固定大小数据集特殊设计的算法和数据结构进行内部处理,产生了出色的性能。
什么是无界流?什么是有界流?
无界流有一个起点,但没有定义的终点,这就是无界流。
有界流具有定义的开始和结束,可以通过在执行任何计算之前提取所有数据来处理有界流。
Flink擅长处理无边界和有界的数据集。
2.运行任意规模应用
Flink旨在任意规模上运行有状态流式应用,因此应用程序被并行化为可能数千个任务,这些任务分布在集群中并发执行。
3.稳定运行
在分布式系统中,为了保证服务能够 7 * 2 4小时稳定运行, Flink不仅提供故障处理,而且还要能能够持久化服务内部各个组件的当前状态。
Flink优点
Flink有如下优点以及优势:
1.高性能和低延迟
Flink 能够以极低的延迟处理数据,具有高吞吐量和低延迟。
2.简单易用
Flink 的编程模型相对简单,开发者可以方便地使用 Flink API 进行开发,同时还可以集成各种数据源和存储器。
3.可伸缩性
Flink 能够轻松地扩展到大规模数据处理,可以通过添加更多的计算节点来提高性能。
5.容错性
Flink 可以通过容错机制来处理节点故障和数据丢失,确保数据处理的准确性和一致性。
支持批处理和流处理:Flink 不仅支持实时流处理,还可以用于批处理。
陈睿mikechen
10年+大厂架构经验,资深技术专家,就职于阿里巴巴、淘宝、百度等一线互联网大厂。
关注「mikechen」公众号,获取更多技术干货!
后台回复【面试】即可获取《史上最全阿里Java面试题总结》,后台回复【架构】,即可获取《阿里架构师进阶专题全部合集》