Raft协议最全详解(看这篇就足够了)

Raft协议最全详解(看这篇就足够了)-mikechen

Raft协议简介

Raft是分布式的一致性协议,其相对Pasox更加简单,都是为了实现 一致性 产生的,解决分布式系统的数据一致性和高可用。

Raft协议将一致性协议的核心内容分拆成为几个关键阶段:包括:领导选举(leader selection)、日志复制(log replication)等以简化流程,提高协议的可理解性。

所以搞懂Raft协议重点就是要理解Raft协议角色,以及领导选举、日志复制这3大核心点,下面我分别详解@mikechen

 

Raft协议角色

Raft算法中一个集群里面的所有节点有以下三种状态:

Raft协议最全详解(看这篇就足够了)-mikechen

Raft协议的每个副本都会处于三种状态之一:Leader、Follower、Candidate。

1.跟随者(follower)

类似选民,完全被动的角色,这样的服务器等待被通知投票。

2.候选者(candidate)

候选者就是在选举过程中提名自己的实体,一旦选举成功,则成为领导者。

3.领导者(leader)

领导者的作用:处理客户端交互,日志复制等动作,Raft 要求系统在任何一个时刻最多只有一个 Leader,正常工作期间只有 Leader 和 Follower。

Raft 协议角色状态转换,如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

 

领导leader选举

Raft通过心跳机制来触发leader选举,当一个服务器启动时,默认位于followers状态,并且一直持续知道它一直接受到leader的RPC请求。

leader会周期性发送心跳给所有的followers,如果follower一段时间内没有接受到心跳,那么就认为当前没有leader应该开始leader selection。

一个最小的 Raft集群需要三个参与者,这样才可能投出多数票,如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

初始状态下 ABC三个节点开始选举Leader,Leader选举过程中有三种可能的情形发生。

第一种:A节点要投自己一票,并把提议拉票请求发给B和C,如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

B和C接受了A的提议,也投票给A,最终A成为Leader。

 

第二种:A节点投了自己一票,B节点也投了自己一票,C节点支持A节点的提议,如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

第二种少数服从多数,最终A成为Leader。

 

第三种:A节点、B节点、C节点都各自投了自己一票,如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

这样就没有节点获得多数票,第三种情况本轮投票无效,出现了平票(Split Votes),因为没有任何一方获得多数票,所以要发起新的一轮投票。

Raft协议为了不让选举机制反复出现平票,定义了一个随机超时机制(randomized election timeouts),一旦发生平票,平票的节点会各自再来一次随机timeout倒数,然后重新拉票,先发起拉票的节点就可以优先获得了多数节点的投票。

 

日志复制

在 Raft 算法中需要实现分布式一致性的数据被称作日志, Raft 算法中的数据提交记录,会按照时间顺序进行追加,Raft 也是严格按照时间顺序并已一定的格式写入日志文件中。

下面这张图就描述了Raft集群中日志的组成结构:

Raft协议最全详解(看这篇就足够了)-mikechen

每一个小方框就是entry,每个日志项包含一条命令、任期信息、日志项在日志中的位置信息(索引值 LogIndex)。

  1. 指令:由客户端请求发送的执行指令,有点绕口,我觉得理解成客户端需要存储的日志数据即可。
  2. 索引值:日志项在日志中的位置,需要注意索引值是一个连续并且单调递增的整数。
  3. 任期编号:创建这条日志项的领导者的任期编号。

Raft 的日志复制过程,大致如下图所示:

Raft协议最全详解(看这篇就足够了)-mikechen

1.领导者接收到客户端发来的请求,创建一个新的日志项,并将其追加到本地日志中;

2.接着领导者通过追加条目 RPC 请求,将新的日志项复制到跟随者的本地日志中;

3.当领导者收到大多数跟随者的成功响应之后,则将这条日志项应用到状态机中,可以理解成该条日志写成功了;

4.最后领导者返回日志写成功的消息响应客户端。

mikechen睿哥

mikechen睿哥,十余年BAT架构经验,资深技术专家,就职于阿里、淘宝、百度等一线互联网大厂。

关注「mikechen」公众号,获取更多技术干货!

后台回复面试即可获取《史上最全阿里Java面试题总结》,后台回复架构,即可获取《阿里架构师进阶专题全部合集

评论交流
    说说你的看法