raft算法学习记录

leader日志完整性特性的意思解读：leader能当选，必须拥有完整日志。这一特性保证了raft算法是安全的，任何一致性算法必须保证这一点。不然，意味着算法存在丢数据的漏洞。

广播时间（broadcastTime） << 选举超时时间（electionTimeout） << 平均故障间隔时间（MTBF）

广播时间必须比选举超时时间小一个量级，选举超时时间需要比平均故障间隔时间小上几个数量级.

当集群配置变更时，以日志的方式来处理配置变更之后的各节点的最终一致。配置变更但未最终一致期间，如果leader结点崩溃，同样遵循日志同步的规则。即拥有配置变更日志的结点才可能当选为leader。

新的服务器以没有投票权身份加入到集群中来（leader 也复制日志给它们，但是考虑过半的时候不用考虑它们）。直到日志完成同步到新的服务器。
第二个问题是，集群的 leader 可能不是新配置中的一员。这是一个非常极端的情况，发生在新配置刚提交，但是未复制到大多数结点时，leader就崩溃了。这个时间新leader是个旧配置结点，它可以处理客户端的请求，但是一旦新配置日志提交，新leader就会变成follower,集群将重新进行选举。
第三个问题是，被移除的服务器会发起新选举。这个好解决，执行下线的服务器程序上把rpc请求也关闭就ok了。

即 raft快照。

相关推荐