Zookeeper中的Leader选取机制

阅读原文时间：2023年07月09日阅读：5

一、Zookeeper是什么？

ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。

　　ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

二、Zookeeper能干什么？

　　ZooKeeper是Hadoop下的一个子项目，它是一个针对大型分布式系统的可靠协调系统，提供的功能包括：配置维护、名字服务、分布式同步、组服务等。

从其服务架构图来看：ZooKeeper分为服务器端(Server)和客户端(Client)，客户端可以连接到整个ZooKeeper服务的任意服务器上(Leader除外)。

ZooKeeper 启动时，将从实例中选举一个Leader，Leader 负责处理数据更新等操作。

三、Zookeeper中的四种角色

　　1、Leader：领导者，负责进行投票的发起和决议，更新系统状态。

　　2、Learner：学习者

　　3、Follower(Learner的子类)：跟随者，用于接受客户端请求并向客户端返回结结果，在选主过程中参与投票，Follower可以接收Client请求，如果是写请求将转发给Leader来更新系统状态。

　　4、Observer：观察者，可以接收客户端连接，将写请求转发给Leader节点，但是不参与投票过程，只是同步Leader状态，因为Follower增多会导致投票阶段延迟增大，影响性能。Observer的目的是为了扩展系统，提高读取数据。

四、在这四种角色中，Leader是怎么被选举出来的呢？

　　在说明选举机制之前先介绍一些问题：

　　1、Zookeeper中的Server数目一般为奇数？

我们知道在Zookeeper中 Leader 选举算法采用了Quorom算法。该算法的核心思想是当多数Server写成功，则任务数据写成功。假设有3个Server，则最多允许一个Server挂掉；如果有4个Server，则同样最多允许一个Server挂掉。既然3个或者4个Server，同样最多允许1个Server挂掉，那么它们的可靠性是一样的，所以选择奇数个ZooKeeper Server即可，这里选择3个Server。

　　2、什么是Quorom算法？

　　在分布式系统中，冗余数据是保证可靠性的手段，因此冗余数据的一致性维护就非常重要。一般而言，一个写操作必须要对所有的冗余数据都更新完成了，才能称为成功结束。比如一份数据在5台设备上有冗余，因为不知道读数据会落在哪一台设备上，那么一次写操作，必须5台设备都更新完成，写操作才能返回。

对于写操作比较频繁的系统，这个操作的瓶颈非常大。Quorum算法可以让写操作只要写完3台就返回。剩下的由系统内部缓慢同步完成。而读操作，则需要也至少读3台，才能保证至少可以读到一个最新的数据。

　　3、Zookeeper节点的一些状态

　　（1）LEADING：说明此节点已经是leader节点，处于领导者地位的状态，差不多就是一般集群中的master。但在zookeeper中，只有leader才有写权限，其他节点（FOLLOWING）是没有写权限的，可以读。

　　（2）LOOKING：选举中，正在寻找leader，即将进入leader选举流程中

　　（3）FOLLOWING：跟随者状态，表示当前集群中的leader已经选举出来了，本台服务器处于跟随状态。

　　（4）OBSERVING：OBSERVING和FOLLOWING差不多，但不参加投票和选举，接受leader选举后的结果

下面来正式介绍一下选举机制（以5台服务器为例）：

1、每个Server都有一个唯一标识自己的myid。选举过程中每个Server都有一票（挂掉的除外）在这里我们从左到右分别将五台服务器的myid赋值为1，2，3，4，5

2、Zxid类似于RDBMS中的事务ID，用于标识一次更新操作的Proposal ID。每次请求对应一个唯一的zxid,如果zxid a < zxid b ，则可以保证a一定发生在b之前。

3、选举分为两种情况：初始化的时候（还没有leader）,leader服务器挂掉的时候（重新选举新的leader）

4、初始化的情况：

　　（1）首先第一台服务器启动，投自己一票，然后发投票信息，由于其它机器还没有启动所以它收不到反馈信息，服务器1的状态一直属于Looking。

　　（2）服务器2启动，发现当前没有leader，投票给自己，同时与之前启动的服务器1交换结果，由于服务器2的编号大所以服务器2胜出，但此时投票数没有大于半数，所以两个服务器的状态依然是LOOKING。

　　（3）服务器3启动，发现没有Leader，给自己投票，同时与之前启动的服务器1,2交换信息，由于服务器3的编号最大所以服务器3胜出，此时投票数正好大于半数，所以服务器3成为领导者，服务器1,2成为小弟。

　　（4）服务器4启动，给自己投票，同时与之前启动的服务器1,2,3交换信息，尽管服务器4的编号大，但之前服务器3已经胜出，所以服务器4只能成为小弟。

　　（5）服务器5和服务器4逻辑相同。

5、如果Server3当选了Leader,他突然宕机了，那么就需要重新选Leader了。

　　（1）Leader宕机之后，剩下的机器会自动进入选举状态，重新选举。

（2）选举的依据是：优先考虑数据的的版本号zxid，再考虑id。(因为zxid越大，代表该服务器的数据越新，越全）

　　（3）由于是运行期间，因此每个服务器上的ZXID可能不同我们假设Server1的ZXID为123，而Server2的ZXID为122，Server4的ZXID为143，Sever5的ZXID为120

　　（4）在第一轮投票中，Server1、Server2、Sever4、Server5都会投给自己，即分别产生投票(1,123),(2,122)，(4,143),(5,120)

　　（5）然后各自将这个投票发给集群中所有机器。

　　（6）对于投票的处理，在这个情境下Server4的ZXID为143,是最大的，显然Server4会成为Leader，其他服务器成为跟随者。

参考文章：

1. https://www.toutiao.com/i6701570306445672963/?tt_from=copy_link&utm_campaign=client_share×tamp=1563546713&app=news_article_lite&utm_source=copy_link&utm_medium=toutiao_ios&req_id=201907192231531720170000013322D80&group_id=6701570306445672963

2.https://blog.csdn.net/ypp91zr/article/details/89409707

手机扫一扫

移动阅读更方便

你可能感兴趣的文章

Kafka-基础

Kafka入门学习