Zookeeper简介及选举机制

admin • 2024-02-27 20:48 • 5G

1.概述

Zookeeper是一个开源的，分布式的，为分布式框架（如下图中的Hadoop和Hive）提供协调服务的Apache项目。

工作机制：基于观察者设计模式的分布式服务管理框架，负责存储和管理数据，接受观察者注册，一旦这些数据状态发生变化，Zookeeper就会发送通知给这些已注册的观察者。简而言之，Zookeeper = 文件系统+通知机制。

特点：

1）由1个Leader和多个Follower组成的集群

2）有一半以上节点存活，Zookeeper集群就能正常服务，所以Zookeeper适合安装奇数台服务器（比如5台和6台服务器，都是挂3台之后Zookeeper集群不能服务，6台服务器相比于5台服务器的可靠性并没有提高）

3）全局数据一致，每个服务器都有一份相同的数据副本

4）来自同一个客户端的请求顺序执行

5）数据更新具有原子性，要么成功，要么失败

2.数据结构

Zookeeper的数据结构和Linux类似，都是树形结构（类似的还有HDFS），每一个节点称为一个ZNode，默认存储1MB的数据，所以不能存储海量数据，只能存储配置信息这种小数据。

3.配置

将conf目录下的zoo_sample.cfg修改为zoo.cfg，其中内容如下

其中dataDir的值需要修改，不要设为放在Linux临时目录下。tickTime表示心跳时间，客户端与服务端或者服务端与服务端的通信心跳时间。initLimit表示Leader和Follower初始化第一次建立连接的最大通信心跳数。syncLimit表示建立第一次连接连接之后的最大通信心跳数。clientPort是客户端端口号。

启动服务端命令：bin/zkServer.sh start，可以通过jps -l看到zookeeper的进程：