Skip to content
Elevenlxl edited this page Jun 20, 2018 · 4 revisions

一、zkdoctor是什么

zkdoctor是一个ZooKeeper服务的统计、监控报警以及自动化运维平台:监控ZooKeeper集群运行状态,做到有问题及时发现、及时解决,掌握ZooKeeper整体运行情况。主要包括:

  • 支持多种部署类型(standalone、replicated)以及3.4.0版本以后的ZooKeeper服务监控
  • 完善的统计、监控功能,包含服务端各项运行指标信息
  • 及时的报警功能,包含阈值报警以及状态变更报警
  • 支持机器维度的统计、监控以及报警
  • 全面的自动化运维功能,减少人工运维成本
  • 必要的节点信息操作功能

二、zkdoctor解决哪些问题

1、ZooKeeper节点非可视化操作

数据节点的查询与操作,通过命令方式不够直观。zkdoctor提供了可视化树结构数据节点操作,更加便捷

2、不完善的监控统计

现有的监控系统(Zabbix等),监控统计指标不够完善,且需单独部署agent采集信息,流程比较复杂。zkdoctor部署之后,通过四字命令直接采集服务端各项指标,同时支持客户端连接信息收集统计以及机器维度数据的收集统计。统计监控更加全面和完善。

3、人工运维成本

服务的启停、配置的更新、扩容等运维操作,人工操作存在误操作以及存在一定的人工运维成本。zkdoctor支持自动化运维功能,一键完成相关的运维操作过程,大大降低了运维成本

4、服务出问题不能及时发现以及定位

服务某指标异常时,不能及时发现以及定位。zkdoctor提供了及时的阈值报警以及状态变化报警功能,能够更快的发现问题,且提供了详细的历史统计数据,供问题定位

三、支持zookeeper版本

  • standalone 3.4.0+
  • replicated 3.4.0+