Skip to content

Commit

Permalink
pd: add patrol-region-worker-count (#19194) (#19259)
Browse files Browse the repository at this point in the history
  • Loading branch information
ti-chi-bot authored Dec 10, 2024
1 parent 5209ade commit 1cdac0d
Show file tree
Hide file tree
Showing 3 changed files with 22 additions and 4 deletions.
3 changes: 2 additions & 1 deletion dynamic-config.md
Original file line number Diff line number Diff line change
Expand Up @@ -270,7 +270,8 @@ Query OK, 0 rows affected (0.01 sec)
| cluster-version | 集群的版本 |
| schedule.max-merge-region-size | 控制 Region Merge 的 size 上限(单位是 MiB) |
| schedule.max-merge-region-keys | 控制 Region Merge 的 key 数量上限 |
| schedule.patrol-region-interval | 控制 replicaChecker 检查 Region 健康状态的运行频率 |
| schedule.patrol-region-interval | 控制 checker 检查 Region 健康状态的运行频率 |
| scheduler.patrol-region-worker-count| 控制 checker 检查 Region 健康状态时,创建 operator 的并发数 |
| schedule.split-merge-interval | 控制对同一个 Region 做 split 和 merge 操作的间隔 |
| schedule.max-snapshot-count | 控制单个 store 最多同时接收或发送的 snapshot 数量 |
| schedule.max-pending-peer-count | 控制单个 store 的 pending peer 上限 |
Expand Down
11 changes: 10 additions & 1 deletion pd-configuration-file.md
Original file line number Diff line number Diff line change
Expand Up @@ -273,9 +273,18 @@ pd-server 相关配置项。

### `patrol-region-interval`

+ 控制 replicaChecker 检查 Region 健康状态的运行频率,越短则运行越快,通常状况不需要调整
+ 控制 checker 检查 Region 健康状态的运行频率,越短则运行越快,通常状况不需要调整
+ 默认:10ms

### `patrol-region-worker-count` <span class="version-mark">从 v8.5.0 版本开始引入</span>

> **警告:**
>
> 将该配置项设置为大于 1 将启用并发检查。目前该功能为实验特性,不建议在生产环境中使用。该功能可能会在未事先通知的情况下发生变化或删除。如果发现 bug,请在 GitHub 上提 [issue](https://github.com/tikv/pd/issues)反馈。
+ 控制 checker 检查 Region 健康状态时,创建 [operator](/glossary.md#operator) 的并发数。通常情况下,无需调整此配置项。
+ 默认:1

### `split-merge-interval`

+ 控制对同一个 Region 做 split 和 merge 操作的间隔,即对于新 split 的 Region 一段时间内不会被 merge。
Expand Down
12 changes: 10 additions & 2 deletions pd-control.md
Original file line number Diff line number Diff line change
Expand Up @@ -311,16 +311,24 @@ config show cluster-version
config set region-score-formula-version v2
```

- `patrol-region-interval` 控制 replicaChecker 检查 Region 健康状态的运行频率,越短则运行越快,通常状况不需要调整。
- `patrol-region-interval` 控制 checker 检查 Region 健康状态的运行频率,越短则运行越快,通常状况不需要调整。

设置 replicaChecker 的运行频率为 10 毫秒:
设置 checker 的运行频率为 10 毫秒:

{{< copyable "" >}}

```bash
config set patrol-region-interval 10ms
```

- `patrol-region-worker-count` 控制 checker 检查 Region 健康状态时,创建 [operator](/glossary.md#operator) 的并发数。通常情况下,无需调整此配置项。将该配置项设置为大于 1 将启用并发检查。目前该功能为实验特性,不建议在生产环境中使用。

设置 checker 的并发数为 2:

```bash
config set patrol-region-worker-count 2
```

- `max-store-down-time` 为 PD 认为失联 store 无法恢复的时间,当超过指定的时间没有收到 store 的心跳后,PD 会在其他节点补充副本。

设置 store 心跳丢失 30 分钟开始补副本:
Expand Down

0 comments on commit 1cdac0d

Please sign in to comment.