This is an automated email from the ASF dual-hosted git repository.
wangdan pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/incubator-pegasus-website.git
The following commit(s) were added to refs/heads/master by this push:
new b24d2ba3 Update replica-recovery in Chinese (#105)
b24d2ba3 is described below
commit b24d2ba3e90a6db855d5233841855990d33fb44c
Author: ninsmiracle <[email protected]>
AuthorDate: Tue Apr 15 18:31:30 2025 +0800
Update replica-recovery in Chinese (#105)
---
_docs/zh/administration/replica-recovery.md | 17 ++++++++++++++++-
1 file changed, 16 insertions(+), 1 deletion(-)
diff --git a/_docs/zh/administration/replica-recovery.md
b/_docs/zh/administration/replica-recovery.md
index 4110c877..3e962fb2 100644
--- a/_docs/zh/administration/replica-recovery.md
+++ b/_docs/zh/administration/replica-recovery.md
@@ -6,7 +6,22 @@ permalink: administration/replica-recovery
通常来说,Pegasus的数据会存储3个副本。对于每个partition,正常情况下应当都有一主两备3个replica提供服务。
-但是,集群不可避免会发生节点宕机、网络异常、心跳失联等情况,造成副本丢失,对服务可用性产生影响。副本丢失的程度会影响读写的能力(在[负载均衡](rebalance#概念篇)里也有介绍):
+但是,集群不可避免会发生节点宕机、网络异常、心跳失联等情况,造成副本丢失,对服务可用性产生影响。Pegasus共有3种探测机制可以发现副本的丢失情况:
+
+* 2pc超时:主要是保证主副本和从副本之间的健康。这是一个以副本为粒度的故障探测。每次写⼊进⼊2pc流程都会进⾏。
+
+* failure_detect:主要通过租约机制保证meta server和replica
server之间的连接正常。服务器节点级别的故障探测,可以及时发现某台节点产生了可用性问题。线上默认配置3秒⼀次。
+
+* group_check:主副本成为primary的时候发起的任务。定期向secondary发送rpc进⾏探活。线上默认配置100秒⼀次。
+
+其中,2pc超时与group_check可以让主副本及时发现从副本的连接异常(无论是什么原因),从而将有问题的从副本在拓扑结构中踢出并上报meta。failure_detect可以让meta
server发现某个数据节点异常连接,从而将该节点的全部副本从拓扑结构中踢出。
+
+通过这3种探测机制,meta就会进入一个副本丢失的状态,从而触发后续的分片补全(cure)流程来使所有的副本恢复健康。
+
+
+
+副本丢失的程度会影响读写的能力说明如下(在[负载均衡](rebalance#概念篇)里也有介绍):
+
* 一主两备都可用:partition完全健康,可以**正常读和写**。
* 一主一备可用:根据PacificA一致性协议,同样可以**安全地读和写**。
* 只有一主可用:此时**不可写**,但是**可读**。
---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]