[GitHub] [flink] MrWhiteSike commented on a change in pull request #17943: [FLINK-24693][docs-zh] Translate "checkpoints" and "checkpointing" page to Chinese

2022-02-10 Thread GitBox


MrWhiteSike commented on a change in pull request #17943:
URL: https://github.com/apache/flink/pull/17943#discussion_r803621040



##
File path: docs/content.zh/docs/ops/state/checkpoints.md
##
@@ -74,15 +129,24 @@ 
config.enableExternalizedCheckpoints(ExternalizedCheckpointCleanup.RETAIN_ON_CAN
 state.checkpoints.dir: hdfs:///checkpoints/
 ```
 
- 创建 state backend 对单个作业进行配置
+ 通过 checkpoint configuration 对单个作业进行配置
+
+```java
+env.getCheckpointConfig().setCheckpointStorage("hdfs:///checkpoints-data/");
+```
+
+ 通过 checkpoint storage 实例进行配置
+
+或者,可以通过初始化预期的 checkpoint storage 实例来配置,这允许设置更细粒度的参数,例如写入缓冲区的大小。
 
 ```java
-env.setStateBackend(new RocksDBStateBackend("hdfs:///checkpoints-data/"));
+env.getCheckpointConfig().setCheckpointStorage(
+  new FileSystemCheckpointStorage("hdfs:///checkpoints-data/", 
FILE_SIZE_THESHOLD));
 ```
 
 ### Checkpoint 与 Savepoint 的区别
 
-Checkpoint 与 [savepoints]({{< ref "docs/ops/state/savepoints" >}}) 有一些区别,体现在 
checkpoint :
+Checkpoint 与 [savepoints]({{< ref "docs/ops/state/savepoints" >}}) 有一些区别,体现在 
checkpoint

Review comment:
   ```suggestion
   Checkpoint 与 [savepoints]({{< ref "docs/ops/state/savepoints" >}}) 有一些区别,体现在 
checkpoint 用法上:
   ```

##
File path: docs/content.zh/docs/dev/datastream/fault-tolerance/checkpointing.md
##
@@ -43,34 +43,40 @@ Flink 的 checkpoint 机制会和持久化存储进行交互,读写流与状
 
 ## 开启与配置 Checkpoint
 
-默认情况下 checkpoint 是禁用的。通过调用 `StreamExecutionEnvironment` 的 
`enableCheckpointing(n)` 来启用 checkpoint,里面的 *n* 是进行 checkpoint 的间隔,单位毫秒。
+默认情况下 checkpoint 是禁用的。通过调用 `StreamExecutionEnvironment` 的 
`enableCheckpointing(n)` 来启用 checkpoint,其中 *n* 表示 [checkpoint 时间间隔]({{< ref 
"docs/ops/production_ready#choose-the-right-checkpoint-interval" >}}),单位毫秒。
 
 Checkpoint 其他的属性包括:
 
-  - *精确一次(exactly-once)对比至少一次(at-least-once)*:你可以选择向 `enableCheckpointing(long 
interval, CheckpointingMode mode)` 方法中传入一个模式来选择使用两种保证等级中的哪一种。
+  - *checkpoint 存储(storage)*:用户可以设置 checkpoint 快照持久化的位置。 默认情况下,Flink 会存储在 
JobManager 的堆中。在生产环境中,建议改用持久化的文件系统。 请参考 [checkpoint 存储]({{< ref 
"docs/ops/state/checkpoints#checkpoint-storage" >}}) 以获取有关作业级别和集群级别的可用配置的更多详细信息。
+
+  - *精确一次(exactly-once)对比至少一次(at-least-once)*:你可以选择向 `enableCheckpointing(n)` 
方法中传入一个模式来选择使用两种保证等级中的哪一种。
 对于大多数应用来说,精确一次是较好的选择。至少一次可能与某些延迟超低(始终只有几毫秒)的应用的关联较大。
-  
-  - *checkpoint 超时*:如果 checkpoint 执行的时间超过了该配置的阈值,还在进行中的 checkpoint 操作就会被抛弃。
-  
+
+  - *checkpoint 超时*:如果 checkpoint 执行的时间超过了该配置的阈值,还在进行中的 checkpoint 操作就会被取消。
+
   - *checkpoints 之间的最小时间*:该属性定义在 checkpoint 之间需要多久的时间,以确保流应用在 checkpoint 
之间有足够的进展。如果值设置为了 *5000*,
-无论 checkpoint 持续时间与间隔是多久,在前一个 checkpoint 完成时的至少五秒后会才开始下一个 checkpoint。
-
-往往使用“checkpoints 之间的最小时间”来配置应用会比 checkpoint 间隔容易很多,因为“checkpoints 
之间的最小时间”在 checkpoint 的执行时间超过平均值时不会受到影响(例如如果目标的存储系统忽然变得很慢)。
-
+无论 checkpoint 持续时间与间隔是多久,在前一个 checkpoint 完成时的至少五秒后才会开始下一个 checkpoint。
+
+往往使用“checkpoints 之间的最小时间”来配置应用会比 checkpoint 间隔容易很多,因为 "checkpoints 
之间的最小时间" 在 checkpoint 的执行时间超过平均值时不会受到影响(例如如果目标的存储系统忽然变得很慢)。
+
 注意这个值也意味着并发 checkpoint 的数目是*一*。
 
   - *checkpoint 可容忍连续失败次数*:该属性定义可容忍多少次连续的 checkpoint 失败。超过这个阈值之后会触发作业错误 fail 
over。
-默认次数为“0”,这意味着不容忍 checkpoint 失败,作业将在第一次 checkpoint 失败时fail over。
-
-  - *并发 checkpoint 的数目*: 默认情况下,在上一个 checkpoint 未完成(失败或者成功)的情况下,系统不会触发另一个 
checkpoint。这确保了拓扑不会在 checkpoint 上花费太多时间,从而影响正常的处理流程。
+默认次数为“0”,这意味着不容忍 checkpoint 失败,作业将在第一次 checkpoint 失败时 fail over。
+
+  - *并发 checkpoint 的数目*:默认情况下,在上一个 checkpoint 未完成(失败或者成功)的情况下,系统不会触发另一个 
checkpoint。这确保了拓扑不会在 checkpoint 上花费太多时间,从而影响正常的处理流程。
 不过允许多个 checkpoint 并行进行是可行的,对于有确定的处理延迟(例如某方法所调用比较耗时的外部服务),但是仍然想进行频繁的 
checkpoint 去最小化故障后重跑的 pipelines 来说,是有意义的。
-
-该选项不能和 "checkpoints 间的最小时间"同时使用。
-
-  - *externalized checkpoints*: 你可以配置周期存储 checkpoint 到外部系统中。Externalized 
checkpoints 将他们的元数据写到持久化存储上并且在 job 失败的时候*不会*被自动删除。
+
+该选项不能和 "checkpoints 之间的最小时间"同时使用。
+
+  - *externalized checkpoints*:你可以配置周期存储 checkpoint 到外部系统中。Externalized 
checkpoints 将他们的元数据写到持久化存储上并且在 job 失败的时候*不会*被自动删除。

Review comment:
   ```suggestion
 - *externalized checkpoints*:你可以配置周期 checkpoint 存储到外部系统中。Externalized 
checkpoints 将他们的元数据写到持久化存储上并且在 job 失败的时候*不会*被自动删除。
   ```




-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: issues-unsubscr...@flink.apache.org

For queries about this service, please contact Infrastructure at:
us...@infra.apache.org




[GitHub] [flink] MrWhiteSike commented on a change in pull request #17943: [FLINK-24693][docs-zh] Translate "checkpoints" and "checkpointing" page to Chinese

2022-02-10 Thread GitBox


MrWhiteSike commented on a change in pull request #17943:
URL: https://github.com/apache/flink/pull/17943#discussion_r803606329



##
File path: docs/content.zh/docs/dev/datastream/fault-tolerance/checkpointing.md
##
@@ -43,34 +43,40 @@ Flink 的 checkpoint 机制会和持久化存储进行交互,读写流与状
 
 ## 开启与配置 Checkpoint
 
-默认情况下 checkpoint 是禁用的。通过调用 `StreamExecutionEnvironment` 的 
`enableCheckpointing(n)` 来启用 checkpoint,里面的 *n* 是进行 checkpoint 的间隔,单位毫秒。
+默认情况下 checkpoint 是禁用的。通过调用 `StreamExecutionEnvironment` 的 
`enableCheckpointing(n)` 来启用 checkpoint,其中 *n* 表示 [checkpoint 时间间隔]({{< ref 
"docs/ops/production_ready#choose-the-right-checkpoint-interval" >}}),单位毫秒。
 
 Checkpoint 其他的属性包括:
 
-  - *精确一次(exactly-once)对比至少一次(at-least-once)*:你可以选择向 `enableCheckpointing(long 
interval, CheckpointingMode mode)` 方法中传入一个模式来选择使用两种保证等级中的哪一种。
+  - *checkpoint 存储(storage)*:用户可以设置 checkpoint 快照持久化的位置。 默认情况下,Flink 会存储在 
JobManager 的堆中。在生产环境中,建议改用持久化的文件系统。 请参考 [checkpoint 存储]({{< ref 
"docs/ops/state/checkpoints#checkpoint-storage" >}}) 以获取有关作业级别和集群级别的可用配置的更多详细信息。
+
+  - *精确一次(exactly-once)对比至少一次(at-least-once)*:你可以选择向 `enableCheckpointing(n)` 
方法中传入一个模式来选择使用两种保证等级中的哪一种。
 对于大多数应用来说,精确一次是较好的选择。至少一次可能与某些延迟超低(始终只有几毫秒)的应用的关联较大。
-  
-  - *checkpoint 超时*:如果 checkpoint 执行的时间超过了该配置的阈值,还在进行中的 checkpoint 操作就会被抛弃。
-  
+
+  - *checkpoint 超时*:如果 checkpoint 执行的时间超过了该配置的阈值,还在进行中的 checkpoint 操作就会被取消。
+
   - *checkpoints 之间的最小时间*:该属性定义在 checkpoint 之间需要多久的时间,以确保流应用在 checkpoint 
之间有足够的进展。如果值设置为了 *5000*,
-无论 checkpoint 持续时间与间隔是多久,在前一个 checkpoint 完成时的至少五秒后会才开始下一个 checkpoint。
-
-往往使用“checkpoints 之间的最小时间”来配置应用会比 checkpoint 间隔容易很多,因为“checkpoints 
之间的最小时间”在 checkpoint 的执行时间超过平均值时不会受到影响(例如如果目标的存储系统忽然变得很慢)。
-
+无论 checkpoint 持续时间与间隔是多久,在前一个 checkpoint 完成时的至少五秒后才会开始下一个 checkpoint。

Review comment:
   ```suggestion
   无论 checkpoint 持续时间与间隔是多久,在前一个 checkpoint 完成至少五秒后才会开始下一个 checkpoint。
   ```
   




-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: issues-unsubscr...@flink.apache.org

For queries about this service, please contact Infrastructure at:
us...@infra.apache.org