Re: 回复:Re: CheckpointedFunction#snapshotState访问键控状态报错

2021-04-13 文章 Yun Tang
Hi,
如果想要可以被外部查询,更合适的方式是 queryable 
state,如果想要把数据同时存储在外部,更合适的方式其实是直接使用外部store,例如HBase,这样子数据的查询是实时的。
checkpoint时候再向外存储的话,一来更新不是及时的,而且数据有冗余存储(分别在Flink的state和外部存储中)。

如果非要想获取实际的kv数据,可以参照我前面说的 KeyedStateBackend#getKeys 或者 
KeyedStateBackend#applyToAllKeys 这两个接口,你可以自己实现一个stream 
operator而不是function,这样就能看到里面的keyed statebackend了。

祝好
唐云

From: cs <58683...@qq.com>
Sent: Monday, April 12, 2021 11:29
To: user-zh 
Subject: 回复:Re: CheckpointedFunction#snapshotState访问键控状态报错

我们需求这个状态需要可以被外部查询,quable 
state我们生产端口会屏蔽掉。所以只能在checkpoint的时候自己将状态输出到外部存储。但是感觉没有很好的api获取statetable里面实际kv状态

---原始邮件---
发件人:Yun Tang

Re: CheckpointedFunction#snapshotState访问键控状态报错

2021-04-10 文章 Yun Tang
Hi

  snapshotState主要是给operator state用的,异常原因是keyed state 
访问时需要设置currentKey的,但是currentKey是当前正在处理的record的key,与snapshotState的执行时候的语义不一样,执行snapshotState方法的时候,是可以没有当前record的。

  如果想要访问整个keyed state,可以通过 KeyedStateBackend#getKeys(String state, N namespace) 
来访问,但还是不建议将keyed state写入到HBase,因为Flink更希望你是按照per record的访问,而不是全局访问,后者效率和性能都不好。


祝好

唐云

From: cs <58683...@qq.com>
Sent: Tuesday, April 6, 2021 21:52
To: user-zh 
Subject: CheckpointedFunction#snapshotState访问键控状态报错

class A extends KeyedProcessFunction