我通过HCatInputFormat读取了hive的数据注册了一张表,然后读取kafka的数据也注册了一张表,join就是通过sql写的,没有什么代码逻辑呢。


| |
like
|
|
likeg...@163.com
|
签名由网易邮箱大师定制
在2019年8月27日 17:17,Jeff Zhang<zjf...@gmail.com> 写道:
你是怎么join hive表的,能share你的代码吗?

like <likeg...@163.com> 于2019年8月27日周二 下午5:15写道:

请问一下各位大佬,如何保证先加载完hive表,然后再与流join,我发现在hive还没有加载完就已经有join的结果出来,这样刚开始出来的结果是不准确的,还有一个问题是hive表加载完之后不会再做checkpoint?我目前使用的是1.7.1版本,看了1.9的维表join,blink文档说(必须加上FOR
SYSTEM_TIME AS OF
PROCTIME(),表示JOIN维表当前时刻所看到的每条数据),这也就意味着跟我现在一样,没有加载完hive就会join输出了?





--
Best Regards

Jeff Zhang

回复