分享

Structured Streaming容错

zstu 2018-7-25 11:26:15 发表于 疑问解答 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 2 5450
我看官方文档说Structured Streaming是通过checkpoint和WAL来保证容错的,并且通过数据源的可重复消费以及幂等来保证端到端的exactly-once。但是如果对程序修改了,重新启动的时候,读取checkpoint目录数据是不是也引起序列化问题。还有一个疑问,checkpoint和wal分别是保存什么的?

已有(2)人评论

跳转到指定楼层
bioger_hit 发表于 2018-7-25 12:52:06
checkpoint有点像做快照,出现故障了,从快照开始恢复wal:是预写日志,就是写数据之前,先写日志,数据丢了,根据日志恢复数据。


回复

使用道具 举报

zstu 发表于 2018-7-26 09:17:02
bioger_hit 发表于 2018-7-25 12:52
checkpoint有点像做快照,出现故障了,从快照开始恢复wal:是预写日志,就是写数据之前,先写日志,数据丢 ...

那就是checkpoint存储应用的元数据,wal存储offset?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条