问题导读
1.spark Streaming支持哪些语言?
2.spark Streaming是否具有故障恢复功能?
Spark Streaming使容易的建立可扩展的容错的流程序。
容易使用
Spark Streaming使用spark语言集成api处理流,使写流job跟批处理job是一样的。他支持Java, Scala and Python.
TwitterUtils.createStream(...)
.filter(_.getText.contains("Spark"))
.countByWindow(Seconds(5))
在滑动窗口中计算tweets
故障容错
Spark Streaming恢复丢失的job和状态,不需要额外代码
Spark 集成
结合流与批处理和交互式查询。
运行spark和spark streaming是重用相同的代码,对于批处理, join streams,运行特定查询在流状态下,建立强大的交互式应用程序,不止是分析
上一篇:
about云系列spark入门3:Spark SQL处理结构化数据的spark模块
|
|