搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Spark
›
探索Spark源码---Driver程序如何与Spark集群建立联系?
0
3
0
分享
探索Spark源码---Driver程序如何与Spark集群建立联系?
regan
发表于 2015-12-16 17:41:45
[显示全部楼层]
只看大图
阅读模式
关闭右栏
3
7817
本帖最后由 regan 于 2015-12-17 12:47 编辑
在上一节中我们讲到了通过./spark-submit脚本运行Driver程序。./spark-submit脚本会调用SparkSubmit对象,在SparkSubmit中将会判断调度模式,如果是standalone的调度模式,将会启动org.apache.spark.deploy.Client,在Client对象中,会构建一个ClientActor,这个Actor将会向Master注册Driver,注册后将会调用schedule()方法执行调度,如果有worker满足Driver运行条件,Driver将会被发送到满足条件的Worker节点上,并在一个线程中启动Driver程序(调用Driver程序中的Main方法),那问题来了,Driver程序如何与Spark集群建立联系?
答案是:SparkContext(SparkStreaming中是StreamingContext),SparkContext是Spark提供给用户的编程接口,在实例化SparkContext的时候,我们将会和集群建立联系,即Driver连接上了Spark集群。
然后通过SparkContext提供的transaction和Action操作,用户可以构架RDD,由Transaction操作,连接成有前后依赖关系的图-----DAG图,DAG所有的Transaction操作都是懒操作,直到action触发job的提交.
下面是结构图:
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
zhujun182104906
发表于 2015-12-18 16:53:35
回复
使用道具
举报
显身卡
regan
发表于 2015-12-18 17:18:25
回复
使用道具
举报
显身卡
邓立辉
发表于 2015-12-26 10:49:49
必须顶
回复
使用道具
举报
显身卡
还有一些帖子被系统自动隐藏,点此展开
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
最佳新人
积极上进,爱好学习
热心会员
经常帮助其他会员答疑
发表新帖
regan
新手上路
关注
40
主题
194
帖子
33
粉丝
TA的主题
Spark性能优化(八):Shuffle调优
2019-12-16
Spark性能调优(六):数据本地性
2019-12-9
Spark性能调优(五):缓存与Checkpoint
2019-12-9
Spark性能调优(四):广播大变量
2019-11-28
Spark性能优化(三):序列化与压缩
2019-11-27
24小时热文
幕后产品:打造突破式产品思维
像高手一样发言:七种常见工作场景的说话之
副业警钟,新型法律碰瓷发财方式:批量诉讼
Spark机器学习
Spark机器学习算法、源码及实战详解
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈