搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Spark
›
Spark使用mllib进行机器学习执行时间较长
0
1
0
分享
Spark使用mllib进行机器学习执行时间较长
tjmikezhao
发表于 2017-12-28 19:03:37
[显示全部楼层]
只看大图
阅读模式
关闭右栏
1
4751
About云VIP帮助找工作和提升
这个是较长时间的数据,
对比时间较短的数据
在task上没有出现数据不均匀的情况,只是在各个executor节点上的数据出现不均匀的情况,如果想缩短每个task节点时间,这个是不是节点数据分布不均匀造成的,还有就是在yarn上的日志,会出现断断续续的情况
这个是因为我spark程序设置日志级别的问题么。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
qcbb001
发表于 2017-12-28 21:09:44
任务执行时间长短不一是正常的,因为可能有的是在本地读取数据,有的可能是需要远程读取数据。而且如果存在热点,也就是数据不均匀,机器就会很忙,所以会造成读取很慢。甚至会造成一些任务卡住等现象。
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
tjmikezhao
注册会员
关注
1
主题
6
帖子
4
粉丝
TA的主题
Spark使用mllib进行机器学习执行时间较长
2017-12-28
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈