搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
好文
›
好文
›
Hadoop
›
文章
›
YARN 在字节跳动的优化与实践
0
1
0
分享
YARN 在字节跳动的优化与实践
levycui
2020-6-24 17:31:15
发表于
文章
[显示全部楼层]
只看大图
阅读模式
关闭右栏
1
3355
1.YARN 简介
1.1 YARN 生态圈
YARN (Yet Another Resource Negotiator) 是 Hadoop 集群的资源管理系统,是 Hadoop 生态中非常重要的成员项目。
一般来说,离线生态可以分为五层:
最底层是裸金属层, 由众多物理节点组成,每个节点上运行着通用的操作系统。
次底层是集群资源管理层, YARN 就处在这一层中。
再往上是分布式计算引擎层, MR/Spark/Flink 等计算引擎处于这层,为了能让业务同学更加低成本的写计算任务, 各个引擎都支持 SQL 功能。
再往上是作业托管层,用来提交 ad-hoc 的作业,管理周期性的批处理作业,管理长时间运行的流式作业。
最上层是用户逻辑层,如数据日报,数据分析,模型训练等.
1.2 YARN 架构
上图中灰色背景区域是 YARN 的主要架构, 主要包含两种角色:
ResourceManager
整个集群的大脑,负责为应用调度资源,管理应用生命周期。
对用户提供接口,包括命令行接口,API, WebUI 接口。
可以同时存在多个 RM,但同一时间只有一个在工作,RM 之间通过 ZK 选主。
NodeManager
为整个集群提供资源,接受 Container 运行。
管理 Contianer 的运行时生命周期,包括 Localization,资源隔离,日志聚合等。
YARN 上运行的作业:
在运行时会访问外部的数据服务,常见的如 HDFS,Kafka 等
会在运行结束后由 YARN 负责将日志上传到 HDFS 中
如何考虑节点 DRF 的调度?如何在运行时/重启时调整资源?
可下载文档:
YARN 在字节跳动的优化与实践 .pdf
(1.14 MB, 下载次数: 22)
2020-6-24 17:28 上传
点击文件名下载附件
原文链接:
https://mp.weixin.qq.com/s/9A0z0S9IthG6j8pZe6gCnw
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
美丽天空
发表于 2020-6-28 09:47:03
感谢分享
回复
使用道具
举报
显身卡
还有一些帖子被系统自动隐藏,点此展开
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
机器学习
最佳新人
积极上进,爱好学习
热心会员
经常帮助其他会员答疑
发表新帖
levycui
超级版主
关注
653
主题
1166
帖子
97
粉丝
TA的主题
人工智能,助力书写数字金融大文章
2024-9-14
开源模型超过最强闭源模型,Llama 3.1颠覆AI生态
2024-7-25
慈不掌兵,我被下属反向PUA了
2024-5-21
字节三面过程,最终还是凉了
2024-4-25
用户画像算法:历史、现状与未来
2024-4-2
24小时热文
Docker+容器与容器云(第2版)
docker容器实战:原理、架构与应用
Docker基础与实战
kafka面试题精选
Nebula Flink Connector 在实时 ETL 的实践
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈