搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Spark
›
spark与flume整合的问题
0
3
0
分享
spark与flume整合的问题
fengfengda
发表于 2017-9-20 14:27:13
[显示全部楼层]
阅读模式
关闭右栏
3
4159
在创建的时候指定多个ip和端口号
val
flumeStream = FlumeUtils.
createPollingStream
(ssc
,
addresses
,
StorageLevel.
MEMORY_ONLY_SER_2
)我能否在flumeStream.foreachRDD(rdd => {
rdd.foreachPartition(f = it => {
it.foreach(event => {这里面得到是哪个ip和端口号传过来的数据或者得到flume的配置文件中的一些信息
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
NEOGX
发表于 2017-9-20 16:00:24
这个真不清楚,就看数据是否做标记了。也可以在传递的时候给数据打上标记,就可以识别了。
回复
使用道具
举报
显身卡
fengfengda
发表于 2017-9-21 15:39:49
sparkStream一次最多可以监控多少个flume的端口号,监控多少个比较合适
回复
使用道具
举报
显身卡
fengfengda
发表于 2017-9-21 15:42:04
还有这个sparkStream程序在生产环境是一直处于运行状态吗?用standalone好吗?
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
fengfengda
中级会员
关注
11
主题
65
帖子
5
粉丝
TA的主题
spark启动问题
2017-11-3
spark监控hdfs新增文件在sparkStreaming程序中能否得到这个文件的...
2017-10-12
spark与hdfs整合的问题
2017-10-11
一个Spark集群中能否同时运行多个任务
2017-9-22
spark与flume整合的问题
2017-9-20
24小时热文
kafka面试题精选
Nebula Flink Connector 在实时 ETL 的实践
Apache Doris 用户案例集
国家电网公司主数据管理系统技术规范
企业的主数据建设方法论与实践
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈