用户组:游客
问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? ...
http://pan.baidu.com/s/1kToXSl5 **** 本内容被作者隐藏 ****
**** 本内容被作者隐藏 ****
写了一个从Hbase中读数据处理后再保存回Hbase的程序,但是运行会出现Task not serializable报错 代码如下: [mw_shl_code=scal ...
有两个集群,一个部署在阿里云,一个部署在三台虚拟机上: 在虚拟机上的:spark-sbumit提交和idea直接提交到集群都可以正常运行 ...
Error:scalac: bad symbolic reference. A signature in SparkContext.class refers to term hadoop in package org.apache whi ...
通过Spark Streaming获取不到HDFS上面的数据, val conf = new SparkConf().setMaster("local").setAppName("RDDTest"); v ...
场景: 每天跑一部分分析数据,计算一项业务的人数。 但是最终查询的时候,是多天一起查的,这个时候就涉及对人数的去重。 ...
我在使用spark-sql 的 时候,有个问题一直困扰我.spark-sql 为什么不能像hive一样,自定义永久函数.而是需要每次都加载本地的udf j ...
如题,在网上看到了一个scala版本的例子,但是scala没接触过,看起来很吃力,希望各位大大能给个Java版的例子,不 ...
【求助】Spark如果在写入多个HBase表中,最近项目需要用到Spark Streaming,在研究写入HBase时,单表OK。 但是写入多表没有成功 ...
SSH 可以互相无密码登陆,ping也能ping通。但是worker就是连不上master vanxd@master:~/i/Spark/spark-1.3.1-bin-hadoop2.6/s ...
怎们用Scala 编写一个通过时间找到对应的ip..........,然后按时间排序
spark-shell yarn-client模式启动总是出现异常。 运行环境如下: spark1.3 hadoop2.6 HA jdk1.8.0_31 spark-env.sh ...
Spark1.3,运行SparkStreaming的时候提示错误,运行Spark-SQL正常 运行环境:Spark1.3+Hadoop2.6.0+JDK1.8 运行官方的Stre ...
/** * Created by Administrator on 2016/9/24 0024. */ package com.keduo import java.util.Properties import o ...
sparksql 可以修改map数吗
源数据:(“人名”,年龄) val rdd = sc.parallelize(Array[(String,Int)](("Michael",29),("Andy",30),("Justin",19), ("Tom" ...
[mw_shl_code=java,true]val spark = SparkSession.builder().appName(this.getClass.getSimpleName) .master(master). ...
从网上找了几篇说法一一试了都没有用,不知道是不是帖子比较久远的原因 我的hive是2.1.1,spark是2.1.0,hadoop是2.7.3 求详细 ...
说在前面的话: 几年前我做过银行项目,那会使用IBM的datastage这个产品,只要拖拖拽拽就可以实现多数据源的表关联取数 ...
请大神,帮我看看这个问题, 1.我自己写的WordCount在本地能跑,在spark-shell上能跑,但是在spark-submit上报错 2.排除scala ...
本帖最后由 PeersLee 于 2017-3-1 14:38 编辑 问题导读: 1. spark 如何在1.6.0之后使用Netty替代了Akka? 2. Spark Net ...
背景需求: 基于实时的用户点击日志,计算出当天的pv、uv。 pv很好说了....UV这种需要按照用户唯一标识去重的如何计算呢? ...
如题,我想将如下数据格式的数据源通过spark做数据转换: id, ip, version : 有效数据 ...
[hadoop@hadoop001 bin]$ ./spark-shell Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ ...
最近要做大数据平台下的视频图像处理,不知道Spark计算框架可以对视频图像数据处理吗?与MapReduce区别大吗?
hive上的表t2,信息如下: spark-sql> desc formatted t2; OK 16/09/05 09:58:57 WARN LazyStruct: Extra bytes detected at ...
现在有个项目要求: 需要每隔五秒提交一个作业,处理传入spark集群最近的1000条数据,所以这里经过streaming传入的数据必须要先 ...
SparkSql运行后,会生成很多小文件200个task就生成200个文件,有什么好办法解决? 补充内容 (2016-11-14 03:55): package mai ...
val rdd = sc.textFile("..").map(x => x.split(",")).map(x => (x(0), x(1).toLong)) val df = rdd.toDF df.show df.cache ...
本版积分规则 发表帖子
查看 »