Spark-About云-梭伦科技-第7页

About云-梭伦科技»专题 › 交流区› 技术交流› Spark

Spark

收录了 595 篇文章 · 3 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

windows+idea+sbt 如何使用国内的镜像

环境： win10 win10下 spark2.2 scala 2.11.8 自己下载解压的sbt 0.13.11 试了网上各种方法 ...

remarkzhao 2017-8-1 9 19377
spark streaming application日志问题

Spark新手，工作中用到spark streaming，使用流计算对kafka中topic数据进行获取并治理，过程中遇到一些小问题，希望大侠帮忙解答 ...

冰诺莫语 2016-8-17 5 18992
通过eclipse 提交sc.textFile("XX").count() 报错

2017-07-31 16:28:08,364 INFO org.apache.spark.executor.CoarseGrainedExecutorBackend: Got assigned task 5 2017-07-31 16: ...

taoxw 2017-7-31 11 9544
hadoop/hive均无问题，spark-sql执行出错，帮忙看一下

hadoop-2.8.1，hive-2.3.0 (metadata放在mysql)，启动、执行都很正常但是spark执行报错，编译的spark 2.2.0，带上了 -Phive ...

ifanxp 2017-7-31 2 11542
远程连接不上

拜托！拜托！哪位大神能帮我解决如下所述问题: 我的远程shell连接不上虚拟机了，但我看了看防火墙关着呢，ssh服务正常(并且我还 ...

连成呀 2017-7-31 4 4817
IntelJIDEA 编译任何程序都报错

使用intelJIDEA 编译任何程序都报错 Error:Module 'web_data' production: sbt.compiler.CompileFailed 不清楚哪里出问题 ...

yunge2016 2017-7-31 1 4841
spark on yarn mysql找不到驱动的错误

我提交的命令为 spark-submit --master yarn-cluster --driver-class-path /home/hadoop/mysql-connector-java-5.1.30.jar --ja ...

guxingyu 2016-6-1 8 23014
求大神解答。DataFrame想保存到Phoenix上

val jdbcDF = spark.read.format("jdbc").option("url","jdbc:sqlserver://192.168.1.21;username=sa;password=yishidb;database ...

remarkzhao 2017-7-26 15 20550
Spark在yarn-client运行一直accepted

我运行spark的spark.example.SparkPi例子，用yarn-cluster提交是可以运行的，但用yarn-client提交，日志一直打印[mw_shl_code=ja ...

zstu 2017-7-26 7 11853
求助： sbt打包，object Logging is not a member of package org.apache.spark

hi，早上sbt打包遇到这种问题。 object Logging is not a member of package org.apache.spark 上网一看，spark 2. ...

remarkzhao 2017-7-26 2 10470
Spark 写好程序提交就报错 java.lang.NoSuchMethodError: scala.collection.immuta...

Spark写了一个统计分析的例子，分析网站日志的受欢迎访问的字页面排名。现在运行报错。 java.lang.NoSuchMethodError: scala ...

yunge2016 2017-7-25 6 11406
求助：用spark拉数据到hbase

求助各位大神：有没有可能用spark 把表从sqlserver拉到hbase并且自定义rowkey？或者工具。。多谢。。。

remarkzhao 2017-7-25 4 5129
Spark的RowMatrix计算相似度

我用Spark中RowMatrix的columnSimilarities计算相似度，它返回的是An n x n sparse upper-triangular matrix of cosine similari ...

zstu 2017-7-25 1 6322
提交spark执行scala程序报错unread block data ，求指教

基本环境:hive是2.1.1，spark是2.1.0，hadoop是2.7.3出错的scala程序如图所示： web显示就执行到第二行qdRDD=rdd.map....... ...

yangyixin 2017-7-22 3 27585
求问怎么判断spark提交参数

我现在有5台机器，要求我调整原来的参数以适应现在的集群，以前集群的机器比较多，，，，，新手小白查了参数的含义以后也完全 ...

yangyixin 2017-7-20 6 7101
sparkstreaming的提交就卡死

弱弱请教一下各位大神。。。这是什么情况。运行spark官网上的一个streaming 程序用spark-submit提交上去就卡死在那， ...

remarkzhao 2017-7-20 24 15178
用spark写数据到hbase

请问各位大神这是什么情况。。从网上看了一个例子用spark向hbase写数据抛出的异常：java.lang.IllegalArgumentExce ...

remarkzhao 2017-7-19 10 15576
spark 处理上千个字段数据问题

数据源：一份1300个字段的数据，主键是 uid，后面是各个属性，命名是 x1,x2,x3...x1229 处理结果：想要得到，每个UID 的x1-x1 ...

chyeers 2017-7-17 8 7872
rdd sample()疑问

上面是sample() 三个参数的介绍，然后我用如下的例子进行测试： rdd1 = sc.parallelize([1,2,3,4,5]) rdd1.sample(True,0.5,1) ...

wjk_snail 2017-7-4 5 8022
大家使用spark实现ETL的使用方式有哪些？

本帖最后由 J20_果农于 2017-6-29 10:24 编辑如题：比如有个数据从hdfs抽取解析到hive或者从hive数据统计汇总的作业，大家 ...

J20_果农 2017-6-29 4 14216
spark读取parquet文件

spark2.10.6 用newHadoopFile来读取parquet文件 val rdd = sc.newHadoopFile(path,classOf],classOf[Void],classOf[String]) ...

macWang 2017-6-27 5 10934
spark 写wordcount 编译报错是用的maven项目环境

错误截图如下:

yunge2016 2017-7-17 3 5023
sparkstreaming数据通过Scala实现存储到数据库

从kafka里面取数据到sparkStreaming里面，然后再把数据保存到数据中关键点，不是每个数据都需要创建连接，只需要为每个分区创 ...

langke93 2017-1-9 1 10337
如何顶周期向mysql写数据，并覆盖原来的表

现在代码如下： [mw_shl_code=scala,true] import java.sql.{DriverManager, PreparedStatement, Connection} import org ...

Wyy_Ck 2017-6-19 5 11510
spark读取parquet文件问题

请大神指教：parquet文件读出来之后，要经过处理排序。很奇怪的是，dataframe = context.sql(xxx),这个dataframe.foreach(printl ...

macWang 2017-6-15 3 8382
启动thriftserver报错

启动thriftserver报错，以下是官方指导http://spark.apache.org/docs/latest/sql-programming-guide.html#distributed-sql-engin ...

yangyixin 2017-7-11 1 5490
求问sparksql怎么用SQL语句实现查找分位数

无比小白的。。求指方向完全是hadoop和spark的新手，被要求用sparkSQL语句实现查找分位数，无从下手，求问spark怎么实现呢

yangyixin 2017-7-6 5 18558
Spark Streaming日志分析思考、选择方案及部分代码实现

问题导读： 1.Spark Streaming 与 Storm 对适用场景分别是什么？2.怎样自定义 Partitioner 以实现日志文件快速存储到HDFS ...

fc013 2017-4-22 3 21976
spark用java编程序DataFrame包找不到，奇怪了

正常情况下DataFrame类应该在这个包下：org.apache.spark.sql.DataFrame ，在eclipse中写java发现此包中没有DataFrame类。 ...

一颗银杏树 2017-6-26 3 9264
spark rdd如何做到terasort那样的快速排序

我想使用spark rdd做到像terasort那样先取样分区再排序的功能，写了好久效率总是很慢，请大神指教下吧

macWang 2017-6-22 5 10724