用户组:游客
本帖最后由 breaking 于 2016-3-10 21:59 编辑 问题导读: 1.spark调优有哪些配置项? 2.工作中怎么去自己调优? ...
本帖最后由 breaking 于 2016-3-2 09:01 编辑 问题导读: 1.BlockManager原理是怎么样? 2.怎么在源码中解析BlockManager ...
本帖最后由 breaking 于 2016-3-10 21:48 编辑 问题导读: 1:spark1.6之前内存怎么管理? 2:spark1.6内存管理UnifiedMem ...
问题导读 1.SparkR与spark的关系是什么? 2.如何安装SparkR? 3.安装sparkR需要哪些软件及准备? SparkR是AMPLa ...
问题导读: 1.Spark交互式Shell如何使用? 2.更多RDD操作有什么? 3.缓存机制是怎样的? 本文 ...
问题导读:1.Intellij IDEA是什么工具2.下载后,如何安装scala3.搭建Spark源码阅读环境需要什么操作?4.如何搭建sprk开发环境? ...
问题导读: 1.Spark的安装需要准备哪些软件?2.单机怎样安装并配置Hadoop?3.单机怎样安装Spark? 本文将介绍Apache ...
问题导读: 1.什么是Spark Streaming?2.怎样配置并运行Spark Streaming?3.怎样调优Spark Streaming? Spark Stream ...
问题导读 1.PADDLE是什么? 2.PADDLE与业务逻辑结合的痛点 3.Spark on PADDLE 2.0的主要目标是什么? 导读: ...
问题导读: 1、与构建系统相关的actor和消息方面都有哪些? 2、actor系统4种主要的actor类型和两种专业的辅助actor类型是什么 ...
本帖最后由 hyj 于 2014-5-4 19:01 编辑 问题导读: 1.由不同线程提交的多个“jobs”(Spark actions)是否可以同时运行 2. ...
问题导读 1.本文认为SQLContext的作用是什么? 2.DataFrames对外DSL接口有哪些? 3.如何运行sql? Base on spar ...
本帖最后由 xioaxu790 于 2014-7-11 13:42 编辑 问题导读: 1、如何对Spark1.0.0源码编译? 2、如何生成Spark1.0的部署包? ...
问题导读: 1.Spark SQL接口是什么? 2.sbt的依赖有哪些? 3.Spark SQL + Hive + Hbase方式集成 操作是什么? ...
问题导读: 1、spark streaming 1.2 数据零丢失有什么特性? 2、数据可能丢失的场景都有什么? 3、spark streaming 1.3中使用 ...
问题导读 1.Spark中RDD是什么? 2.Spark支持哪两种类型的共享变量? 3.如何将一些Spark的类和隐式转换导入到程序中? 4. ...
问题导读: 1.Spark 1.4为什么Master 经常挂掉?2.为什么只有少数 Executor 在运行,别的 Executor 长时间空闲?3.Spark 如 ...
问题导读 1、怎样部署在程序中调用spark服务的环境? 2、在程序中IDE中远程调用服务,需要做哪些配置? 3、JavaSparkContext ...
本帖最后由 pig2 于 2014-5-11 14:38 编辑 问题导读:1、什么是Spark?2、 Spark和Hadoop的不同和整合? 前言:大数据 ...
问题导读: 1.怎样对DataFrame里面的数据进行采样?2.怎样查询DataFrame里面的数据?3.怎样将DataFrame保存成文件? 操作D ...
问题导读 1.RDD之间的依赖关系可以分为哪两类?2.spark rdd有哪两种容错方式?3.Spark中的RDD两种类型的操作,包括转换(Transf ...
问题导读 1.spark1.6做了哪些改变? 2.性能提升做了哪些改进? 3.增加了哪些新的算法和功能? Apache Spa ...
问题导读: 1、为什么要使用Apache Spark? 2、Spark如何工作? 3、如何安装Spark? 4、什么是弹性分布式数据集RDD? ...
问题导读 1.设置合理的批处理时间(batchDuration)的标准是什么? 2.Spark Streaming如何实现充分地利用集群的资源? 3. ...
问题导读: 1.Spark UI的处理流程是什么?2.这样分析现有Executors页面?3.怎样自己编写一个HelloWord页面? 前言有时 ...
问题导读 1.为什么DataFrame比RDD在存储和计算上的效率更高? 2.Spark从API的角度看,可以分为哪两大类? 3.Spark支持的外部 ...
1.Stage分为哪两种? 2.Stage是什么? 3.什么操作可以产生rdd?
问题导读: 1.spark中的partitionBy怎么理解? 2.spark中的mapValues怎么理解? 3.spark中的flatMapValues怎么理解? ...
问题导读: 1.spark算子分区怎么理解? 2.怎么用代码去查找分区及分区中的数据? Spark RDD是被分区的,在生成 ...
本帖最后由 levycui 于 2015-12-22 14:19 编辑 问题导读: 1、如何在Eclipse下设置Spark开发调试环境? 2、如何在IntelliJ下 ...
本版积分规则 发表帖子
查看 »