用户组:游客
问题导读 1.本文讲了spark的那些优势? 2.淘宝使用spark来解决什么问题? 3.优酷土豆为什么使用spark? M ...
导读:1.spark1.2.1修复了哪些方面的bug?2.PySpark方面修复了哪些bug? Spark 1.2.1 发布,此版本是个维护版本,包括 ...
问题导读 1、TreeNode有哪三种形态? 2、Spark SQL的Catalyst框架核心有哪些类库? 3、TreeNode的核心方法是什么? ...
阅读导读: 1.初次安装,需要注意哪些问题? 2.Spark环境变量如何设置? 3.如何在eclipse下如何开发Spark? 开始搭建 ...
问题导读: 1、 Spark生态圈由哪些部分组成? 2、Spar和Hadoop MapRedeuce相比,有哪些优势? 3、Spark适用于哪些环境? ...
问题导读: 1、Spark Application的运行架构有哪些组成? 2、Spark on YARN 的运行过程是什么? 前言 Spark Applicati ...
问题导读 1.如何为zookeeper编写单元测试? 2.如何为Kafka编写单元测试? 3.如何为Spark编写单元测试? ...
问题导读 1、Spark如何快速上手? 2、如何运行你的Spark 应用程序? 3、学习Spark,你有怎样的见解? 快速上手 ...
本帖最后由 howtodown 于 2015-1-31 21:09 编辑 问题导读 1.在yarn-cluster模式, 其它jar脱离了client后SparkContext.addJar ...
本帖最后由 xioaxu790 于 2015-1-30 20:45 编辑 问题导读 1、什么是AppendOnlyMap? 2、如何理解spark的外排? 3、如何实现 ...
本帖最后由 pig2 于 2015-1-30 20:55 编辑 问题导读 1、什么是High-Level API? 2、如何查看更多SchemaRDD特性? 3、如何理 ...
本帖最后由 howtodown 于 2014-9-17 15:39 编辑 问题导读 1.RDD如果丢失能否重建? 2.mapreduce在迭代作业和交互作业中有 ...
问题导读 1、idea上运行local的spark sql hive流程是怎样的? 2、如何安装配置安装 remote metastore? 3、如何解决org.apach ...
问题导读1.spark shuffle都有哪些操作?2.本文spark shuffle分为哪两组任务?3.从1.1版本开始,Spark引入了“sort-based shuffle ...
本帖最后由 nettman 于 2015-1-21 10:30 编辑 问题导读 1、如何看待Spark生态系统? 2、为什么比MapReduce快呢? 3、如何走 ...
问题导读: 1.如何在Spark的伪分布模式下运行? 2.Driver可以运行在哪里? 3.Standalone模式有什么特点 Local模式 运行 ...
问题导读 Spark on YARN有哪两种模式? Spark有哪些常用配置? 采用yarn-client方式部署有什么好处? 1:概述 ...
本帖最后由 pig2 于 2014-7-10 23:33 编辑 问题导读: 1、Spark的最新版本是什么? 2、Spark的内核组件增加的是什么? 3、 ...
问题导读: 1.基于文件系统的单点恢复实现Spark集群高可用? 2.基于zookeeper的Standby Masters实现Spark集群高可用? ...
问题导读 1.spark on yarn你认为有什么优势? 2.spark on yarn该如何配置? 3.spark on yarn如何提交job? ...
问题导读 1、Hadoop有哪些诸多局限性? 2、相比MapReduce,Spark在这些需求中有哪些优势? 3、如何看待spark? 20 ...
本帖最后由 pig2 于 2015-1-6 14:19 编辑 问题导读 1.sort-based shuffle算法会产生哪些中间文件? 2.如果是使用SORT ...
本帖最后由 pig2 于 2015-1-6 14:18 编辑 问题导读 1.牛顿法有哪些优点体现? 2.L-BFGS算法中使用到的正则化方法是什么 ...
本帖最后由 pig2 于 2015-1-6 14:18 编辑 问题导读 1.http server是如何启动的? 2.页面中的数据是从哪里获取到的? ...
本帖最后由 pig2 于 2015-1-6 14:17 编辑 问题导读 1.Shuffle数据的写入和读取过程是怎样的? 2.HashShuffleReader ...
本帖最后由 pig2 于 2015-1-6 14:17 编辑 问题导读 1.构成Standalone cluster部署模式的四大组成部件有哪些?分别有什么 ...
本帖最后由 pig2 于 2015-1-6 14:16 编辑 问题导读 1.Spark基于Akka来进行消息交互,那如何知道谁是接收方呢? 2.对 ...
本帖最后由 pig2 于 2015-1-6 14:15 编辑 问题导读 1.scala是需要编译才能执行的语言,但提供的scala repl可以实现代码 ...
本帖最后由 pig2 于 2015-1-6 14:15 编辑 问题导读 1.standalone部署方式下的包含哪些主要节点? 2.Standalone集 ...
本帖最后由 pig2 于 2015-1-6 14:14 编辑 问题导读 1.Hive中有几种数据模型? 2.HiveQL的执行过程是怎样的? ...
本版积分规则 发表帖子
查看 »