用户组:游客
问题导读 1.什么是Spark? 2.Spark生态系统包括哪些? 3.Spark的依赖有哪些? 4.了解Spark架构是怎样的? 5.Spark是如何运 ...
问题导读 1.Spark有哪些运行模式? 2.Spark Standalone集群模式是如何部署的? 3.Spark Client 是如何部署的? 4.spark ...
问题导读 1.什么是弹性分布式数据集RDD? 2.RDD有哪些特性? 3.RDD有哪些好处? 4.RDD有哪些编程接口? 5.RDD之间的依 ...
问题导读 1.Spark算子有什么作用? 2.Transformation具体包括哪些内容? 3.Actions具体包括哪些内容? 4.算子分为哪几类 ...
问题导读 1.Spark环境搭建需要哪些流程? 2.如何安装scala插件? 3.思考:创建scala 项目的前提是什么? 4.项目如何打包? ...
问题导读 1.如何设置Intellij IDEA忽略部分类编译错误? 2.为什么要在Intellij IDEA中使用Eclipse编译器? 3.为什么Intellij ...
问题导读 1.Spark集群的执行单位是什么? 2.RDD的创建的来源是什么? 3.RDD之间是否可以转换? 4.如何实现修改spark WordC ...
问题导读 1.如何构造映射? 2.如何在映射中取值? 3.如何更改键值? 4.如何迭代映射? 5.映射如何排序? 6.Scala和ja ...
问题导读 1.Tachyon是什么? 2.Tachyon是如何设计的? 3.Tachyon在百度内部是如何使用的? Tachyon是Spark生态 ...
GraphX 是 图 和 图并行计算的 Apache Spark's API 灵活性 图与集合无缝结合 图结合ETL,探索性分析,迭代图计算。 ...
易于使用 使用Java, Scala 和 Python. MLlib 适合 Spark's APIs 于使用Python NumPy 交互((开始于Spark 0.9).) ...
spark RDD Transformations和Actions区别是什么?
问题导读 1、什么是“统一访问原则”? 2、如何使用@BeanProperty注解? 3、怎样理解Scala的构造器? 摘要: 在本篇中 ...
在yarn-site.xml中,可以配置virutal core的个数,请注意不是physical core的个数,相关配置如下: yarn.nodemanager.re ...
问题导读 1.在spark程序中,如何使用spark sql? 2.spark对于不同的数据源是如何处理的? 3.spark sql是否支持 JDBC 和 ...
问题导读 1.spark Streaming支持哪些语言? 2.spark Streaming是否具有故障恢复功能? Spark Streaming使容易的 ...
问题导读 1.spark安装包如何下载? 2.如何git下载源码包? 3.如果通过maven下载spark? 1.安装包下载 ...
下载了spark 1.4,运行spark-shell时遇到以下错误:[mw_shl_code=bash,true]java.net.UnknownHostException: UKON-M-Q0EP: U ...
问题导读 1.spark速度快的原因是什么? 2.spark有哪些组件? 3.spark可以使用哪些开发语言? Apache Spark ...
问题导读 1.如何配置Dispatcher? 2.Dispatcher的工作原理是什么? 序言 ...
本帖最后由 yuwenge 于 2015-6-2 20:59 编辑 问题导读 1.Spark on Yarn如何查看日志? 2.spark-env.sh文件的作用是什么? 3 ...
本帖最后由 pig2 于 2015-4-1 21:32 编辑 问题导读 1.如何把JSON文件转化为DataFrame? 2.如何将MySQL表转化为DataFrame ...
问题导读 1、怎么设置Spark Streaming? 2、如何实现字符串解析? 3、怎样产生sessions? 这个 Spark Streaming 样 ...
问题导读 1.什么是DataFrame? 2.Spark SQL如何实现API的? 3.DataFame是如何替代RDD的? 序言 Spark ...
本帖最后由 pig2 于 2015-6-18 00:42 编辑 问题导读: [*]概述 [*]开始 [*]图属性 [*]图操作 [*]pregel API [*] 顶点和 ...
问题导读 1.Spark 1.4本文涉及了哪些函数? 2.随机数据生成函数的作用是什么? 3.为DataFrame新增加的数学函数本文介绍了 ...
问题导读 1.spark客户端有哪些配置列表? 2.如何向spark集群提交应用? 3.deploy-mode参数都是什么含义? 1. Sp ...
本帖最后由 坎蒂丝_Swan 于 2014-12-30 12:28 编辑 问题导读1.通常对象访问的速度都很快,但是为什么还需要2-5x的空间来存储 ...
问题导读 1.大数据处理可以分为哪三个类型? 2.Spark有哪些基本概念? 3.MapReduce如何转换到 Spark? 作者: ...
问题导读 1.hive/console能做什么? 2.hive/console原理是什么? 3.hive/console有哪些常用操作? 4.如何查看运行计划 ...
本版积分规则 发表帖子
查看 »