用户组:游客
问题导读 1.spark1.3增加了哪些功能? 2.DataFrames可以用来做什么? 3.机器学习库Spark MLlib本文讲的实现了哪些新的学习 ...
Apache Spark 1.3 发布,1.3 版本引入了期待已久的 DataFrame API,这是 Spark 的 RDD 抽象设计来简单快速支持大数据集的变革。 ...
问题导读 1.spark中job、stage、task他们之间的关系是什么? 2.DAGScheduler的主要职能是什么? 3.DAGScheduler包含哪些st ...
问题导读 1.spark如何对接到hbase中? 2.什么是百度开放云BMR? 3.Shuffle在百度的发展主要包括哪两个阶段? 4.百度New Sh ...
本帖最后由 nettman 于 2015-3-29 00:35 编辑 问题导读 1.如何修改日志级别? 2.如何进入Python shell及scala shell? 3. ...
问题导读 1.什么是机器学习? 2.机器学习可以来做什么? 3.机器学习技术可以被应用于哪三种不同方式? 这篇博 ...
问题导读 1、Spark内核架构的设计,优秀在于哪里? 2、Spark生态圈的核心和基础是什么? 3、spark的典型案列有哪些? ...
阅读导读: 1.Spark的发展历史? 2.Spark的特色有哪些? 3.Tachyon与HDFS相比,怎样? 4.字数统计算法在java 8中如何实现? ...
问题导读 1.Spark可以在哪三个地方配置系统? 2.如何实现动态加载Spark属性? 相关内容 Spark中文手册-编程指 ...
本帖最后由 desehawk 于 2014-12-17 19:06 编辑 问题导读 1.LDA的有哪两个实际使用场景?2.对节点集合进行排序本文说了哪两种 ...
问题导读 1.什么是Spark Package? 2.本文spark Package各自的作用是什么? 假如这个库能持续的发展下去,从 ...
问题导读1.在传大量数据的情况下,communication manager换成netty-based的实现了,实现这个功能有什么好处?2.Spark SQL中缓存表 ...
问题导读 1.什么是spark RDD? 2.本文讲了RDD哪些特点? 3.有哪两种方式可以创建RDD? 4.RDD Transform基本方法有哪些? 5 ...
问题导读 1.sparkSQL是如何发展而来的? 2.为什么sparkSQL的性能会得到怎么大的提升呢? 3.查询里采用通用的SQL语法去处 ...
问题导读 1.spark单独机器处理数据过大,会产生什么问题? 2.spark是否能支持复杂sql? 3.spark有未来哪些需要改进的地方 ...
请教 Unable to load native-hadoop library for your platform... using builtin-java classes where applicable hadoop2.2. ...
本帖最后由 pig2 于 2014-4-2 01:14 编辑 1.Spark的核心思路是什么? 2.Spark的适用场景是什么?
本帖最后由 pig2 于 2015-2-11 18:58 编辑 Spark中文手册1-编程指南 http://www.aboutyun.com/thread-11413-1-1.html ...
kafka发送消息,用spark streaming接收数据后做wordcount的例子,对数据进行split,能将数据print出来,但reduce之后print就出不 ...
导读: 本文较简单,可直接阅读 先上代码: 这是spark 自带的一个example 之前只能将代码达成jar包然后在spark ...
2014年的大数据领域,Apache Spark(以下简称Spark)无疑最受瞩目。Spark,出自名门伯克利AMPLab之手,目前由商业公司Databricks ...
新建一个Java工程,将hadoop相关的jar包,hbase相关的jar包和spark-assembly-1.0.2-hadoop2.2.0.jar都导入工程中,然后直接复制 ...
问题导读 1.spark安装需要哪些环境? 2.如何配置spark? 3.如何启动spark? Spark1.2.0伪分布式安装 ...
spark: 科普Spark,Spark是什么,如何使用Spark(1) http://www.aboutyun.com/thread-6849-1-1.html 科普Spark,Spark核 ...
问题导读: 1.maven编译spark应该注意什么问题? 2.spark在编译的时候,是否可以指定任意hadoop版本? ...
本帖最后由 pig2 于 2015-3-9 02:43 编辑 问题导读 1.在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文 ...
问题导读 1.本文将大数据的应用类型主要分为哪两种? 2.Spark技术是如何在网易应用的? 网易的实时计算需求对 ...
在本机搭建的hadoop平台,spark sql和hive存在无法互相访问的问题,流程如下: 1. spark sql创建表的过程如下: ./bin/spark-s ...
问题导读 1、Spark技术有哪些热点? 2、如何更好的使用Tachyon? 3、Tachyon在百度实践中遭遇的挑战有哪些? 本文 ...
问题导读 1.spark做了哪些改进? 2.本文认为spark与hadoop的关系是什么? Spark 1.2 发布,此版本包括 172 位贡 ...
本版积分规则 发表帖子
查看 »