用户组:游客
问题导读 1.淘宝在Spark之上,主要做哪3个事情? 2.Spark给淘宝带来的好处是什么? 3.明风认为Spark 技术最适用于哪些应 ...
问题导读: 1.世纪佳缘推荐算法中运用什么算法产生候选集?2.世纪佳缘推荐算法中排序算法怎样实现的? 世纪佳缘推荐场 ...
问题导读: 1.Smack 4.1的改进有哪些?2.Smack 4.1的API变化有哪些? 一、Smack 4.1的主要改进 Smack 4.1.x最 ...
本帖最后由 pig2 于 2014-7-12 22:09 编辑 问题导读 1.Spark单点故障有几种解决方法? 2.基于文件系统的单点恢复适用于什么 ...
问题导读 1.本文是基于什么环境? 2.如何实现数据转发? 3.spark streaming 处理的代码是如何实现的? 曾经 ...
standalone模式下的框架图如下: 异常分析1: worker异常退出 [*]worker异常退出,比如说有意识 ...
问题导读 1.Spark与Map/Reduce有哪些区别? 2.Spark处理数据的过程是怎样的? 3.Spark有哪些优势? 摘要:Tri ...
问题导读: 1.spark是什么? 2.spark为什么节省磁盘io? 3.spark有哪两种容错方式? 4.什么是shark? 5.spark为什么擅长迭 ...
问题导读 1.input DStream的作用是什么? 2.spark、storm能否并行读取kafka?如何实现并行读取? 3.spark还存在哪些问题,新 ...
问题导读 1.首次运行hive-console需要什么条件? 2.运行hive/console是否需要启动Spark? 3.如何查看查询的Unresolved Logi ...
问题导读 1.Spark为高级分析提供了哪些框架? 2.你认为spark与hadoop有哪些不同? 3.Spark是否兼容hadoop所有版本? ...
问题导读 1.什么是DataFrame? 2.在大数据分析方面spark Sql 提供了哪些助力? 3.Spark 支持哪些数据源? 4.DataFrame有 ...
问题导读 1.Spark运行包含哪些流程? 2.本文认为Spark运行架构有哪些特点? 3.DAGScheduler的作用是什么? 4. RDD在Spark ...
问题导读 1.spark job与RDD的关系是什么? 2.什么是Executor? 3.什么是Driver? 1.1 术语定义 [*]Applic ...
问题导读 1.本文TaskScheduler创建包含哪些过程? 2.TaskScheduler、TaskSchedulerImpl、SchedulerBackend之间的关系是什么? ...
问题导读 1.submitMissingTasks本文是如何分析其流程的? 2.TaskSchedulerImpl中的submitTasks包含哪些流程? 3.resourc ...
问题导读 1.哪个配置项可实现Map Task的JVM参数? 2.容错有哪些参数? 3.本地运行需要配置哪些参数? 背景 ...
问题导读 1.spark如何编译? 2.spark分布式配置中,你认为那个文件比较关键? 3.如何启动、关闭spark集群? 4.如何测试spark ...
导读 spark是比较火的一门大数据技术,下面是某个同学的个人经验总结,借鉴过来,供大家参考 通过修改Spark的属性 ...
问题导读 1.在IDEA 环境下打包spark源码包含哪些步骤? 2.提交spark任务需要做哪些准备? 打开IDEA 在s ...
本帖最后由 pig2 于 2015-1-6 14:10 编辑 问题导读 1、如何理解重启之后数据也会被再次处理? 2、数据处理过程的过程有哪些 ...
本篇文章思考的问题:为什么Hadoop家族要加入Spark?MapReduce能否改善,MapReduce适合什么场景,是否MapReduce一无是处?Spark ...
问题导读: 1、Spark算子的作用是什么? 2、什么是Transformation和Actions? 3、算子分类有哪些? Spark算子的作用 ...
问题导读: 1、什么是输入分区与输出分区一对一型? 2、什么是输入分区与输出分区多对一型? 3、什么是输入分区与输出分区多 ...
问题导读 1.spark官网如何下载spark源码? 2.如何编译源码? 3.编译部署中遇到了哪些问题,是如何解决的? 1 ...
问题导读 1.Spark项目是如何发展的? 2.SparkR整合有哪些好处? 3.Spark1.4有哪些新特性? 6月11日(美 ...
本帖最后由 丫丫 于 2015-7-24 18:27 编辑 问题导读 1.Spark作业提交到执行是一个怎样的过程? 2.Driver任务提交是一个怎 ...
本帖最后由 丫丫 于 2015-7-24 18:35 编辑 问题导读 1.Task是如何实现的? 2.重要外部类有哪些? 3.进程模型与线程模型有 ...
问题导读 1.在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并 ...
Hadoop MapReduce采用了什么编程模型? 多进程模型有什么缺点? Spark采用了什么编程模型? Spark同节点上的任务以多线程的方 ...
本版积分规则 发表帖子
查看 »