用户组:游客
本帖最后由 howtodown 于 2016-5-16 16:50 编辑 问题导读 1.如何判断发生数据倾斜? 2.为什么会发生数据倾斜? 3.如何定 ...
问题导读: 1. 为什么要建设大数据平台? 2. 大数据平台的业务架构有哪几块? 3. 数据可视化的原因是什么? 4. 数据可视 ...
问题导读 1、RDD是什么? 2、为什么产生RDD? 3、RDD在spark是什么地位? 4、RDD在spark说是什么作用? 5、如何操作RDD? ...
本帖最后由 pig2 于 2017-1-25 10:11 编辑 问题导读:1.spark是什么?2.spark都需要安装什么软件?3.本地模式如何配置?4.集群 ...
问题导读: 1.Spark的计算过程是怎样的?2.Spark中的任务调度分哪几个层次?3.Spark是怎样提高计算性能的? 基本概 ...
本帖最后由 Oner 于 2016-12-8 13:43 编辑 问题导读: 1. 使用spark如何实现最大值最小值问题? 2. 使用spark如何实现平均 ...
本帖最后由 pig2 于 2014-7-13 00:45 编辑 问题导读 1.什么是spark? 2.spark编程模型是什么? 3.spark运维需要具有什么知 ...
本帖最后由 pig2 于 2014-3-5 02:15 编辑 本篇文章很重要,也是spark为什么是Spark原因: 1.Spark的核心是什么? 2.RDD在内 ...
本帖最后由 Oner 于 2016-7-1 01:28 编辑 问题导读: 1. Spark开发调优常见的有哪几个原则?如何使用? 2. Spark作业运行的 ...
问题导读: 1、如何理解在应用程序间、程序内调度? 2、集群的资源分配有哪些方式? 3、资源分配策略有哪些? 4、如何配置调 ...
本帖最后由 howtodown 于 2015-3-24 16:34 编辑 问题导读 1.SQL语句在实际的运行过程中是怎么处理的呢? 2.sparkSQL的有哪 ...
问题导读 1、如何理解Spark技术的运用? 2、百度开放云BMR有哪些技术运用? 3、如何看待Enhanced in-memory columnar storage ...
本帖最后由 howtodown 于 2016-11-24 09:58 编辑 问题导读: 1. 使用什么样的数据集来进行预测? 2. 使用哪些工具与技术去 ...
问题导读: 1.DStream流有哪些操作?2.什么是窗口函数?3.DStream流有哪些输出操作? 根据Spark官方文档中的描述 ...
问题导读: 1、Spark 1.0和Spark 2.0中Spark Streaming有什么不同? 2、Structured Streaming是什么? 前言 Spark 2 ...
问题导读: 1.Spark调优有哪些原则?2.Spark作业原理是什么?3.怎样进行参数调优? 前言在大数据计算领域,Spark已 ...
问题导读: 1.为什么IDEA连着把spark-1.4.1的源码都编译了? 2.怎样把hive-site.xml文件"送"给IEDA?3.怎样设置设置IEDA的JV ...
问题导读 1.本文分析的日志格式什么样的? 2.如何通过代码实现的? 3.分析网页计分例子如何实现的? 本文首先对 Spa ...
问题导读 1.本文认为spark oom分为哪两种情况? 2.Spark在一个Executor中的内存分为哪三块? 3.内存溢出解决方法本文提出 ...
问题导读: 1.怎样配置hadoop插件?2.怎样配置spark插件?3.怎样配置scala插件? 前言:工欲善其事,必先利其器。倘若不 ...
本帖最后由 Oner 于 2016-10-27 17:14 编辑 问题导读: 1. LDA主题模型算法简介 2. Spark实现LDA的GraphX基础 3. PySparkml ...
本帖最后由 水电费 于 2015-6-19 16:26 编辑 问题导读 1.DataFream是如何创建的? 2.有哪些方法创建其接口? ...
问题导读:1.Spark是什么?2.什么是Spark Streaming?3.Spark作为计算框架的优势是什么? 一. Spark基础知识 1.Spark ...
本帖最后由 丫丫 于 2016-10-21 22:46 编辑 问题导读 1、如何定义图数据? 2、图数据分析与传统数据的处理有哪些不同之处? ...
问题导读 1.spark下载方式有哪些? 2.spark可以运行在哪些系统? 3.spark支持哪些语言? 4.如何运行spark各种语言版本例 ...
问题导读:1. hash shuffle 和 sort shuffle 的区别2. Spark shuffle 概述 3. shuffle write 内存消耗分析4. shuffle read 内存 ...
1.driver端R进程如何与JVM通信的? 2.executor端Rworker进程如何与JVM通信的? 在Spark2.X中SparkContext已经被SparkSession ...
[大数据之Spark]——Transformations转换入门经典实例 Spark相比于Mapreduce的一大优势就是提供了很多的方法,可以直接使用;另 ...
本帖最后由 丫丫 于 2016-10-7 20:48 编辑 问题导读 1、shipyard是什么? 2、engine是什么? 3、rethinkdb是什么? 4、 ...
问题导读: 1. 如何使用IDEA? 2.用java编写spark程序? 3.Spark实现wordcount? 为了在IDEA中编写sca ...
本版积分规则 发表帖子
查看 »