用户组:游客
本帖最后由 howtodown 于 2014-8-24 20:07 编辑 问题导读: 1.什么是Spark Streaming? 2.Spark Streaming可以接受那些数 ...
问题导读: 1、Spark SQL操作流程有哪些? 2、如何加载/保存数据源? 3、保存模式有哪些? 首先看看从官网学习后总结 ...
问题导读: 1、什么是广播变量和累加器? 2、Java和Scala如何实现? 一、广播变量和累加器 1.1 广播变量: 广播 ...
问题导读: 1.怎样利用Spark分析日志文件?2.Spark 属性配置方式有哪几种?3.Spark作业调度的基本工作流程是什么? S ...
问题导读 1.spark是否兼容批处理和流式处理? 2.配置垃圾收集器时,主要有哪两种策略? 3.GC算法原理是什么? 4.spark如何根 ...
问题导读 1.Spark 2.0SQL做了哪些改变? 2.Spark 2.0,DataFrame、Dataset API做了哪些改变? 3.Structured Streaming APIs是 ...
问题导读 1.Spark SQL中的window API是哪个版本引入的? 2.本文通过什么例子解释了Window API的使用? Spark SQL ...
问题导读: 1.Spark 2.0是什么样的? 2.Structured API是什么? 3.Structured Streaming怎样工作? 4.机器学习与数据科学是 ...
问题导读 1.Spark在YARN中有几种模式? 2.Yarn Cluster模式,Driver程序在YARN中运行,应用的运行结果在什么地方可以查看? ...
问题导读 1.cluster mode 模式运行包含哪些流程? 2.yarn mode 运行模式有什么特点? 3..在关闭http file server进程时, ...
问题导读: 1.Spark Streaming在数据密集型应用中的位置在哪? 2.Spark Streaming 内部工作方式是什么样的? 3.Spark Streami ...
本帖最后由 nettman 于 2015-3-31 16:17 编辑 问题导读 1.什么是GraphX? 2.如何将Spark和GraphX引入到项目中? 3.从一个 ...
问题导读 1.spark如何实现列统计汇总? 2.MLlib在本文有哪些作用? Spark Mllib 统计模块代码结构如下: 1.1 ...
新手刚开始学习比较迷茫,参考下面,然后找相关资料学习 1 Spark基础篇 1.1 Spark生态和安装部署 在安装过 ...
问题导读: 1.怎样进行数据可视化的预处理?2.怎样创建wordcloud?3.怎样进行tweets定位并在地图上显示? 对于 Pyt ...
问题导读 1、当前集群的可用资源不能满足应用程序的需求,怎么解决? 2、内存里堆的东西太多了,有什么好办法吗? ...
谁介绍或者提供一些关于spark的视频或者资料啊,不胜感激
问题导读 1、如何对Spark中的mllib模块进行分析? 2、Spark实现机器学习算法的流程是怎样的? 本系列将对Spark中的py ...
本帖最后由 eying 于 2015-10-21 16:10 编辑 问题导读: 1.Spark 1.5.0运程调试的过程? 2.安装调试前需要的事情 ...
问题导读 1.如何将标准的RDD(org.apache.spark.rdd.RDD)转换成SchemaRDD? 2.什么是SchemaRDD? SchemaRDD在Spar ...
问题导读: 1.flume-ng与spark如何结合? 2.spark streaming如何与多种数据源结合? SparkStreaming是一 ...
问题导读: 1.什么是sbt? 2.sbt项目环境如何建立? 3.如何使用sbt编译打包scala? sbt介绍 sbt是一个代码编 ...
本帖最后由 xuanxufeng 于 2016-6-9 14:21 编辑 问题导读 1.什么是dataset? 2.本文认为DataSet和RDD主要的区别是是什么? ...
问题导读: 1.lambda架构原理是什么? 2.Hulu怎么进行数据收集? 3.怎么样监控数据? 在流式计算领域,Spark Streaming和 ...
问题导读: 1.spark streaming怎样做到可靠的sources和可靠的receivers?2.数据可能的丢失场景有哪些?3.什么是WAL? S ...
问题导读 1.spark ML持久性的关键特性包括哪些? 2.Apache Spark 2.0为何说为机器学习模型注入持久性? 简 ...
本帖最后由 Oner 于 2016-6-3 08:37 编辑 问题导读: 1. Spark MLlib 在应用架构中的位置是怎样的? 2. Spark MLlib 算法可 ...
问题导读: 1.新浪微博的三层架构是怎样的?2.新浪微博的Feed使用场景?3.新浪微博的Feed是怎样排序的? 一、新浪微博 ...
问题导读:1. Spark的HA实现可以通过哪几种方式实现?2. 基于文件系统的单点恢复实现HA如何配置?3. 基于zookeeper的Standby Mas ...
问题导读: 1. JVM分为哪几种? 2. 如何监测垃圾回收? 3. 如何优化executor内存比例 4. 更高级的垃圾回收调优有哪些? ...
本版积分规则 发表帖子
查看 »