用户组:游客
问题导读: 1.IntelliJ IDEA如何下载安装,有几种方式安装scala插件? 2.如何建立spark应用程序? 3.如何部署spark程序? ...
问题导读: 1.如何基于Spark做机器学习? 2.如何基于Spark做新词发现? 3.如何基于Spark做智能问答? Hi,大家好! ...
本帖最后由 不会飞的小凯凯 于 2016-4-22 20:25 编辑 问题导读: 1.RDD本质是什么? 2.shuffle本质是什么? 3.为什么spark容 ...
问题导读: 1.什么是Parquet?2.Hbase怎样转换为Parquet? 列式存储布局(比如 Parquet)可以加速查询,因为它只检查 ...
问题导读: 1.什么是Spark Streaming?2.怎样用Spark Streaming做关键词检测?3.怎样实现关键词检测程序? 许多公司使 ...
问题导读: 1.什么是Spark Streaming?2.Spark Streaming如何工作?3.怎样实现Spark Streaming? 本篇文章用Spark Stre ...
问题导读: 1.什么是MLBase? 2.MLbase机器学习算法的流程? 3.Scala实现KMeans算法? 1.什么是MLBase ML ...
问题导读: 1、DStream和RDD如何理解他们的关系? 2、RDD如何在Spark Stream中产生? 3、怎么释放Cache住的RDD? 大家 ...
本帖最后由 xuanxufeng 于 2016-5-10 15:41 编辑 问题导读 1.spark.cleaner.ttl为何被弃用? 2.在ContextCleaner,调用哪 ...
问题导读 1.UDF对spark sql的作用是什么? 2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方? 3.如何在spark中 ...
问题导读: 1.数据如何处理? 2.从数据中如何提取有用的特征? 3.有哪些衍生特征? 数据处理以及转 ...
本帖最后由 PeersLee 于 2016-4-27 19:55 编辑 问题导读: 1.本文内容适用范围是什么? 2.DStream, transformation, outpu ...
问题导读: 1. Spark On Yarn 如何提高CPU利用率? 2. 在并行计算处理框架下(Spark或MapReduce),为什么需要将数据进行分片 ...
问题导读: 1.什么是PySpark?2.怎样利用PySpark处理数据并进行图表分析?3.使用PySpark过程中需要注意哪些事项? ...
本帖最后由 PeersLee 于 2016-4-13 19:01 编辑 问题导读: 1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎? 2 ...
问题导读 1.Spark on YARN客户端模式作业运行过程是什么? 2.Spark on YARN集群模式作业运行过程是什么? 3.二者的区别是什 ...
本帖最后由 不会飞的小凯凯 于 2016-4-8 17:15 编辑 问题导读: 1.Spark的引擎工具有哪些? 2.每个引擎工具各有什么作用? ...
问题导读 1.spark提供了哪三种方式配置系统?2.环境变量如何配置?3.spark.executor.memory的含义是什么? Spark提供 ...
问题导读: 1.Saprk怎么Running在Thrift JDBC Server上? 2.java JDBC怎么操作? Running the Thrift JDBC/ODBC server ...
本帖最后由 breaking 于 2016-3-31 14:56 编辑 问题导读: 1.Spark Sql UDF怎么使用? 2.案例分析使用过程? S ...
问题导读: 1.怎样利用Spark机器学习API进行特征提取?2.怎样利用Spark机器学习API进行特征选择?3.Spark机器学习API中的特征 ...
本帖最后由 Oner 于 2016-4-3 19:13 编辑 问题导读: 1. SparkSQL作业是如何执行的?2.SparkSQL和Hive On MapReduce的区别在 ...
问题导读 1.spark如何增加CPU利用率? 2.partition是什么? 3.并行的executor的数量,有哪两种方式? 下面这些关 ...
问题导读: 1.什么时候需要启用 checkpoint?2.如何使用 checkpoint?3.在什么时机进行 checkpoint? 一个 Streaming ...
问题导读: 1.JobGenerator中的定时逻辑是什么?2.为 batch 生成 jobs的流程是什么?3.jobs的生成过程有哪几步? Job ...
问题导读: 1.streaming application 如何兼容众多数据源?2.receivers 是如何分发并启动的?3.receiver 接收到的数据是如何 ...
问题导读: 1.DStreamGraph怎么用? 2.DStream的依赖链是怎么样的? 在 Spark Streaming 中,DStreamGraph 是一个非 ...
问题导读: 1.如何初始化sparkContext? 2.如何设置查询条件? 3.如何获得hbase查询结果Result? 由于spark提供 ...
比如RDD里的计算调用了别的组件类里的方法(比如hbase里的put方法),那么序列化时,会将该方法所属的对象的所有变量都序列化的 ...
问题导读: 1.拿到数据我们怎么去做数据分析? 2.在spark中怎么去做聚类分析? 近期,comSysto公司分享了该公司研 ...
本版积分规则 发表帖子
查看 »