用户组:游客
问题导读 1.本章主要目的有哪些? 2.什么是Avro? 3.现有的RPC框架有哪些?有何异同? 关注最新经典文章,欢迎关注公 ...
问题导读 1.DataFrame是什么? 2.如何创建DataFrame? 3.如何将普通RDD转变为DataFrame? 4.如何使用DataFrame? 5.在1 ...
问题导读 1.Spark Shell如何新增依赖? 2.文中准备数据做了哪些处理? 3.如何处理不良记录? 关注最新经典文章,欢迎 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读 1、如何了解Spark的功能? 2、什么是Spark aggregate? Spark的官方文档其实说得并不是明了,很多内容如果 ...
问题导读 1.什么是多元正态分布? 2.将多元正态分布拟合到我们的数据中需要做什么? 3.如何进行数据试验? 关注最新经 ...
问题导读 1.如何使用Spark实现K-Means聚类? 2.K-Means聚类对输入有何要求? 3.如何查看聚类结果? 上一篇:Spa ...
问题导读 1.什么是VaR?有哪些计算方法? 2.什么是蒙特卡洛模拟? 3.本章都有哪些金融相关术语? 关注最新经典文章,欢 ...
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
问题导读 1.spark有哪些使用场景? 2.spark有包含哪些组件? 3.spark在哪些厂商已经应用? 4.spark如何实现地震检测? ...
Spark2.4.0 今天官网发布,这是一个大好消息。Spark 2.4.0是2.x的第五个发型版本。官方发布消息链接如下:http://spark.apache.o ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1、如何基于用户协同过滤的?2、使用idea是如何打包的?3、UserBase推荐算法主要做哪些工作?4、如何运行jar?5、运 ...
问题导读 1.为什么要在Kubernetes上运行Kafka? 2.Kafka在Kubernetes需要注意哪些问题? 3.在Kubernetes上的部署Kafka时, ...
问题导读 1. Spark出现问题如何定位? 2. Spark日志中,各种状态的意义? 3. Spark任务都有哪几个耗时阶段? 4. Spark任务如 ...
本帖最后由 levycui 于 2016-9-6 10:07 编辑 问题导读: 1、Spark Job Stage划分算法有哪些? 2、Task最佳计算位置算法如何 ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.如何创建rdd? 2.什么是pair rdd? 3.如何获取数组指定列? 4.foreachRDD的作用是什么? 本文来自 ...
问题导读 1.Spark2入门是哪个类? 2.为何要产生Spark-Session? 3.Spark-Session如何使用? 关注最新经典文章,欢迎关注公 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
问题导读 1.Spark有哪些模块发生改变? 2.Barrier Execution是什么? 3.将Spark数据与AI整合的是什么项目? 关注最新经 ...
本帖最后由 desehawk 于 2018-1-16 10:18 编辑 问题导读 1.Spark SQL在大规模数据集上遇到的哪些问题? 2.自适应执行的背 ...
问题导读 1.从哪个版本开始Elasticseach支持spark sql? 2.如何查找Elasticseach和spark sql对应版本? 3.如何实现Spark S ...
问题导读 1. 分布式矩阵是什么? 2. 在Spark中如何使用分布式矩阵? 3. 使用分布式矩阵的坑? 关注最新经典文章,欢 ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
问题导读: 1.常用的推荐算法有哪些?2.推荐系统是什么样的流程?3.从这个推荐系统我们能学到什么? 推荐算法就是利用用 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
本版积分规则 发表帖子
查看 »