用户组:游客
异常总结 ###1.Spark和hadoop依赖冲突 最近在实践项目遇到了问题,hadoop使用的是2.6.0(2.2.0也测试过),spark使用的1.2.1编译 ...
问题导读 1.什么是LSA?为什么需要LSA? 2.什么是SVD? 3.什么是词语文档矩阵? 4.什么是TF-IDF,有何作用,Spark中是否有 ...
本帖最后由 pig2 于 2017-2-15 16:52 编辑 问题导读 1.为什么会产生spark sql 2.sparkSQL包含哪些内容? 3.spark运行框架 ...
本帖最后由 feilong 于 2018-5-12 12:17 编辑 问题导读 1.如何执行聚类? 2.如何解释分析结果? 3.Spark畜类K-Means聚类 ...
问题导读 1.DataFrame中本文使用了row哪些方法? 2.操作DataFrame row需要导入什么包? 3.teenagersDF.map(teenager => "Name ...
本帖最后由 pig2 于 2017-12-15 18:11 编辑 问题导读 1.dataframe如何保存格式为parquet的文件? 2.在读取csv文件中,如何设 ...
问题导读 1.什么是分类变量? 2.什么是熵? 3.文中使用熵做何种操作? 上一篇:Spark 高级分析:第五章第8节 ...
问题导读 1.在Hive on Spark设计原则是什么? 2.Hive on Spark,hive,Spark都做了哪些修改? 3.在Hive on Spark下,表格 ...
Normalizer Normalizer是一个Transformer,它使用p-norm范数对数据集进行正则化,默认p的取值为2,借助Normalizer可以标准化输 ...
本帖最后由 desehawk 于 2018-4-16 21:39 编辑 问题导读 1.enable.auto.commit属性的作用是什么? 2.Offsests可以存储在哪 ...
此总结来自about云7群552029443 #### 看到群友,在使用spark2的时候,仍然使用的是spark1.x的函数。导致错误找不到类或 ...
本帖最后由 feilong 于 2018-4-6 21:39 编辑 问题导读 1.Spark本身有可视化工具吗? 2.如何用R将聚类结果可视化? 3.如何 ...
问题导读: 1.kafka 0.10有哪些更新?2.怎样实现Executor端缓存消费者?3.kafka 0.10在提高可靠性方面做了哪些改进? ...
本帖最后由 feilong 于 2018-3-30 11:39 编辑 问题导读 1.如何使用Spark实现K-Means聚类k值的选择? 2.K值是不是越大越好 ...
问题导读: 1.怎样对iOS的Crash Log进行符号化处理? 2.怎样解决ES的写入瓶颈问题?3.怎样做到高性能和可扩展? ...
群4中90371779,群友遇到这么个问题: [mw_shl_code=bash,true]application rejeted by queue placement policy[/mw_shl_ ...
本帖最后由 feilong 于 2018-3-9 12:57 编辑 问题导读 1.网络攻击的模式有哪些? 2.K-Means如何检测网络异常? 3.本章所 ...
问题导读 1.什么是Kubernetes? 2.在Kubernetes集群尝试新功能,该如何实现? 3.观看群集上创建的Spark资源,该如何操作? ...
本帖最后由 feilong 于 2018-3-2 15:05 编辑 问题导读 1.什么是异常检测?有什么作用? 2.什么是聚类? 3.什么是K-Means ...
问题导读 1.什么是随机决策决策森林? 2.如何做预测? 3.Spark实现了哪几种分类算法? 上一篇:Spark 高级分析: ...
问题导读 1.什么是良好的决策规则? 2.基尼系数与什么有关?基尼不纯度方程是什么? 3.熵是什么?其方程是什么? ...
问题导读 1.AUC指标是什么? 2.决策树现实时数据集要分成几份? 3.DecisionTree有哪几个方法? 上一篇:Spark 高 ...
本帖最后由 feilong 于 2018-1-12 19:13 编辑 问题导读 1.Covtype数据集在哪里下载? 2.使用Spark MLib实现一个决策树要做 ...
问题导读:1. Spark 中的 Transform 和 Action 区别是什么?2. foreachPartition 属于Transform 和 Action中的哪种操作?3. mapP ...
本帖最后由 feilong 于 2017-12-30 07:51 编辑 问题导读 1.什么是分类?什么是回归? 2.什么是向量?什么是特征 3.如何 ...
问题导读 1.spark SQL与传统数据库的区别在什么地方? 2.spark SQL独立使用,是否还需要hive? 3.Spark SQL都可以读取哪些 ...
本帖最后由 feilong 于 2017-12-22 08:26 编辑 问题导读 1.ALS.trainImplicit()参数有哪些?各自的意义是什么? 2.Spark M ...
问题导读 1.DataFrame合并schema由哪个配置项控制? 2.修改配置项的方式有哪两种? 3.spark读取hive parquet格式的表,是否 ...
问题导读: 1、如何理解Driver HA? 2、Driver失败如何实现恢复机制? 3、如何使用ReliableKafkaReceiver类型来实现可靠的数 ...
问题导读 1.spark SQL命令可以通过什么窗口直接执行? 2.如何远程访问spark SQL数据? 3.你认为使用spark SQL的方式有哪些 ...
本版积分规则 发表帖子
查看 »