用户组:游客
问题导读 1.如何更新解压包的权限? 2.如何配置环境变量? 3.如何验证Scala是否安装成功? 来自 about云日志 ...
问题导读: 1.怎样用IntelliJ IDEA开发多个项目? 2.开发多个项目过程中有哪些注意事项?3.多个项目之间的依赖关系是怎 ...
问题导读 1.本文如何实现读取Postgresql某一张表的数据为DataFrame? 2.如何写入Postgresql某张表中? 3.如何提交程序 ...
问题导读: 1. StreamingContext 如何获取数据? 2. receiverTrackerstart 底层如何实现? 3. receiverExecutorstart 底层如 ...
问题导读 1.Scala是如何实现分析商店购买记录的? 2.对比Scala程序与Java程序实现差别? 3.三种语言各有什么特点? ...
问题导读: 1.RDD有哪些特性? 2.什么是计算抽象?3.Spark核心组件之间的交互流程是怎样的? Apache Spark是 ...
问题导读 1.spark2.0在引擎性能方面优化体现在什么方面? 2.spark2.0重构了哪些内容? 3.钨丝计划包含什么内容? ...
问题导读: 1、spark streaming任务日志遇到的问题有哪些? 2、spark streaming如何集中收集log? 3、如何配置apache log4j实 ...
问题导读 1.将DataFrame数据如何写入到Hive表中? 2.通过那个API实现创建spark临时表? 3.如何将DataFrame数据写入hive指 ...
本帖最后由 desehawk 于 2017-1-23 18:11 编辑 问题导读 1.训练分类模型是如何实现的? 2.如何使用分类模型? 3.如何实现评 ...
本帖最后由 PeersLee 于 2017-1-18 11:50 编辑 问题导读: 1. 如何搭建准备环境? 2. 如何搭建运行环境? 3. 如何处理数据 ...
问题导读 1、如何减少批数据的执行时间? 2、Spark有哪些方面的性能优化? 3、有哪些错误我们需要关心? (一 ...
本帖最后由 pig2 于 2017-1-16 18:38 编辑 问题导读 1.spark有哪些进程? 2.spark配置文件中常用属性的含义是什么? 3.sp ...
问题导读: 1.什么是zeppelin?2.怎样实现zeppelin多租户使用? 1、zeppelin简介zeppelin是基于Web的可视化交互 ...
问题导读: 1.Spark 2.1.0有哪些主要改动?2.Spark 2.1.0的性能和稳定性有哪些改进? Spark 2.1.0是2.x分支中的第 ...
本帖最后由 pig2 于 2014-7-10 00:58 编辑 问题导读: 1、什么是Spark的All-In-One的解决方案? 2、有这么多大数据平台,我 ...
问题导读1.spark中什么是stage?2.什么是 kafka topic?3.本文中kafka和消费者线程遵循哪些约束? 最近在做利用Spark s ...
问题导读: 1. ELK 系统是如何进行架构的? 2. 为什么ELK 在 Spark 集群中是高可用性构架? 3. ELK 可以监控 Spark 集群的哪 ...
问题导读: 1.什么是延迟调度?2.延时调度如何工作?3.怎样判断是否还有当前 locality level 的 task 需要执行? 本 ...
本帖最后由 Oner 于 2016-12-29 10:42 编辑 问题导读:1. spark-jobserver有哪些特性?2. 如何安装spark-jobserver?3. 如何使 ...
问题导读: 1.什么是Spark-submit ?2.Executor启动流程是什么?3.Executor怎样进行任务调度? Spark-submit 提交 ...
问题导读: 1.什么是TaskSchedulerBackend、SchedulerBackend?2.FIFO与FAIR两种调度模式有什么区别?3.Task数据本地性资源怎 ...
问题导读: Example代码分析实例完成了什么功能? StreamingContext启动,都启动了什么功能? DStreamGraph是怎么生成的jobs ...
问题导读 1、RDD的依赖关系是什么? 2、spark和MapReduce的设计理念区别是什么? 概述 Spark Application在遇到 ...
问题导读 1.数据处理效率的问题,Spark定义了API的接口,主要有哪3个方式? 2.Spark DataSource实现代码有哪三大类? 3.Gro ...
本帖最后由 PeersLee 于 2016-12-14 10:52 编辑 问题导读: 1. 在使用destream.foreachrdd 连接数据库时经常出现的错误时什么 ...
问题导读: 1.怎样创建StreamingContext?2.怎样Spark Streaming处理数据?3.怎样解决从checkpoint目录读取应用信息,无法初 ...
问题导读:1. 什么是文本情感分析?2. 为什么要采用Spark?3. 基于 Spark 如何构建文本情感分析系统?4. 如何文本分类正确率? ...
Apache Spark的广播变量”(Broadcast variable)是什么? 两个文件/目录中的数据非常大,难以将某一个存放到内存中时,Spark如 ...
问题导读 1.本文的问题背景是什么? 2.本文中问题有哪三种解决办法? 3.三个思路有什么不同? 软件版本及平台 ...
本版积分规则 发表帖子
查看 »