新版发布:
Flink1.8发布:都有哪些改变
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27045
1.Flink1.8引入对什么状态的连续清理?
2.保存点兼容性方面,不在兼容哪个版本?
3.Maven依赖在Hadoop方便发生了什么变化?
4.Flink是否发布带有Hadoop的二进制文件?
原理:
Spark2内存管理详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27044
1.Spark 中堆内内存是如何进行规划的? 2.Spark 对堆内内存的管理的具体流程是怎样的? 3.Spark 能否完全避免内存溢出(OOM, Out of Memory)的异常? 4.Spark 堆外内存是如何进行规划的它有哪些优势? 5.如何通过MemoryManager接口管理内存? 6.静态内存是如何分配的? 7.堆内内存大小的计算方式是什么? 8.统一内存管理机制是怎样的? 9.RDD 的持久化机制是如何进行的? 10.RDD 缓存的过程是怎样的? 11.存储内存的淘汰和落盘规则是怎样的? 12.多任务间内存是如何进行分配的? 13. Shuffle 的 Write 和 Read 两阶段对执行内存的使用过程是怎样的?
实操演练:
python实战之股票交易量化分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27043
1.什么是pandas-datareader? 2.怎样使用DataReader分析股票数据? 3.怎样可视化股价数据?
书籍:
Hadoop Spark生态系统操作与实战指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27047
英文资料:
Flink下一代数据分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27046
疑问解答:
关于mapreduce的map端
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27048
sparksql 访问hive 怎么控制权限
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27042
|