pig2 发表于 2017-12-17 10:40:34

2017年about云12月第02周经典帖子总结



hadoop3.0可用【 GA】版发布与alpha1版比较新发布了哪些功能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23526
1.容器新增加了哪个概念?
2.Opportunistic类型容器有什么特点?
3.为何说Opportunistic类型容器提高集群效率?
4.hadoop3.0,可以通过什么方式来配置Capacity 调度?
5.yarn资源类型除了cpu和内存,还可以自定义哪些类型?


spark2 sql编程之实现合并Parquet格式的DataFrame的schema
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23518
1.DataFrame合并schema由哪个配置项控制?
2.修改配置项的方式有哪两种?
3.spark读取hive parquet格式的表,是否转换为自己的格式?


spark2 sql编程样例:sql操作
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23501
1.DataFrame中本文使用了row哪些方法?
2.操作DataFrame row需要导入什么包?
3.teenagersDF.map(teenager => "Name: " + teenager(0)).show()中teenager 是什么trait?


机器学习入门基本知识:白话基本概念
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23498
1.什么是数据集?
2.什么是维度?
3.样本空间是指什么?
4.特征向量如何表示?
5.标记与我们函数y=a(x)中哪个变量类同?


spark2 sql读取数据源编程学习样例2:函数实现详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23489
1.RDD转换为DataFrame需要导入哪个包?
2.Json格式的Dataset如何转换为DateFrame?
3.如何实现通过jdbc读取和保存数据到数据源?



大数据四个必备数据分析入门的常识
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23503



资源:
Apache Spark和Tensorflow作为服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=23504





页: [1]
查看完整版本: 2017年about云12月第02周经典帖子总结