技术应用:
spark2.0对文本分词进行多分类建模
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27106
1、如何使用spark进行文本数据预处理?
2、如何进行数据处理模型训练、保存和调用?
3、如何进行多分类模型训练和超参数调优?
4、如何进行多分类模型预测和模型评估?
实时计算中有关G7的探索和实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27107
1.G7是如何工作的? 2.G7的业务场景是怎样的? 3.哪一种流计算框架比较适合IoT这个场景的? 4.G7业务应用案例 Flink目前在G7的应用场景有哪几个方面? 5.实时计算平台开发和现状是怎样的? 6.Glink的实时计算平台的架构是怎样的? 7.Glink主要由哪几个部分组成? 8.Glink实时计算平台的功能有哪些? 9.Glink-Framework框架提供哪些封装? 10.平台收益主要体现在哪几个方面? 11.未来对于flink的规划是怎样的?
文档:
Spark面试2000题(1_6期 外加60题)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27108
机器学习个人笔记完整版2.5
http://www.aboutyun.com/forum.php?mod=viewthread&tid=27109
|