storm入门教程1:storm概述
http://www.aboutyun.com/thread-8048-1-1.html
1.Storm是什么,应用场景有哪些?
2.Storm有什么特点?
3.spout发出的消息后续可能会触发产生成千上万条消息,Storm如何跟踪这条消息树的?
4.Storm本地模式的作用是什么?
Storm入门教程2:Storm术语介绍及 构建Topology
http://www.aboutyun.com/thread-8049-1-1.html
1.Hadoop的MapReduce与Storm的topology有什么不一样的地方?
2.Nimbus与hadoop的jobtracer作用是否类似?
3.Nimbus和Supervisor之间的所有协调工作有谁来完成?
4.一个topology由哪两部分组成?
5.Storm HA模式如果机器意外停止,是如何处理任务的?
6.storm如何运行一个topology
7.Spout类里面最重要的方法是nextTuple,它的作用是什么?
8.Storm里面有几种种类型的stream grouping,分别是什么?
9.如何构建Topology?
Storm入门教程3: Storm安装部署步骤
http://www.aboutyun.com/thread-8056-1-1.html
1.storm包含几类节点? 2.什么程序运行在工作节点? 3.zoo.cfg各个配置项的含义是什么? 4.dataDir指定的是什么文件目录?这个文件目录会产生和存放什么文件? 5.server.id中id指的是什么? 6.Storm安装需要哪些依赖库? 7.storm.yaml配置文件需要做哪些修改? 8.如何停止Storm Topology?
Storm入门教程4: Storm消息的可靠处理
http://www.aboutyun.com/thread-8057-1-1.html
1.一个tuple(消息),为什么会导致成百上千消息?它与map分割是否相似?
2.tuple tree是如何形成的?
3.Storm如何才会认为一个从spout发送出来的消息被完整处理呢?
4.一个消息是否只会由发送它的那个spout任务来调用ack或fail
5. Storm提供的可靠处理特性是通过什么方式来实现的?
6.Storm如何跟踪tuple tree,每当一个消息被创建或应答的时候,它怎么知道应该通知哪个acker呢?
Storm入门教程5:一致性事务
http://www.aboutyun.com/thread-8058-1-1.html
1.Storm通过什么机制保证消息被成功处理?
2.Storm如何保证出错的tuple只被处理一次?
3.batch产生的原因是什么?
4.如何确保一个batch里面的所有tuple都被处理完了呢?
5.CoordinateBolt主要用于两个场景由哪些?
|