分享

storm编程实战(代码实例)

hyj 发表于 2014-6-11 18:58:42 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 1 19198
问题导读:
1.如何实现实时随机输出一字符串
2.tuple是由哪类个来发出的?
3.哪个类处理输入tuple?






本节探讨一下storm具体怎么使用,明白怎么在windows下开发storm程序。

功能描述:实时随机输出一字符串。

在开发前记得导入storm需要的jar包。
1、SimpleSpout类继承BaseRichSpout类,用来产生数据并且向topology里面发出消息:tuple。

  1. package com.ljq.helloword;
  2. import java.util.Map;
  3. import java.util.Random;
  4. import backtype.storm.spout.SpoutOutputCollector;
  5. import backtype.storm.task.TopologyContext;
  6. import backtype.storm.topology.OutputFieldsDeclarer;
  7. import backtype.storm.topology.base.BaseRichSpout;
  8. import backtype.storm.tuple.Fields;
  9. import backtype.storm.tuple.Values;
  10. /**
  11. * Spout起到和外界沟通的作用,他可以从一个数据库中按照某种规则取数据,也可以从分布式队列中取任务
  12. *
  13. * @author Administrator
  14. *
  15. */
  16. @SuppressWarnings("serial")
  17. public class SimpleSpout extends BaseRichSpout{
  18. //用来发射数据的工具类
  19. private SpoutOutputCollector collector;
  20. private static String[] info = new String[]{
  21. "comaple\t,12424,44w46,654,12424,44w46,654,",
  22. "lisi\t,435435,6537,12424,44w46,654,",
  23. "lipeng\t,45735,6757,12424,44w46,654,",
  24. "hujintao\t,45735,6757,12424,44w46,654,",
  25. "jiangmin\t,23545,6457,2455,7576,qr44453",
  26. "beijing\t,435435,6537,12424,44w46,654,",
  27. "xiaoming\t,46654,8579,w3675,85877,077998,",
  28. "xiaozhang\t,9789,788,97978,656,345235,09889,",
  29. "ceo\t,46654,8579,w3675,85877,077998,",
  30. "cto\t,46654,8579,w3675,85877,077998,",
  31. "zhansan\t,46654,8579,w3675,85877,077998,"};
  32. Random random=new Random();
  33. /**
  34. * 初始化collector
  35. */
  36. public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {
  37. this.collector = collector;
  38. }
  39. /**
  40. * 在SpoutTracker类中被调用,每调用一次就可以向storm集群中发射一条数据(一个tuple元组),该方法会被不停的调用
  41. */
  42. @Override
  43. public void nextTuple() {
  44. try {
  45. String msg = info[random.nextInt(11)];
  46. // 调用发射方法
  47. collector.emit(new Values(msg));
  48. // 模拟等待100ms
  49. Thread.sleep(100);
  50. } catch (InterruptedException e) {
  51. e.printStackTrace();
  52. }
  53. }
  54. /**
  55. * 定义字段id,该id在简单模式下没有用处,但在按照字段分组的模式下有很大的用处。
  56. * 该declarer变量有很大作用,我们还可以调用declarer.declareStream();来定义stramId,该id可以用来定义更加复杂的流拓扑结构
  57. */
  58. @Override
  59. public void declareOutputFields(OutputFieldsDeclarer declarer) {
  60. declarer.declare(new Fields("source")); //collector.emit(new Values(msg));参数要对应
  61. }
  62. }
复制代码

2、SimpleBolt类继承BaseBasicBolt类,处理一个输入tuple。

  1. package com.ljq.helloword;
  2. import backtype.storm.topology.BasicOutputCollector;
  3. import backtype.storm.topology.OutputFieldsDeclarer;
  4. import backtype.storm.topology.base.BaseBasicBolt;
  5. import backtype.storm.tuple.Fields;
  6. import backtype.storm.tuple.Tuple;
  7. import backtype.storm.tuple.Values;
  8. /**
  9. * 接收喷发节点(Spout)发送的数据进行简单的处理后,发射出去。
  10. *
  11. * @author Administrator
  12. *
  13. */
  14. @SuppressWarnings("serial")
  15. public class SimpleBolt extends BaseBasicBolt {
  16. public void execute(Tuple input, BasicOutputCollector collector) {
  17. try {
  18. String msg = input.getString(0);
  19. if (msg != null){
  20. //System.out.println("msg="+msg);
  21. collector.emit(new Values(msg + "msg is processed!"));
  22. }
  23. } catch (Exception e) {
  24. e.printStackTrace();
  25. }
  26. }
  27. public void declareOutputFields(OutputFieldsDeclarer declarer) {
  28. declarer.declare(new Fields("info"));
  29. }
  30. }
复制代码
3、SimpleTopology类包含一个main函数,是Storm程序执行的入口点,包括一个数据喷发节点spout和一个数据处理节点bolt。
  1. package com.ljq.helloword;
  2. import backtype.storm.Config;
  3. import backtype.storm.LocalCluster;
  4. import backtype.storm.StormSubmitter;
  5. import backtype.storm.topology.TopologyBuilder;
  6. /**
  7. * 定义了一个简单的topology,包括一个数据喷发节点spout和一个数据处理节点bolt。
  8. *
  9. * @author Administrator
  10. *
  11. */
  12. public class SimpleTopology {
  13. public static void main(String[] args) {
  14. try {
  15. // 实例化TopologyBuilder类。
  16. TopologyBuilder topologyBuilder = new TopologyBuilder();
  17. // 设置喷发节点并分配并发数,该并发数将会控制该对象在集群中的线程数。
  18. topologyBuilder.setSpout("SimpleSpout", new SimpleSpout(), 1);
  19. // 设置数据处理节点并分配并发数。指定该节点接收喷发节点的策略为随机方式。
  20. topologyBuilder.setBolt("SimpleBolt", new SimpleBolt(), 3).shuffleGrouping("SimpleSpout");
  21. Config config = new Config();
  22. config.setDebug(true);
  23. if (args != null && args.length > 0) {
  24. config.setNumWorkers(1);
  25. StormSubmitter.submitTopology(args[0], config, topologyBuilder.createTopology());
  26. } else {
  27. // 这里是本地模式下运行的启动代码。
  28. config.setMaxTaskParallelism(1);
  29. LocalCluster cluster = new LocalCluster();
  30. cluster.submitTopology("simple", config, topologyBuilder.createTopology());
  31. }
  32. } catch (Exception e) {
  33. e.printStackTrace();
  34. }
  35. }
  36. }
复制代码



运行结果效果如下:
1.png












已有(1)人评论

跳转到指定楼层
junzi234 发表于 2014-6-11 22:37:10
storm 留着备用!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条