用户组:游客
本帖最后由 pig2 于 2015-3-28 00:32 编辑 问题导读: 1、MapReduce如何在关系代数的运算上发挥作用? 2、交运算思想是什 ...
本帖最后由 howtodown 于 2014-4-28 17:36 编辑 问题导读: 1.JVM重用可以通过设置哪个参数? 2.将Reducer数量设置为比Reduc ...
第一部分:重要的组件 Combiner •什么是Combiner •combine函数把一个map函数产生的对(多个key, value)合并成 ...
问题导读: 1、MRAppMaster 主要由哪几种组件/服务组成? 2、MRAppMaster提供了哪三种作业运行模式? 3、MRAppMaster 生命周 ...
问题导读 1.TaskTracker的Child进程是哪两个? 2.调试 Map/Reduce Task与那三个属性有关? 3.如果希望远程调试MapTask或则 ...
本帖最后由 pig2 于 2015-3-28 00:29 编辑 问题导读:1、 WordCount算法编程实现。2、矩阵乘法: 矩阵乘法原理和实现思路 ...
请教一个问题:在集群上运行Mapreduce V2程序,每次处理大约100G-400G的数据,但是程序运行后,NodeManager机器的CPU会达到 ...
本帖最后由 pig2 于 2015-3-28 00:29 编辑 问题导读 1.什么是单词共现算法? 2.单词共现算法如何实现? 3.单词共现算法实 ...
问题导读 1.如何修改reduce执行后文件名称? 2.实现自定义文件的输出,由哪个类来实现? 这样一个需求: 需要 ...
问题导读 1.数据采集什么时候开始与结束? 2.如何获取运行task的JVM pid? Hadoop集群上运行有多道Map ...
本帖最后由 52Pig 于 2014-11-8 22:39 编辑 阅读导读: 1.如何设计职位推荐引擎的指标? 2.简述职位推荐引擎所需要的系统架 ...
问题导读 1.修改文件名需要那个类来完成? 2.修改文件名在驱动程序(main)及reduce中,需要做哪些修改? 我们 ...
问题导读 1、MapReduce解决方案在金融行业中的运用有哪些? 2、什么是Platform Symphony MapReduce? 3、Platform Symphony M ...
问题导读 1、如何使用Mapreduce进行图计算? 2、单源最短路径计算结束的标志是什么? 3、Reduce阶段的输入数据来自哪里? ...
本帖最后由 pig2 于 2014-12-4 01:37 编辑 问题导读 1.什么技术能够解决 MapReduce 无法处理个别更新的问题? 2.那个技术 ...
我们的数据绝大多数都是在HIVE上,对HIVE的SEQUENCEFILE和RCFILE的存储格式都有利用,为了满足HIVE的数据开放,hive client的方 ...
问题导读 1、MapReduce合并了哪两种经典函数? 2、Hadoop的真正核心任务是什么? 2、MapReduce算法的主体思想是什么? ...
问题导读 1、Terasort算法的关键点有哪些? 2、map task如何对数据记录做标记? 3、map task怎样对一个数据块进行局部排序? ...
问题导读 1.sortAndSpill方法的作用是什么? 2.MapOutputBuffer实现了IndexedSortable接口,这个接口的作用是什么? ...
问题导读 1、如何对Map和Reduce函数,进行扩展? 2、MapReduce最成功的应用就是重写了什么系统? 3、你如何理解MapReduce的计 ...
问题导读 1.LineRecordReader的作用是什么? 2.DFSInputStream负责什么事情? [*]以Map任务读取文本数据为例: ...
问题导读 1.Hadoop对Map执行包含哪些流程? 2.RecordReader的作用是什么? 3.Context的作用是什么? 我从客 ...
问题导读 1.readBlock函数的作用是什么? 2.BlockSender.sendBlock()的作用是什么? DFSClient.RemoteBlockRea ...
本帖最后由 52Pig 于 2014-11-9 17:44 编辑 阅读导读: 1.什么是PeopleRank? 2.PeopleRank和PageRank有什么区别? 3.PR分 ...
阅读导读: 1.只使用Mapper不使用reduce的好处? 2.如何再MR中设置Reduce的个数? 3.如何使用Mapper类将数据入到HBase的多张 ...
问题导读 1.客户端提交任务,需要做哪些准备? 2.JobTracker中main函数主要调用有哪两部分组成? 3.TaskTracker做了哪些工 ...
阅读导读: 1.用R语言如何统计出邮箱出现的次数? 2.代码如何编写? 1. 需求描述 基于RHADOOP通过rmr包实现 ...
本帖最后由 bioger_hit 于 2014-11-2 00:00 编辑 此问题来自qq群,看到很多人不会,在此整理一下。 问题: 我每次调试MapR ...
问题导读: 1.如何使用脚本打包? 2.如何测试Scala代码? 昨天较完整地搭建了一个Hadoop环境,并仔细研究了几个配 ...
问题导读 1、你认为传统的MapReduce框架慢在哪里? 2、对于细粒度的任务模型,究竟有些什么优势? 3、如何理解细粒度任务模型 ...
本版积分规则 发表帖子
查看 »