用户组:游客
本帖最后由 nettman 于 2014-7-9 00:14 编辑 问题导读: 1.如何使用hadoop-eclipse-plugin远程连接hadoop? 2.使用window ...
Map Reduce是包含两个过程:Map过程和Reduce过程。每一个过程都包含键值对作为输入,程序员可以选择键和值的类型。Map和Reduce的 ...
问题导读 1、HDFS框架组成是什么? 2、HDFS文件的读写过程是什么? 3、MapReduce框架组成是什么? 4、MapReduce工作原理是什 ...
1.setOutputFormatClass与setOutputValueClass的区别是什么? 如下代码: // 输入格式 job.setInputFormatClass(TextInputFo ...
问题导读: 1.如何在讲mapreduce函数中的字符串等信息,输出到eclipse控制台? 2.除了使用下文方法,还有其它方法输出到控制 ...
本帖最后由 nettman 于 2014-5-1 13:12 编辑 问题导读: 1.Partitioner分区类的作用是什么? 2.getPartition()三个参数分 ...
在Hadoop2.2.0伪分布式上面运行我们写好的Mapreduce程序。先给出这个程序所依赖的Maven包: 记得加上 否则运行程序的时候将会 ...
下面文章翻译与Yahoo的Hadoop教程,对于更接触hadoop mapreduce的朋友很有帮助。 函数式编程概念 MapReduce程序是设计用来 ...
本帖最后由 pig2 于 2014-5-1 01:24 编辑 本人适合对mapreduce有一定经验人来阅读,对于新手来讲,只是阅读前面会有收获不少, ...
本帖最后由 pig2 于 2014-6-2 13:18 编辑 问题导读 1.mapreduce程序与其他Java程序的区别是什么? 2.map类,reduce类可否放 ...
问题导读 1.本文的需求是什么? 2.本文是如何实现分析日志统计ip个数的? 3.map和reduce分别完成了什么事情? ...
本帖最后由 阿飞 于 2014-5-1 00:30 编辑 问题导读 1.map中key与value值分别是指什么? 2.reduce所接受的多个values是指什么 ...
问题导读: 1.怎样打乱数据?2.怎样实现一元一次线性回归?3.怎样验证结果? 1. 软件版本: Hadoop2.6.0(IDEA中源码 ...
当我们看到这个例子的时候,我们是否想过: mapreduce是否可以完成我们传统开发中经常遇到的一些任务。例如排序、平均数、批量w ...
本帖最后由 eying 于 2015-11-18 21:25 编辑 问题导读: 1.Redis是什么? 2.Redis数据结构是什么? 3.Redis的 ...
问题导读 1.如何确定倾斜的数据,如何缓解它们的影响 2.常见的数据倾斜有哪几类? 3.诊断map输出中哪些键存在数据倾斜? ...
本帖最后由 fc013 于 2016-7-3 10:44 编辑 问题导读: 1.怎样计算类别的先验概率?2.怎样计算每个词的条件概率?3.什么是假设 ...
本帖最后由 pig2 于 2016-6-23 14:32 编辑 问题导读: 1. Hadoop默认的HashPartitioner是如何进行分区的? 2. 如何自定义Has ...
问题导读: 1.什么是pr值? 2.如何通过mapreduce实现pr值? 3.map过程input、output为什么? 4.reduce过程:input、output为 ...
本帖最后由 xuanxufeng 于 2015-8-27 21:59 编辑 问题导读 1.什么链式mapreduce? 2.链式mapreduce解决了什么问题? 3.如何 ...
本帖最后由 desehawk 于 2015-3-19 11:48 编辑 问题导读 1.在Reudce端进行连接,reduce端的主要工作有哪些? 2.在Map端进 ...
本帖最后由 PeersLee 于 2016-3-6 18:12 编辑 问题导读: 1、MapReduce 是什么? 2、如何完成 属于自己的 wordcount Demo ...
问题导读: 1、如何理解MapReduce 编程模型? 2、如何对访问网页用户日志进行分析? 3、MapReduce模型如何对应实现? ...
问题导读 1.map和reduce任务都有影响的性能有哪些问题? 2. 作业竞争和调度器限制该如何解决? 3.效率低下的用户代码会拖累 ...
问题导读 1.作业的生命周期大概分几个阶段,你认为分几个阶段? 2.JobTracker通过什么方法分配任务的? 3.Hadoop中数据本地性 ...
本帖最后由 PeersLee 于 2016-3-23 16:02 编辑 问题导读: 1、MR程序 如何进行 本地模式运行? 2、MR程序 如何进行 集群模 ...
本帖最后由 xioaxu790 于 2014-5-21 10:26 编辑 问题导读: 1、mapreduce 作业优化 分哪些阶段? 2、map阶段和Reduce阶段的 ...
本帖最后由 52Pig 于 2014-10-30 23:17 编辑 阅读导读: 1.如何搭建RHadoop开发环境? 2.搭建RHadoop和Hadoop环境搭建的区别 ...
本帖最后由 PeersLee 于 2016-3-23 15:59 编辑 问题导读: 1.如何用mr 实现倒排索引? 2.什么是zookeeper? 3.怎样安装Zo ...
问题导读 1.网络爬虫的基本原理是什么? 2.什么是Jsoup? 3.爬虫的难点都有什么? 一、前言 ...
本版积分规则 发表帖子
查看 »