用户组:游客
[*]大数据量存储:分布式存储 [*]日志处理: Hadoop擅长这个 [*]海量计算: 并行计算 [*]ETL:数据抽取到oracle、mysql、DB2 ...
问题导读 1.hadoop2.x集群安装准备工作是否都是一样的?都需要哪些准备? 2.hadoop2.x各个版本集群安装是否通用? 3.hadoo ...
本帖最后由 pig2 于 2014-6-17 19:43 编辑 问题导读:1. 推荐系统概述;2. 推荐系统指标设计;3. Hadoop并行算法;4. 推荐系 ...
本帖最后由 pig2 于 2014-3-16 23:00 编辑 我们经常听thrift,我么也知道它可以和其他不同语言之间转换,那么我们想真切的看到 ...
本帖最后由 pig2 于 2015-3-13 21:25 编辑 导读本文除了一些常用的大数据工具,还总结汇总了其他大数据工具,几乎是最全的大数 ...
问题导读 1、为什么要做用户画像呢? 2、怎么做,做好了后用户画像怎么用? 为什么要做用户画像? 一 ...
本帖最后由 pig2 于 2014-6-9 23:39 编辑 正如大家所知,NameNode在Hadoop系统中存在单点故障问题,这个对于标榜高可用性的Had ...
问题导读: 1.MapReduce的应用场景是什么? 2.如何通过Configuration来设置全局变来那个? 3.如何获取设置的全局参数? ...
问题导读 1.单机模式、伪分布模式、全分布式模式的区别在什么地方 单机模式(standalone) 单机模式是Hadoop的 ...
可以带着下面问题来阅读: 1.chmod与chown的区别是什麽? 2.cat将路径指定文件的内容输出到哪里? 3.cp能否是不同之间复制 ...
问题导读 1.外部的应用程序需要操作HDFS的情况,该如何解决? 2.WebHDFS REST API可以完成什么事情? 3.Httpfs 配置启动,c ...
本帖最后由 howtodown 于 2014-8-21 22:32 编辑 问题导读: 1.hadoop历史服务器的作用是什么? 2.如何启动历史服务器? 3. ...
问题导读: 1.hadoop的mapreduce作业中出现Java heap space,你认为该如何解决? 2.Maven编译出现“java.lang. Java heap spac ...
1、Hbase中的备份策略有哪些,各有什么特点? hbase中的数据备份策略有两种:关闭集群进行全备份;在线对集群进 ...
阅读本文首先知道什么是YARN,如果不清楚,可以查看为什么会产生yarn,它解决了什么问题,有什么优势 可以带着下面问题来阅读本 ...
问题导读: 1.增加节点后,Hadoop不会自动的按照新的备份系数进行调整,该如何处理? 2.增加和删除节点,都需要修改哪些配置 ...
问题汇总: 1.java.io.IOException: Incompatible clusterIDs错误原因,以及如何解决? 2.org.apache.hadoop.yarn.exceptions. ...
本帖最后由 pig2 于 2014-3-20 20:44 编辑 1.hadoop本地库的作用是什么? 2.哪两个压缩编码器必须使用hadoop本地库才能运行? ...
第一部分:什么是HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 HDFS是高容错性的,可以部署 ...
问题导读 1.Impala与Hive是什么关系? 2.Impala的查询处理包含哪些过程? 3.Impala与Hive有哪些相同点? 1. I ...
问题导读 1.什么是Ambari? 2.Ambari项目是由哪几部分构成的? 3.Ambari系统架构是如何组成的? 前言Hadoop集 ...
Hadoop 文件系统shell使用命令介绍,基本上所有的命令与linux命令相差不大,下面为我的hadoop系统文件夹 查看命令:hadoop fs - ...
阅读本文可以带着下面问题 1.reduce数量由谁来决定? 2.运行作业的工具由哪些? 更多问题等待你挖掘 MapReduce的 ...
问题导读: 1.Context能干什么? 2.你对Context类了解多少? 3.Context在mapreduce中的作用是什么? 本文实在能够阅读 ...
问题导读 1.人工智能、机器学习、统计学和数据挖掘有什么区别? 2.它们之间到底有什么共同点和不同点? 3.它们是利用不同方 ...
问题导读 1.Cloudera Search的作用是什么? 2.如何全文搜索hadoop? Cloudera Search的推出,对于曾经做信息 ...
问题导读 1.这些结果是如何创造出来的?也就是推荐语料是如何生成的? 2.兴趣协同,细粒度时效性协同都是指什么? 3.总结二 ...
集群安装完毕,该如何测试和使用集群: 运行hadoop首先进入hadoop所在目录,第一次执行要格式化文件系统bin/hadoop namenode ...
本帖最后由 nettman 于 2014-5-10 01:54 编辑 问题导读: 1.对于hadoop开发方式总,采用本地引入包的开发方式,会遇到什么问 ...
本帖最后由 pig2 于 2014-5-19 15:32 编辑 1、Hive架构与基本组成 下面是Hive的架构图。图1.1 Hive体系结构 Hive ...
本版积分规则 发表帖子
查看 »