用户组:游客
本帖最后由 pig2 于 2017-1-25 10:12 编辑 问题导读 1.如何测试端口是否是通的? 2.端口是否被暂用? 3.端口是否被打开? ...
问题导读1.腾讯为什么建设单个大规模集群?2.腾讯建设单个大规模集群是如何优化的?3.腾讯是如何优化JobTracker的? TD ...
下面轮到FSNamesystem出场了。FSNamesystem.java一共有4573行,而整个namenode目录下所有的Java程序总共也只有16876行,把FSName ...
一、zookeeper使用简介场景一 有这样一个场景:系统中有大约100w的用户,每个用户平均有3个邮箱账号,每隔5分钟,每个邮箱账需 ...
我们学习大数据,特别是想获取第一手资料,那么我们就需要学习国外的一些知识。 这个列表包含了几乎所有经常更新的大数据 ...
本帖最后由 pig2 于 2016-6-2 20:59 编辑 问题导读 1.hadoop3.0是基于jdk1.7还是1.8? 2.Hadoop 3.0有哪些新特性? 3.Had ...
本帖最后由 desehawk 于 2015-3-28 18:12 编辑 问题导读 1.hive了本文说了哪两个功能? 2.hbase1.0做了哪些改进? ...
问题导读: 1.秒杀业务如何分析? 2.秒杀业务有哪些挑战? 3.秒杀业务框架的原则是什么? ...
阅读本文可以带着下面问题: 1.Zookeeper客户端有几部分组成?2.那个模块管理所有网络IO的模块?3.Watcher是否允许多个Client对 ...
问题导读 1.namenode包含哪两个文件? 2.这两个文件的关系和作用是什么? 3.什么时候checkpiont ? namenode对 ...
问题导读 1.本文使用了哪些工具? 2.如何配置tomcat? 3.下载maven项目,如何导入Myeclipse? 测试软件版本: ...
问题导读: 1.如果获取hadoop src maven包? 2.编译hadoop需要装哪些软件? 3.如何编译hadoop2.4? 扩展: 编译hadoop为 ...
zk作用:维护共享锁保证只有一个active的nn journal:在两个nn间同步元数据 机器分配: 1、 配置core-site.xml ...
问题导读 hadoop入门已经有很多的资料,包括hadoop的中hdfs、mapreduce等下面分享给大家参考 前言之前在学校的时候 ...
问题导读 1.你认为GenericOptionsParser类的作用是什么? 2.Options类你认为它的作用是什么? 3.提交job中,面对多输入路径, ...
问题导读: 1.如何配置Configuration?2.如何获得DataNode相关信息?3.如何获得Active NameNode? ...
问题导读 1.怎么基于Ambari做二次开发? 2.如何安装samba? 3.开发流程是怎么样的? 前言 Ambari能 ...
上一篇:hadoop培训笔记之HDFS介绍--HDFS优点与缺点 可以带着下面问题来阅读本文: 1.面对shell命令,你是否能够想出对应的J ...
对于处理大数据的组织来说这意味着什么?意味着你拥有的数据越多,对数据的保护就越重要。意味着不仅要安全有效地控制离开自有网 ...
很多同学都问,如果我装两台机器,是否需要ZooKeeper ,可能没有真正明白ZooKeeper到底是干什么的,它用来干嘛的。下面给大家介 ...
问题导读 1.IDRescorer接口规定了哪些个必须实现的方法? 2.如何定义过滤规则? 通过Mahout构建推荐系统时 ...
问题导读: 1.下面例子是如何实现filter的 2.filter的过后的数据,又进行startRow, stopRow相结合查询? 首先, ...
本帖最后由 pig2 于 2015-4-17 19:57 编辑 问题导读 1.京东推荐系统三部曲是什么? 2.京东的推荐系统包含哪些架构? 3.京东 ...
本帖最后由 pig2 于 2015-6-1 00:51 编辑 问题导读 问题1:大数据测试基准应该具有的要素讨论? 问题2 : 对TPC-DS测试基 ...
thrift是一个软件框架,用来进行可扩展且跨语言的服务的开发。它结合了功能强大的软件堆栈和代码生成引擎,以构建在 C++, Ja ...
问题导读: 1.Oozie是什么? 2.如何定义工作流? 3.如何指定工作流名称? 4.如何kill工作流? 5.工作流路径如何定义? ...
问题导读 1.基于内容的推荐算法原理大本文分了哪三步? 2.什么是“Item”? 3.什么是“Item Profiles”? ...
本帖最后由 rsgg03 于 2015-4-14 21:49 编辑 导读 国内比较流行的hadoop,cloudera CDH,其实Hortonworks在国外也是非常流行 ...
问题导读: 1.保持分布式稳定性的方式有哪些? 2.分布式系统中保持网络稳定有哪五种方式? 3.服务器端断路器如何实现? ...
问题导读 1.本文认为R的应用场景是什么?你是如何认为的? 2.作者认为R+Hadoop看起来很美,实则困难重重,你是怎么认为的 ...
本版积分规则 发表帖子
查看 »