用户组:游客
问题导读: 1、如何理解Oozie的工作流程 ? 2、它是如何与Hive、Sqoop等Hadoop协同工作的 ? Oozie工作流程定义是 ...
问题导读 1.borg集群有哪些使用者? 2.borg上运行的服务分为哪两类? 3.什么是Allocs? 3.borg运行在单机上的agent程序被 ...
本帖最后由 xuanxufeng 于 2015-9-25 20:36 编辑 问题导读 1.如何写一个分布式数据库?2.数据库系统架构如何分层?3.SQL层如何 ...
本帖最后由 howtodown 于 2014-2-21 17:11 编辑 此篇是在hadoop作业提交脚本分析(1) 的基础上 阅读本文可以带着下面问题: ...
继续对NameNode实现的接口做分析。public DatanodeCommand blockReport(DatanodeRegistration nodeReg, ...
第一部分 Hadoop 2.2 下载 Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执 ...
本帖最后由 xuanxufeng 于 2015-9-24 18:31 编辑 问题导读1.JVM存在哪些问题该如何解决?2.Flink是什么框架?3.Flink将内存分 ...
前面我们提过关系:文件名à数据块持久化在磁盘上,所有对目录树的更新和文件名à数据块关系的修改,都必须能够持久化。为了保证 ...
问题导读 1、数据在项目中的作用有哪些? 2、数据挖掘中,谁才是最重要的? 3、如何利用数据做日常监控? 1、做设 ...
数据库和文件中储存的数据量每天都在增长,因此我们需要构建能够储存大量数据(“大数据”),并且廉价、可维护、可伸缩的环境。 ...
问题导读: 1.什么是Apache Flume? 2.什么是Fluentd? 3.什么是Logstash? 4.什么是Scribe? 5.什么是Chukwa? 6.什么是 ...
王栋,美团网技术总监,负责美团外卖的搜索推荐及数据团队。2009年他博士毕业于清华大学人工智能实验室,研究机器学习算法 ...
本帖最后由 pig2 于 2014-12-27 02:01 编辑 问题导读: 1、如何分析一下job的maptask数 2、如何计算input文件的split个数 ...
接上文 about云源码分析之hadoop2.x(2.7.1为例)二次开发基础:命令行添加 我们有了基础,那么只需要找到hadoop源码是如 ...
问题导读 1、如何快速了解编程面试中排名前10的算法? 2、与树相关的一些概念有哪些? 3、如何定义一个队列Queue? ...
一、Oracle大数据机 1.Oracle大数据机器配置: 数据机采用18台Oracle Sun服务器全机架式配置,总共拥有: 864 GB主内存 ...
问题导读 1、你如何理解淘宝的分布式架构? 2、你如何理解当今互联网的去 IOE? 3、什么是CAP定律? 在刚刚过 ...
hadoop现在已经很流行,其中涉及ssh的配置,那么什么是ssh,从字面意义上来是一中安全外壳,也可以理解一种是网络安全措施。这种 ...
问题导读: 1、我们为什么使用netty? 2、netty是如何绑定端口? 3、netty如何启动服务? 4、netty有哪些核心组件? ...
问题导读: 不同进程的内存该如何设置? 如何定一个最大map任务数? mapred.tasktracker.reduce.tasks.maximum属性的作用是什 ...
本帖最后由 pig2 于 2014-5-9 17:44 编辑 我用的是双系统win7和ubuntu11.04,不是虚拟机。要安装hadoop。 1.ssh localhost ...
问题导读 1、如何对hadoop框架深入浅出的学习? 2、学习海量数据处理经验,我们可以借鉴哪些应用? 3、你如何理解淘宝的缓存 ...
问题导读 1、消息队列的使用在哪些场景? 2、消息队列有什么价值? 3、CMQ底层架构是什么样子的? 4、可靠性体现在哪些方 ...
问题导读 1.Canal是什么? 2.如何编写Canal客户端? 3.如何编写一个数据库操作的Spark程序代码? 4.开发Spark项目时容易 ...
本帖最后由 nettman 于 2014-2-23 22:27 编辑 这个没有标准答案,大家可以对下面问题发表个人看法 1.为什么要新建帐户和群组 ...
直到目前,我们看到的所有Mapreduce作业都输出一组文件。但是,在一些场合下,经常要求我们将输出多组文件或者把一个数据集分为 ...
随着科技行业已经投资了数十亿美元的几十打造下一代数据库和数据处理,大数据已经成为大交易。伴随厂商产生的大量新分支及其营销 ...
1、为什么要自定义Coprocessor
问题导读 1.你是如何预测大数据行业的? 2.本文是如何预测的? 3.你认为该如何根据行业来计划自己的2016? ...
问题导读 1.为什么定制Writable类? 2.如何定制一个Writable类? Hadoop中有一套Writable实现可以满足大部分需 ...
本版积分规则 发表帖子
查看 »