用户组:游客
Q1. Name the most common InputFormats defined in Hadoop? Which one is default ? Following 2 are most common InputForma ...
本帖最后由 pig2 于 2014-9-4 23:41 编辑 1、hdfs原理,以及各个模块的职责 2、mr的工作原理 3、map方法是如何调用reduce方 ...
1 使用Hive或者自定义MR实现如下逻辑product_no lac_id moment start_time user_id county_id staytime ...
1 一个mr跑的比较慢,如何来优化,至少给出6个方面 答: 因为mr的运行是以HDFS为存储基础的,那么可能会影响我们性能的是block ...
研究生还没毕业,以前参与过spark相关项目,没到源码级别。以后还是想从事大数据研发相关工作,请教大家该怎么准备面试或者相关 ...
单选题1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发 ...
有一千万条短信,有重复,以文本文件的形式保存,一行一条,有重复。 请用5分钟时间,找出重复出现最多的前10条。
阅读导读: 1.备战面试中的算法,可以进行哪些步骤? 2.如果要面机器学习一类的岗位,可以看看哪些书籍? 3.去国外找工作的话 ...
java转大数据,东西学得差不多了,就是没有具体的实战经验,面试时遇到了这些问题懵逼了只能瞎蒙,不知道怎么说比较合适,求大神 ...
新手刚弄openstack ,从horizon入手,准备做一个回收站,求各位大神 给点思路,推荐点书籍,拜托!!!
问题导读: 1.什么是Hadoop? 2.更智能&更大的数据中心架构与传统的数据仓库架构有何不同?3.基于 Hadoop 的数据中心的好 ...
1. HBase来源于哪篇博文? CA The Google File SystemB MapReduceC BigTableD Chubby 2. 下面对HBase的描述哪些是正确的? B、 ...
文化 说说你对zen of python的理解,你有什么办法看到它: import this 你在github上都fork过哪些python库,列举一下你经常 ...
Hadoop阿里巴巴面试题目 前段时间接到阿里巴巴面试云计算,拿出来给我们共享下 1、hadoop运转的原理? 2、mapreduce的原理? 3 ...
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是 ...
1、写脚本定时任务,固定时间用sqoop抽取某个表的数据到HDFS中,如何知道抽取的数据量。 2,如何快速查看100张表中的5张表。 ...
如果公司问道上家公司的一些情况怎么回答,比如公司有多少台服务器,什么类型的,内存,磁盘,pv,uv,成交量等等,还有相关的业 ...
面试题: 1、任意使用mapreduce或hive或storm,根据日志求20150501,当天每个用户访问页面的次数的top10 create table test(us ...
这里有77个问题,请大牛们,想想答案,谢谢,面试应该会遇到。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结 ...
屡战屡败
数据仓库工程师 职能范围: 负责建设公司级数据仓库,并基于大数据对业务提供深入有效的支持; 负责公司海量数据采集存储方案 ...
自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不 ...
本帖最后由 bioger_hit 于 2014-12-24 12:30 编辑 1.简要描述如何安装配置一个apache开源版hadoop,描述即可,列出步骤更好 ...
前言 坐在面试官面前拉锯“价格战”。战战兢兢生怕说错一个字,既委屈了自己又失去了机会……工作就要得到应有回报,这本是天 ...
本帖最后由 pig2 于 2014-12-9 15:06 编辑 一般采用分治法!,大文件映射成小文件 1. 给定a、b两个文件,各存放50亿个url, ...
本帖最后由 pig2 于 2016-5-18 15:15 编辑 java是hadoop基础,如果想测试一下自己的Java实力,不用找到其他面试题了,这里是Ja ...
问题导读 1、如何在Hero上在线编程? 2、你如何理解编程艺术的bug、错误等? 前言 熟悉本blog的朋友大都知道 ...
此文是我作为一个面试官关于如何在技术面试中出奇制胜的经验总结。现今大多数的面试都遵循一定的模式。如果你能够理解面试 ...
去除性格和习惯中的致命缺陷性格决定人缘,而人缘影响沟通成效,最终影响一个人的表达力。想成为一个道德完美的人是非常困难 ...
实时数据流 日志格式: uid logintime *** *** *** 需求 计算: 8月1号新增的用户量 (比如说有70) 8 ...
本版积分规则 发表帖子
查看 »