用户组:游客
最近我拜读很多文章,都是介绍面试问题的,我真心不理解,面试官代表公司想要聘用的是最优秀的程序员,那就意味着需要想出一些有 ...
本帖最后由 Oner 于 2017-9-22 16:57 编辑 问题导读: 1. 程序员可以分为哪几个阶段呢? 2. 如何理解项目经验? 3. Java 程 ...
问题导读: 1.为什么要避免学科性的偏见?2. 如何测试面试者的知识广度?3. 怎样测试面试者的知识深度?4. 为何需要确认基 ...
1 使用Hive或者自定义MR实现如下逻辑product_no lac_id moment start_time user_id county_id staytime ...
一、 1、hadoop集群搭建过程,写出步骤。 2、hadoop集群运行过程中启动那些线程,各自的作用是什么? 3、/tmp/hadoop-root/ ...
Q1. Name the most common InputFormats defined in Hadoop? Which one is default ? Following 2 are most common InputForma ...
本帖最后由 pig2 于 2014-9-4 23:41 编辑 1、hdfs原理,以及各个模块的职责 2、mr的工作原理 3、map方法是如何调用reduce方 ...
1 一个mr跑的比较慢,如何来优化,至少给出6个方面 答: 因为mr的运行是以HDFS为存储基础的,那么可能会影响我们性能的是block ...
研究生还没毕业,以前参与过spark相关项目,没到源码级别。以后还是想从事大数据研发相关工作,请教大家该怎么准备面试或者相关 ...
单选题1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发 ...
有一千万条短信,有重复,以文本文件的形式保存,一行一条,有重复。 请用5分钟时间,找出重复出现最多的前10条。
阅读导读: 1.备战面试中的算法,可以进行哪些步骤? 2.如果要面机器学习一类的岗位,可以看看哪些书籍? 3.去国外找工作的话 ...
java转大数据,东西学得差不多了,就是没有具体的实战经验,面试时遇到了这些问题懵逼了只能瞎蒙,不知道怎么说比较合适,求大神 ...
新手刚弄openstack ,从horizon入手,准备做一个回收站,求各位大神 给点思路,推荐点书籍,拜托!!!
问题导读: 1.什么是Hadoop? 2.更智能&更大的数据中心架构与传统的数据仓库架构有何不同?3.基于 Hadoop 的数据中心的好 ...
1. HBase来源于哪篇博文? CA The Google File SystemB MapReduceC BigTableD Chubby 2. 下面对HBase的描述哪些是正确的? B、 ...
文化 说说你对zen of python的理解,你有什么办法看到它: import this 你在github上都fork过哪些python库,列举一下你经常 ...
Hadoop阿里巴巴面试题目 前段时间接到阿里巴巴面试云计算,拿出来给我们共享下 1、hadoop运转的原理? 2、mapreduce的原理? 3 ...
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是 ...
1、写脚本定时任务,固定时间用sqoop抽取某个表的数据到HDFS中,如何知道抽取的数据量。 2,如何快速查看100张表中的5张表。 ...
如果公司问道上家公司的一些情况怎么回答,比如公司有多少台服务器,什么类型的,内存,磁盘,pv,uv,成交量等等,还有相关的业 ...
面试题: 1、任意使用mapreduce或hive或storm,根据日志求20150501,当天每个用户访问页面的次数的top10 create table test(us ...
这里有77个问题,请大牛们,想想答案,谢谢,面试应该会遇到。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结 ...
屡战屡败
数据仓库工程师 职能范围: 负责建设公司级数据仓库,并基于大数据对业务提供深入有效的支持; 负责公司海量数据采集存储方案 ...
自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不 ...
本帖最后由 bioger_hit 于 2014-12-24 12:30 编辑 1.简要描述如何安装配置一个apache开源版hadoop,描述即可,列出步骤更好 ...
前言 坐在面试官面前拉锯“价格战”。战战兢兢生怕说错一个字,既委屈了自己又失去了机会……工作就要得到应有回报,这本是天 ...
本帖最后由 pig2 于 2014-12-9 15:06 编辑 一般采用分治法!,大文件映射成小文件 1. 给定a、b两个文件,各存放50亿个url, ...
本版积分规则 发表帖子
查看 »