用户组:游客
问题导读 1.什么是回归分析? 2.我们为什么使用回归分析? 3.我们有多少种回归技术? 什么是回归分析? ...
问题导读: 1.Impala有哪些核心优势? 2.Impala能否与Hivemetastore database相集成? 3.Impala由哪些组件构成? 4.Imala查 ...
本帖最后由 pig2 于 2014-10-14 09:14 编辑 阅读导读: 1.影响Impala功能性能的各种因素? 2.如何对Impala查询进行性能调整 ...
大数据可以说已经在各个领域应用,那么hadoop在反作弊中,是怎么应用的那。 问题导读: 反作弊的本质是什么? 反作弊常用的技 ...
导读: 个人理解RPC是为分布式开发服务,是建立在Socket的基础上, Socket可以理解为一种传输协议 那么 1.什么是RPC? 2.使 ...
本帖最后由 xioaxu790 于 2014-9-4 16:49 编辑 问题导读 1、如何启动或关闭一个单一节点的Hadoop集群? 2、如何安装Hadoop T ...
问题导读1.哲学家就餐问题,有哪些解决方案?2.哲学家就餐与并发是什么关系? 在商用计算机中,多核系统已经越来越 ...
问题导读 1.Camera360为什么对云服务需求如此之大? 2.他们对云服务有哪些期望? 3.每一个要使用云计算的客户最担心什么问 ...
映射-归约(Map-Reduce)是谷歌多年前推出的建立海量数据索引的方法,有人说它是里程碑性的技术。而理解“映射-归约”, ...
问题导读 什么是map本地? reducer的输入是来自什么地方? map数据是否被复制随map函数等下发到客户? 次讨论由ab ...
本帖最后由 pig2 于 2014-3-9 00:13 编辑 可以带着下面问题来阅读: 1.使用Java api上传文件,如何正确设置? 思考与扩展: 1 ...
1. 背景 推测执行(Speculative Execution)是指在分布式集群环境下,因为程序BUG,负载不均衡或者资源分布不均等原因,造成同一 ...
本帖最后由 pig2 于 2015-7-3 00:59 编辑 问题导读 1.Hadoop和Spark的大会规模如何? 2.Hadoop和Spark的发展趋势如何? 3. ...
ntp配置执行命令 [mw_shl_code=bash,true]ntpq -p [/mw_shl_code] 报错: localhost: timed out, nothing received 网上找 ...
百度作为全球最大的中文搜索引擎公司,提供基于搜索引擎的各种产品,几乎覆盖了中文网络世界中所有的搜索需求,因此,百度对海量 ...
本帖最后由 desehawk 于 2015-2-15 00:01 编辑 问题导读1.本文认为什么是行为分析法? 2.什么是冷数据? 3.什么是可视化(Visu ...
概述:分析对象Tomcat日志,讲述了如何将日志放入hadoop,如何分析日志,如何查看结果 日志样例: Tomcat日志代码 [*]172. ...
问题导读: 1、中国企业大数据现状? 2、石化企业数据特征? 3、大数据分析在石化企业的价值? 一、大数据应用现状1、 ...
问题导读: 1.Haproxy是什么? 2.Haproxy应用场景是什么? 3.Haproxy配置中分成哪五部分内容? 4.如何启动启动Haproxy? 5. ...
问题导读 1.Mahout将来的前景是怎样的? 2.按原代码逻辑,实际上是在Java中做了命令行的工作,为何不直接通过命令行执行呢? ...
EasyHadoop集群部署入门 目录 EasyHadoop集群部署入门文档................................................................ ...
分析完Storage相关的类以后,我们来看下一个大家伙,FSDataset相关的类。 上面介绍Storage时,我们并没有涉及到数据块Block的操 ...
问题导读 1、建立来自文档字段的管道,有哪些步骤? 2、如何理解Apache Mahout is 算法? 3、Mahout 的基本模式有哪些? ...
问题导读 1.什么是‘羊毛党’? 2.‘羊毛党’是怎么分工的? 3.‘羊毛党’从业有什么特点?4.对抗刷点从哪里入手? 5.腾讯 ...
本帖最后由 sstutu 于 2015-5-26 15:08 编辑 问题导读 1.数据分析中,哪些数据是有用的? 2.什么是行为动机数据呢? 3.为什 ...
问题导读 1、对于big data经常需要做哪些查询和统计? 2、如何理解Frequency Estimation? 3、Membership Query的作用是什么 ...
我们可以开始从系统的外部来了解HDFS了,DFSClient提供了连接到HDFS系统并执行文件操作的基本功能。DFSClient也是个大家伙,我们 ...
问题导读 1.如何衡量mapreduce的任务的计算量? 2.哪个类可以获取内存类? 3.job和hdfs交互产生的流量如何获取? ...
本帖最后由 xioaxu790 于 2014-5-11 09:58 编辑 问题导读:1、什么是MongoDB ?2、部分资料MongoDB的十点不足 Mongodb数据 ...
DataNode的介绍基本告一段落。我们开始来分析NameNode。相比于DataNode,NameNode比较复杂。系统中只有一个NameNode,作为系统文 ...
本版积分规则 发表帖子
查看 »