用户组:游客
问题导读: 1.什么是ODPS? 2.与传统数据仓库工具相比ODPS有哪些优势? 3.与HIVE、Big Query相比ODPS有什么特点? 4.ODPS与R ...
问题导读: 1.Slots是什么? 2.Map slots总数如何计算? 3.Reducer slots总数如何计算? Slots是Hadoop的一个重要 ...
本帖最后由 desehawk 于 2014-6-28 12:45 编辑 问题导读:1.DistributedCache是什么?2.每个存储在HDFS中的文件被放到缓存中后 ...
问题导读 1.什么是Apache Parquet? 2.C/ORC在Hive中得到使用,支持哪些功能? 3.Twitter使用Parquet来做什么? ...
在hadoop-2.2.0.tar.gz文件下没有找到源码(新版本不但没有Eclipse插件,也没有源码,只有.class字节码文件),可以下载hado ...
导读 下面的思想比较新颖,给大家扩展一些思路。 什么是算子层,这里做一下简单的介绍 例如storm的T ...
问题导读 1.在hadoop平台上进行开发时,主要哪些问题? 2.数据量庞大、HDFS数据与线下交互不便是如何解决的? 3.业务逻辑复 ...
可以带着下面问题来阅读: 在编程过程中,如何才能够查看类的相关信息? 在我们hadoop编程中,经常遇到像看看hadoop的某个类 ...
本帖最后由 howtodown 于 2014-11-16 01:01 编辑 问题导读 1.构建独立的图片服务器有什么优势? 2.使用云存储服务有哪些优 ...
问题导读 1.推荐系统架构为什么包含在线和离线部分? 2.在推荐过程中都需要考虑什么问题? 推荐在电商和 ...
本帖最后由 breaking 于 2015-12-24 17:38 编辑 问题导读:1.Ambari是什么?2.Ambari怎么安装? Ambari 是什么Ambari ...
问题导读 1.hadoop对读写的互斥同步就是靠Lease实现的? 2.LeaseManager中有哪两个时间限制? 3.LeaseManagement是一个什么机 ...
1.hive作业提交问题hive如何放到一个脚本中并行执行 有3个sql文件,a,b,c,需要并行执行,现在的做法是开3个hive的cli,分别运 ...
问题导读 1.什么是泛型? 2.什么是泛型接口类? 3.Mapper是一个什么类? 首先,我们来看看下面函数 public sta ...
问题导读 1.pypi是什么? 2.R如何使用? 3.Python如何使用? 对于想从事数据行业的人和数据工作者来说,是学 ...
问题导读 1.Impala与Hive的相似之处,区别在什么地方? 2.各自适合什么场景? 这里再补充一些Impala的知识 1. Impala ...
问题导读: 1.如何进行Redis”数据丢失“的故障排查? 2.数据丢失的影响是什么? 3.常见Redis数据丢失的情况都有哪些? ...
本帖最后由 xuanxufeng 于 2016-1-28 17:47 编辑 问题导读 1.存储格式选择和效率如何权衡? 2.存储如何规划的? 3.为什么 ...
问题导读 1.什么是Apache Crunch? 2.Crunch的基本思想是什么? 3.Crunch集合类型的高层抽象就包含哪3个接口? 4.Crunch通 ...
本帖最后由 pig2 于 2015-6-18 00:40 编辑 问题导读 1、什么是推荐? 2、推荐系统原理是什么? 3、如何评测一个推荐系统? ...
本帖最后由 pig2 于 2015-6-9 12:48 编辑 问题导读 1、什么是推荐系统? 2、如何理解子策略融合? 3、simrank的计算使用什 ...
问题导读 1.本文列举了哪些工作流组件? 2.工作流组件有哪些优点和缺点? 3.这里最成熟的是哪个组件? Airflow 优 ...
高手一: 1)create oracle user sql> create user hive identified by hive identified by hive default tablespace ...
问题导读 1.当前的主流大数据查询分析引擎有哪些? 2.主流引擎具有什么架构? 3.主流引擎的系能评价如何? ...
问题导读 1、将同一个应用部署在多个服务器上通过负载均衡对外提供访问,如何实现Session共享? 2、Spring Session的过滤 ...
问题导读 我们在学习的过程中经常听到一些术语,那么这些都是什么含义? 1.什么是大数据? 2.什么是数据分析? 3.什么是数据 ...
本帖最后由 J20_果农 于 2016-10-2 16:15 编辑 总体实现: 需要创建一个作业 j_test_d, 两个转换T_增量临时数据_D, T_增量 ...
本帖最后由 pig2 于 2014-5-11 22:39 编辑 问题导读: 1.带参数hadoop程序与不带参数书写上有什么区别? 2. implements Tool ...
问题导读 1.如何判断一个集群是否数据倾斜? 2.balancer的原理是什么? 3.CDH集成平台如何实现数据重分布? Ha ...
问题导读 1.Google 新三辆马车是哪三门技术? 2.Spanner、F1、Dremel分别是什么技术? 3.后Hadoop时代的大数据架构主 ...
本版积分规则 发表帖子
查看 »