用户组:游客
问题导读: 1.什么是ODPS? 2.与传统数据仓库工具相比ODPS有哪些优势? 3.与HIVE、Big Query相比ODPS有什么特点? 4.ODPS与R ...
问题导读: 1.Slots是什么? 2.Map slots总数如何计算? 3.Reducer slots总数如何计算? Slots是Hadoop的一个重要 ...
本帖最后由 desehawk 于 2014-6-28 12:45 编辑 问题导读:1.DistributedCache是什么?2.每个存储在HDFS中的文件被放到缓存中后 ...
问题导读 1.什么是Apache Parquet? 2.C/ORC在Hive中得到使用,支持哪些功能? 3.Twitter使用Parquet来做什么? ...
在hadoop-2.2.0.tar.gz文件下没有找到源码(新版本不但没有Eclipse插件,也没有源码,只有.class字节码文件),可以下载hado ...
导读 下面的思想比较新颖,给大家扩展一些思路。 什么是算子层,这里做一下简单的介绍 例如storm的T ...
可以带着下面问题来阅读: 在编程过程中,如何才能够查看类的相关信息? 在我们hadoop编程中,经常遇到像看看hadoop的某个类 ...
问题导读 1.在hadoop平台上进行开发时,主要哪些问题? 2.数据量庞大、HDFS数据与线下交互不便是如何解决的? 3.业务逻辑复 ...
本帖最后由 howtodown 于 2014-11-16 01:01 编辑 问题导读 1.构建独立的图片服务器有什么优势? 2.使用云存储服务有哪些优 ...
问题导读 1.推荐系统架构为什么包含在线和离线部分? 2.在推荐过程中都需要考虑什么问题? 推荐在电商和 ...
问题导读 1.hadoop对读写的互斥同步就是靠Lease实现的? 2.LeaseManager中有哪两个时间限制? 3.LeaseManagement是一个什么机 ...
本帖最后由 breaking 于 2015-12-24 17:38 编辑 问题导读:1.Ambari是什么?2.Ambari怎么安装? Ambari 是什么Ambari ...
1.hive作业提交问题hive如何放到一个脚本中并行执行 有3个sql文件,a,b,c,需要并行执行,现在的做法是开3个hive的cli,分别运 ...
问题导读 1.什么是泛型? 2.什么是泛型接口类? 3.Mapper是一个什么类? 首先,我们来看看下面函数 public sta ...
问题导读 1.pypi是什么? 2.R如何使用? 3.Python如何使用? 对于想从事数据行业的人和数据工作者来说,是学 ...
问题导读: 1.如何进行Redis”数据丢失“的故障排查? 2.数据丢失的影响是什么? 3.常见Redis数据丢失的情况都有哪些? ...
问题导读 1.Impala与Hive的相似之处,区别在什么地方? 2.各自适合什么场景? 这里再补充一些Impala的知识 1. Impala ...
本帖最后由 xuanxufeng 于 2016-1-28 17:47 编辑 问题导读 1.存储格式选择和效率如何权衡? 2.存储如何规划的? 3.为什么 ...
问题导读 1.什么是Apache Crunch? 2.Crunch的基本思想是什么? 3.Crunch集合类型的高层抽象就包含哪3个接口? 4.Crunch通 ...
本帖最后由 pig2 于 2015-6-18 00:40 编辑 问题导读 1、什么是推荐? 2、推荐系统原理是什么? 3、如何评测一个推荐系统? ...
问题导读 1.本文列举了哪些工作流组件? 2.工作流组件有哪些优点和缺点? 3.这里最成熟的是哪个组件? Airflow 优 ...
本帖最后由 pig2 于 2015-6-9 12:48 编辑 问题导读 1、什么是推荐系统? 2、如何理解子策略融合? 3、simrank的计算使用什 ...
高手一: 1)create oracle user sql> create user hive identified by hive identified by hive default tablespace ...
问题导读 1.当前的主流大数据查询分析引擎有哪些? 2.主流引擎具有什么架构? 3.主流引擎的系能评价如何? ...
问题导读 1、将同一个应用部署在多个服务器上通过负载均衡对外提供访问,如何实现Session共享? 2、Spring Session的过滤 ...
本帖最后由 J20_果农 于 2016-10-2 16:15 编辑 总体实现: 需要创建一个作业 j_test_d, 两个转换T_增量临时数据_D, T_增量 ...
本帖最后由 pig2 于 2014-5-11 22:39 编辑 问题导读: 1.带参数hadoop程序与不带参数书写上有什么区别? 2. implements Tool ...
问题导读 我们在学习的过程中经常听到一些术语,那么这些都是什么含义? 1.什么是大数据? 2.什么是数据分析? 3.什么是数据 ...
问题导读 1.如何判断一个集群是否数据倾斜? 2.balancer的原理是什么? 3.CDH集成平台如何实现数据重分布? Ha ...
问题导读 1.Google 新三辆马车是哪三门技术? 2.Spanner、F1、Dremel分别是什么技术? 3.后Hadoop时代的大数据架构主 ...
本版积分规则 发表帖子
查看 »