用户组:游客
问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? ...
有个hivesql:insert into table xxx partition(dt=xxx) select xxxx 之前使用textfile文件格式时没问题,近期调整为parquet ...
前面用hive2代码连接hive链接不上 hive日志中报错 org.apache.thrift.transport.TTransportException: Invalid status -128这个 ...
从左边视图里可以查数据,写sql就报下面那个错误。
通过 alter table XXX partition (dt='20200801') rename to partition (dt='20200802') 修改分区值,但是hdfs目录上分区不见了 ...
使用spark-shell加载数据 carbon.sql("load data inpath '/test/part-r-00023.gz' into table log_t options('DELIMITER'=',' ...
目前我们项目组用的方法是用jdbc,写java代码的方式抽取mycat数据往hive里写,这样效率比较低征集下大家意见,sqoop貌似不支持my ...
hive 版本:3.1.2 1、问题描述: 线上集群有一个hive的分区表,在删除该表的时候,提示内存空间不足,信息如下: 2020-05-2 ...
在经常使用订单支付时间的一张大型订单表,怎么做分区比较合适?用支付时间做分区的话,怎么解决数据更新的问题?
set role admin; 这个是ok的 No rows affected (0.211 seconds) grant SELECT on table orders to user select_ods with ...
离线数仓:维度建模理论:缓慢变化维如何设计,累积表、全量表、周期快照表、拉链表分别作用于什么场景?举例说明 ...
Error: Error while processing statement: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.M ...
首先举个案例: 一个用户登录访问 aboutyun,他从首页点进第二页,从第二页点进第三页,之后又进入第四页,然后点击回到第二页 ...
java.lang.IllegalStateException: There is conflicting local resource (htrace-core-3.2.0-incubating.jar) between dag ...
hive的udf怎么引入依赖呢,我通过下面方式添加了第三方依赖 add file /home/chenxy/hive/GeoLite2-City.mmdb; add jar /home/ch ...
初衷:hive分区表在删除hdfs文件后元数据还没清空,为了不影响后面查询,需要将数据文件不存在的分区删掉,有数据文件存在的表分 ...
有一个hive的三级分区表,现在想把它导出到mysql,怎么做呢? 比如: hive有colm1,colm2两个字段,有A,B,C三个分区 mysql有co ...
统计每个月每天出现的情况,比如下面两串数字 0100010101000101010100101010101 这串数字一共31位的,每一位代表某个月的某一 ...
需求是从Oracle 迁移到 hive平台做数据仓库分析。 因为之前在Oracle上有许多封装好的存储过程,在hive中不知如何实现这部分逻辑 ...
spark运行结果通过saveAsTable写入表中之后,在spark-sql可以正常查询,在hive客户端select返回为空,查看desc formatted tablen ...
对于非常大的数据集,有时用户需要使用的是一个具有代表性的查询结果而不是全部结果。Hive可以通过对表进行分桶抽样来满足这个需 ...
比如hbase表有南京和无锡二份数据,表结构一样,我想建一张hive表映射,用分区字段区分地区,怎么建呢?
2019-04-11 15:17:07,016 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: BlockSender.sendChunks() exception: jav ...
大家好,我在使用Hive HBase映射表时发现了一个问题,不知道怎样解决。 hive表中映射了hbase分区表,但是使用Hive SQL做检索 ...
我测试了hive on mr 与hive on spark 多表join/窗口函数/groupby这三种情况 结果令我很失望,hive on spark 在使用相同资源 ...
环境:hadoop3.1.1 +hive3.1.1 + zookeeper3.4.13 问题: 我给Yarn配置了HA,连续执行两条Hive会产生报错,然而不适用Yarn的HA ...
hive decode 类似oracle decode,但是我写decode(1,-1),提示第一个字符必须得二进制,谁可以给例子我试试。
各位大神现有一个问题,麻烦大家帮忙写个hql解决下,需求如下:源表T(两个字段) monthid userid 20180101 10001 201 ...
hive on spark执行结束后正常返回了结果,但是am一直在running状态,这是正常的么?
各位大神,现有数据包含json格式,数据如下:TABLE:A event_id object P10000 {"logType":4,"role":1,"account":"136* ...
各位大神,一般我们仓库数据会存放到hfds目录下,通过load方式加载到hive中 但是现在想学习下除了load方法外,是否有其他方式实 ...
本版积分规则 发表帖子
查看 »