About云-梭伦科技»专题 › 交流区 › 技术交流 › Hive › 求助：同一个hive sql 执行多次，结果不同

求助：同一个hive sql 执行多次，结果不同

查看数: 15330 | 评论数: 4 | 收藏 0

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

songy

发布时间: 2015-12-15 19:57

正文摘要:

如题：同一个hive sql（统计各来自渠道的日活跃用户），统计的是11号的数据，已经没有数据写入，可是，统计结果会变动: SELECT l.group_id,l.channel_id,COUNT(DISTINCT l.`user_id`) AS `num` FROM log.`user_ ...

chyeers 发表于 2016-3-21 20:19:15

这是什么客户端么？

cowboy2014 发表于 2015-12-16 21:18:53

这个正是在CAP理论中所说的，三者不可兼得。hadoop所体现的是，高可用性和分区容错性，一致性出现问题是难免的。
CAP原则又称CAP定理，指的是在一个分布式系统中， Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性），三者不可得兼。

songy 发表于 2015-12-15 21:43:10

arsenduan 发表于 2015-12-15 21:19
COUNT(DISTINCT l.`user_id`) AS `num`
变化的是这个。也就是说数据的行数在变动。
先总体查询下（count ...

你好，应该不是你说的总行数在变得情况。因为我多次执行相同的那个sql,有好几个结果在交替出现，但看一个num,有时变多有时变少。我的hadoop数据写了3份，我怀疑是不是这3份数据在各个节点变得不一致了，但是不知道怎么验证。

arsenduan 发表于 2015-12-15 21:19:32

COUNT(DISTINCT l.`user_id`) AS `num`
变化的是这个。也就是说数据的行数在变动。
先总体查询下（count下）是否变化。多次执行。

图文精华

求助：同一个hive sql 执行多次，结果不同

正文摘要:

回复

推荐 /2