这里面存在问题,需要有明确的地方标记,最后是否成功。否则没法判断 |
heierya 发表于 2017-7-19 19:18 要按每次操作中最终没有成功的error才挑出,如图,左边大括号意思是操作了4次,其中第一次,第二次分别挑出一条error记录,第三次虽然中间也有error但最终完成了,所以不挑error记录。 |
langke93 发表于 2017-7-19 18:08 对,是用户名 |
本帖最后由 heierya 于 2017-7-19 21:18 编辑 新手尝试解决一下。 大致步骤为: 1、按时间排序 2、按stage分组 3、找出最后recode为error的分组 4、取最后recode为error的分组中的每一条error记录 感觉难点在于2.按stage分组,尝试直接用hiveSQL的row_number()解决未成功。 我这边的话只能动用MR 或者引入一个UDF函数 来解决了。这个每个人应该都有些自己的想法,不在赘述。 坐等大神用HQL来解答了 |
用户id应该是唯一的,不应该用A或则B。这个应该是用户名 |
这是什么意思? 遇到什么问题了。 |