分享

spark sql中rank() 函数SQLContext并不支持

starrycheng 发表于 2017-3-5 18:05:12 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 6759
问题总结来自:
spark dataframe怪异问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21105
#######################

rank() 函数SQLContext并不支持。
需要用它的子类org.apache.spark.sql.hive.HiveContext来实现。

SELECT pcode,
        ver,
        monthday,
        fncode,
        country,
        province,
        dognum,
        gid,
        mac,
        hardwareid,
        ip,
        rank() OVER (PARTITION BY pcode,ver,monthday,fncode,gid ORDER BY if(province='未知',2,1)) as rank_gid

        FROM
            (SELECT pcode,
                    ver,
                    monthday,
                    fncode,
                    country,
                    province,
                    dognum,
                    gid,
                    mac,
                    hardwareid,
                    ip
                    FROM
                        uv_logs
                        GROUP BY pcode,ver,monthday,fncode,country,province,dognum,gid,mac,hardwareid,ip) a


没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条