现在出现的是字典排序问题 (rowkey,(cf,A打头的列名,value)) ,(rowkey,(cf,W打头的列名,value)),rowkey是关系型数据的pk键+2个其他字段拼接成的,
关系型数据库有多条相同的记录,就是pk键重复,其他两个字段的列值也相同,也就是最后拼成的rowkey是相同的, 关系型数据库每条记录大概75个字
段,这个HFILE排序是不是第一条关系型数据库记录排完,同样的第二条开始就不
能排了??我的理解是这样。。具体看我的理解
第一条关系型数据库拼出来的: (rowkey1,(cf,col1,value11)),(rowkey1,(cf,col2,value12))……(rowkey1,(cf,col75,value175))
第二条相同pk键关系型数据库记录拼出来的: (rowkey1,(cf,col1,value21)),(rowkey1,(cf,col2,value22))……(rowkey1,(cf,col75,value275))
这种情况下,插完第一条记录之后一插(rowkey1,(cf,col1,value21)) 是不是就会报错??
有没有可能这样排序生成HFile : (rowkey1,(cf,col1,value11)),(rowkey1,(cf,col1,value21)),(rowkey1,(cf,col2,value12)),(rowkey1,(cf,col2,value22))…………(rowkey1,(cf,col75,value175)),(rowkey1,(cf,col75,value275))
|