分享

hive表乱码

yunmin 发表于 2015-6-25 20:59:34 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 4 19325
将windows下的文件拷贝到Ubuntu下,发现文件中的中文都乱码了,于是执行gedit --encoding=gbk filename 之后文件中文乱码消失,但将文件导入到建好的hive时,发现执行查询语句时出现中文乱码?求解决方法!试了几种网上的方法,都行不通!

已有(4)人评论

跳转到指定楼层
starrycheng 发表于 2015-6-25 21:33:45
不要在Linux下修改。直接导入试试
回复

使用道具 举报

yunmin 发表于 2015-6-25 22:13:17
starrycheng 发表于 2015-6-25 21:33
不要在Linux下修改。直接导入试试

导入之后还是中文乱码!Linux下的文件不会乱码,就是导入到Hive时就乱码,想不通!
回复

使用道具 举报

starrycheng 发表于 2015-6-25 23:37:55
yunmin 发表于 2015-6-25 22:13
导入之后还是中文乱码!Linux下的文件不会乱码,就是导入到Hive时就乱码,想不通!

编码最好不要乱码,在Linux下乱码,未必在hive是乱码。
你修改了文件的编码,改正了Linux的,这样可能造成hive下乱码
回复

使用道具 举报

阿飞 发表于 2015-6-25 23:54:16
编码要转换。linux是utf-8的话,要在windows下转下格式[windows默认gbk][可以用notepad++]再上传。上传以后用dos2unix再处理一次换行符。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条