分享

Kettle 6.1 从oracle导入数据到hive表 环境配置

问题导读


1.本文涉及哪些版本?
2.Kettle 6.1 从oracle导入数据到hive表分为几步?
3.Kettle 6.1 从oracle导入数据到hive表如何配置?



kettle:pdi-ce-6.1.0.1-196  
Hadoop :cdh5.11   hive 1.0
Kettle安装省略,解压就可以使用,需要把oracle 驱动包放到 D:\pdi-ce-6.1.0.1-196\data-integration\lib 下
第一步:修改配置文件
D:\pdi-ce-6.1.0.1-196\data-integration\plugins\pentaho-big-data-plugin\plugin.properties
修改前:active.hadoop.configuration=



修改后:active.hadoop.configuration=cdh55



备注:对应的目录名称D:\pdi-ce-6.1.0.1-196\data-integration\plugins\hadoop-configurations
由于安装的是CDH版本,所以用cdh55,如下图所示:



第二步:
复制Hadoop集群hive安装目录下的4个xml文件替换D:\pdi-ce-6.1.0.1-196\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh55下面的4个xml文件,比如:
core-site.xml
hdfs-site.xml
hive-site.xml
yarn-site.xml

第三步:
kettle连接Hadoop Hive2配置
新建转换,从oracle抽取数据到hive表,如下图所示:





配置hadoop集群主机名称,比如:192.168.0.180(集群对应的主机名称)
数据库名称:jykj(集群hive数据库对应名称)
端口号hive默认是10000,如果设置其他端口,就填写设置后的端口号
用户名:默认hive ,如果是其他用户名称,就填写设置后的名称即可
密码:如果是默认安装hive 就无密码,除非自己设置有密码

点击测试按钮,如下图所示:





配置成功后可以查看数据库对应的表,如下图所示:



Mysql连接配置(主用使用oracle)

将mysql驱动包放到D:\pdi-ce-6.1.0.1-196\data-integration\lib目录下面
重新启动Spoon.bat,配置如下图所示:



Oracle 连接配置




第四步:测试结果,如下图



其中注意事项,oracle 里面整型和日期类型最好转换层字符类型,hive上面建表建议全部使用string数据类型,hive 表有多少个字段,oracle就要输出多少个字段,这样执行就不会出现错误。一定要注意类型和字段。


加微信w3aboutyun,可拉入技术爱好者群

已有(1)人评论

跳转到指定楼层
恋枫缩影 发表于 2020-5-7 23:53:22
多谢楼主分享前段时间搞过就是不行 谢谢楼主了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条