ETL学习笔记之Kettle下载与部署 - Go语言中文社区

ETL学习笔记之Kettle下载与部署


       ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我介绍一个我在工作中使用了3年左右的ETL工具Kettle,本着好东西不独享的想法,跟大家分享碰撞交流一下!在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率,不过对于我这个.net研发者来说唯一的遗憾就是这个工具是Java编写的。

      一、Kettle概念

      Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

     二、Kettle下载

      可到开源官网(https://community.hds.com)下载;

      Data Integration (or Kettle)  7.1版本下载:https://sourceforge.net/projects/pentaho/files/Data%20Integration/7.1/pdi-ce-7.1.0.0-12.zip/download。

      三、java JDK 安装与部署

      1)首先到官网下载对应JDK包,JDK1.5或以上版本就行;

      2)安装JDK;

      3)配置环境变量。

      注:详细配置情况可自行百度,这里不再叙述。

      四:Kettle环境配置

      1)因Kettle是开源工具,下载的压缩包直接解压到本地路径即可。

      2)打开环境变量的设置窗口。右击“我的电脑”,在弹出的快捷菜单中选择“属性”选项,进入“系统属性”对话框。选择“高级”标签,进入“高级”选项卡,再单击“环境变量”按钮,进入“环境变量”对话框。

     3)在“系统变量”栏“新建”系统变量,变量名输入:KETTLE_HOME;变量值输入Kettle解压路径(...data-integtation)。点击“确定”完成环境变量设置。

      五:Kettle运行

     进入到Kettle目录,双击运行spoon.bat文件,出现如下界面及说明kettle成功部署。





六:出现问题

1)若kettle启动spoon提示 A Java Exception has occurred,则说明jdk与当前kettle版本不匹配。(注:jdk1.8版本可支持Kettle7.0以后版本,1.7版本不支持


2)若kettle运行spoon.bat时找不到javaw文件,则说明jdk环境变量JAVA_HOME的值不对,应仔细检查。若检查过后还无法解决,可直接把解压的kettle文件夹放到安装的jdk文件夹下,再次尝试运行spoon.bat文件,即可解决。

版权声明:本文来源CSDN,感谢博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/Kevin_Sticker/article/details/78125502
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。
  • 发表于 2019-09-05 16:54:17
  • 阅读 ( 1103 )
  • 分类:

0 条评论

请先 登录 后评论

官方社群

GO教程

推荐文章

猜你喜欢