一、Excel输入
1.创建转换
将要处理的文件保存到Excel表中,然后打开kettle创建一个转换并命名,拖入“Excel输入”控件。
![](https://img-blog.csdnimg.cn/79787ce49d9549e290f7f9b55e05087c.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/10e8cd104e074d82b5d9ae3b095cb4b3.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.配置Excel输入控件
浏览导入Excel文件。单击【浏览(B)…】按钮,在计算机上浏览并导入“物理成绩.xls”文件,如图所示。添加并编辑Excel文件。单击【增加】按钮,将浏览导入至【文件/目录】输入框中的“E:\课件\ETL\55220-ETL数据整合与处理(Kettle)-实验数据和工程\第2章\数据”文件,添加至【选中的文件】表中,如图所示。
![](https://img-blog.csdnimg.cn/dea4fe97370f4fc7972dd3ee5df66ad2.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
在【工作表】选项卡中,设置导入的Excel文件的工作表参数
![](https://img-blog.csdnimg.cn/f3264d8f30a6420782600b5034f1a326.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
在【字段】选项卡,设置“物理成绩.xls”文件中字段的参数。获取字段,单击【获取头部数据的字段…】按钮,添加字段到【字段】表中设置字段参数,对字段参数进行设置,如图所示。![](https://img-blog.csdnimg.cn/301c394e4e23439e9de4181e23d177d3.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
3.结果预览
设置好字段参数后,单击【预览记录】按钮,弹出【预览数据数量】对话框,要预览的行数采用默认值,并单击【确定】按钮。 弹出【预览数据】对话框,展示Excel输入的数据,如图所示。
![](https://img-blog.csdnimg.cn/adda5df271d84d41a965ca54d4e683f4.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
二、生成记录
1.创建【生成记录】转换工程
![](https://img-blog.csdnimg.cn/b4f6ef93ae294d5fba4334ce6f1c51cc.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.配置【生成记录】参数
双击【生成记录】组件,弹出创建【生成记录】对话框,在【字段】表中,对各字段的参数进行设置。如图所示:
![](https://img-blog.csdnimg.cn/c0c8fe7d536b4f828a74417a8c5479eb.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
3.预览结果数据
单击【预览(P)】按钮,弹出【输入预览记录数】对话框,预览记录数采用默认值,单击【确定】按钮。弹出【预览数据】对话框,展示生成记录的数据,如图所示![](https://img-blog.csdnimg.cn/2f449926e26843b0ac0165c48cf6abb8.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
三、生成随机数
1. 建立一个转换,添加生成随机数控件 ![](https://img-blog.csdnimg.cn/ba0b38c31aa243d3a9ed325dc48e8bdc.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_14,color_FFFFFF,t_70,g_se,x_16)
2. 双击【生成随机数】组件,弹出【生成随机值】对话框, 单击【类型】参数输入框,弹出【选择数据类型】对话框,选择【Random Message Authentication Code(HmacMD5)】类型,如图所示。
![](https://img-blog.csdnimg.cn/e66af55cb9a8402e90410bc42551795c.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_16,color_FFFFFF,t_70,g_se,x_16)
3.在【生成随机数】转换工程中,单击【生成随机数】组件,再单击工作区上方的
图标。弹出【转换调试窗口】对话框,展示生成随机数的数据,如图所示。
![](https://img-blog.csdnimg.cn/e2b7d17cead844c498a6649f0842eb16.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_15,color_FFFFFF,t_70,g_se,x_16)
4.单击【快速启动】按钮,弹出【预览数据】对话框,展示生成随机数的授权码数据,如图所示。
![](https://img-blog.csdnimg.cn/3fbf7dad92a045e6b8fcb3698c9d9534.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
四、获取系统信息
1.建立转换,添加获取系统信息组件。
![](https://img-blog.csdnimg.cn/8a60c2212a5a41e79f001bd9370f299f.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.双击【获取系统信息】组件,弹出【获取系统信息】对话框,设置参数,如图所示。
![](https://img-blog.csdnimg.cn/465667c9e37e42ff9bea754002fd83e4.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_15,color_FFFFFF,t_70,g_se,x_16)
3.单击【浏览记录】按钮,弹出【Enter preview size】对话框,预览记录数采用默认值,单击【确定】按钮。弹出【预览数据】对话框,展示获取系统信息的数据,如图所示
![](https://img-blog.csdnimg.cn/9351707291ca4284ac1614ecc5eed79e.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
五、排序记录
1..创建转换
创建新的转换添加【Excel输入】和【排序记录】控件。结果如图所示:![](https://img-blog.csdnimg.cn/7b6af2cfbe73443b906115967964db0c.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.设置参数
双击【Excel输入】组件,设置参数,导入“2019年11月月考数学成绩.xls”文件,预览数据,如图所示。
![](https://img-blog.csdnimg.cn/61e521e10b65464bbc1a2039afea4043.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
双击【排序记录】组件,弹出【排序记录】对话框,在【排序目录】对话框中,设置参数,将“数学”字段的数据按照从低到高进行排序,如图所示。
![](https://img-blog.csdnimg.cn/dd55a920d8f64a74b56ae254e8c3b30e.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
3.结果预览
在【排序记录】排序工程中,单击【排序记录】组件,再单击工作区上方的
图标。预览数据,展示排序后的数据,如图所示。
![](https://img-blog.csdnimg.cn/334933001fda4e0bb15d4fcf29ac0cfe.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
六、去除重复
1.创建转换
创建新转换。添加【Excel输入】、【排序记录】和【去除重复记录】组件,如图所示;![](https://img-blog.csdnimg.cn/8acdd8e9409b424d9caecc020e36f5cd.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.设置参数
双击【Excel输入】组件,设置参数,导入“2019年11月月考数学成绩.xls”文件。如图所示;
![](https://img-blog.csdnimg.cn/9f461c1e6c9c4b0ea93abe87cd70e565.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
双击【排序记录】组件,对“学号”字段按照升序进行排序后预览数据,如图所示,除了“序号”字段数据外,“学号”分别为“201709023”“201709028”“201709030”的数据各有两条记录,并且对应的“数学”考试成绩的数据也相同。![](https://img-blog.csdnimg.cn/f09d74ed42dd4526a5ccf4cf24b13ccb.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
双击【去除重复记录】组件,弹出【去除重复记录】对话框,在【去除重复记录】对话框中,设置参数,去除学号相同的记录,如图所示;
![](https://img-blog.csdnimg.cn/cfa2e00980ef4f92855c49c880613eff.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_18,color_FFFFFF,t_70,g_se,x_16)
3.结果预览
单击【去除重复记录】组件,再单击工作区上方的
图标即可预览去除重复记录后的数据,如图所示。
![](https://img-blog.csdnimg.cn/7e1b0b5dc6b94432b6b0e81f6ea51a70.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
七、替换NULL值
1.创建转换
创建新转换,添加【Excel输入】和【替换NULL值】控件,如图所示;
![](https://img-blog.csdnimg.cn/f0611077c45f46e9a433a748421a0156.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
2.设置参数
双击【Excel输入】组件,设置参数,导入“2019年11月月考英语成绩.xls”文件,预览数据,“学号”字段数据为“201709007”所对应的“英语”字段数据为“<null>”(即NULL),如图所示。
![](https://img-blog.csdnimg.cn/cc1e3c04a35e417485a90be8f092d42e.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
双击【替换NULL值】组件,弹出【替换NULL值】对话框,在【替换NULL值】对话框中,设置参数,用“0”替换“英语”字段的数据“null” ,如图所示;
![](https://img-blog.csdnimg.cn/7020ddd703b14bc0afe4f014256708e3.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
3.预览结果数据
单击【替换NULL值】组件,再单击工作区上方的
图标,预览替换NULL值后的数据,如图所示![](https://img-blog.csdnimg.cn/58857e2c89a24c2fa3377d7eb64e22df.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARmxpcHBlZC7kvJ8=,size_20,color_FFFFFF,t_70,g_se,x_16)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)