hdandan0 2019-10-30
今天主要介绍下kettle的记录集连接功能和一些注意点。
记录集连接可以实现数据集合的关联,也分为内连接,左连接,右连接,外连接。
多表的join,可以直接用sql写入【表输入】组件,也可以借助kettle提供的【记录集连接】组件,使用kettle的记录集连接组件,首先必须要两个输入数据集是有序的,并且是根据需要join的字段排序,可以借助kettle的【排序记录】组件。
步骤:
1:首先根据【排序记录】组件将两个数据集需要join的字段进行排序。 2:使用记录集连接组件对数据集进行排序。
注:
1:第一个步骤为连接的主表 2:连接类型分为,内链接,左外连接,右外连接,全外连接。 3:两个步骤的连接字段必须和排序记录中的名称一致。
其他:
1:步骤名称:在单一转换中名称必须唯一。 2:第一个步骤:指定要合并的第一个输入步骤。 3:第二个步骤:指定要合并的第二个输入步骤。 4:连接类型:选择合并可用的类型。 5:连接字段:指定要做关联的字段。
需求:将A表(code,部门,指标)、B表(code,部门,核心内容)组合输出结果:S表(code,部门,指标,核心内容)
1、准备A表、B表
A表:
B表:
2、kettle流程
其中以code进行排序,注意AB两张表的code都是不重复的
3、结果:
觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~