文档库 最新最全的文档下载
当前位置:文档库 › Informatica PowerCenter 7.1 简易使用手册

Informatica PowerCenter 7.1 简易使用手册

Informatica PowerCenter 7.1 简易使用手册
Informatica PowerCenter 7.1 简易使用手册

Informatica PowerCenter 7.1

简易使用手册

原:神州数码

改:海联讯软件和集成中心

编辑人:张旭

2008 年11 月

目录

1. 使用Informatica PowerCenter 的准备工作 (3)

1.1 启动Informatica Repository Server 和Informatica Server (3)

1.2 创建资料库 (3)

1.3 创建Folder (3)

2. Informatica 客户端介绍 (3)

3. Informatica PowerCenter 工作流程 (5)

4. Step1:在Designer 中连接资料库 (5)

5. Step2:打开Folder (7)

6. Step3:引入数据源结构 (7)

7. Step4:引入目标结构 (10)

8. Step5:设计Mapping (11)

9. Step6::设计Workflow (16)

10. Step7:运行Workflow (20)

11. Step8:查看作业运行情况 (21)

1. 使用Informatica PowerCenter 的准备工作

配合本手册使用的有两个文档:一个是安装手册;一个是中文的培训资料(介绍各客户端工具的用法)。

具体的可以参照使用,此处不再赘述

1.1 启动Informatica Repository Server 和Informatica Server

安装配置完后,就可以启动Informatica Repository Server:

1、Windows 平台:控制面板-> 服务->启动Informatica Repository Server 和Informatica Server

2、UNIX 平台:启动Repository Server 在安装目录RepServer 下,运行pmrepserver

启动Informatica Server 在安装目录Server 下,运行pmserver

1.2 创建资料库

通过客户端Repository Server Administration Console 创建资料库

具体参见安装手册相关章节

1.3 创建Folder

通过客户端Repository Manager 创建Folder

具体参见安装手册相关章节

2. Informatica 客户端介绍

Informatica 提供基于对象的,无需编码的全图形化开发环境,最大地提高开发生产力,有5 个客户端工具:

3. Informatica PowerCenter 工作流程

在整个设计流程中涉及的客户端有:

PowerCenter Designer

Workflow Manager

Workflow Monitor

4. Step1:在Designer 中连接资料库

需要连接已经创建好的资料库,方法如下:

假设SQL_Test 是我创建的资料库,连接的方法有两种:1)选中后,鼠标右键->connect,见左图

2)选中后,点击工具栏connect,见左图

连接时需要输入用户名和密码

5. Step2:创建并打开Folder

资料库连接后,需要打开在Repository Manager 创建的Folder

创建Folder方法:在菜单栏中找到Folder按钮,点击后选择Create

打开Folder 的方法有几种:

1)双击Folder

2)选中Folder,右键—>open

3)选中Folder,点击工具栏的OPEN

6. Step3:引入数据源结构

Folder 打开后,就可以进行实际的设计工作了。首先要引入数据源结构介绍一下工作区:

图Workspace_1

Source Analyzer: 设定当前的工作区为Source Analyzer

在Source Analyzer 中引入和创建源表结构,如:平面文件, XML, COBOL, Application 以及关系

型数据源。

Warehouse Desinger: 设定当前的工作区为Warehuse Designer(8.1.1版中是Target Designer)使用Warehouse Designer 定义目标结构,如:关系型表, 平面文件, XML 文件等。可以从关系

型数据库、平面文件中引入结构,或者手工创建。

Transformation Developer: 设定当前的工作区为Transformation Developer

使用Transformation Developer 来创建可复用的组件

Mapplet Designer: 设定当前的工作区为Mapplet Designer

使用Mapplet Designer 来创建mapplet,Mapplet 就是一系列可包含源结构以及转换组件的可复

用逻辑。

Mapping Designer: 设定当前的工作区为Mapping Designer

使用Mapping Designer 来创建mapping,mapping 就是一系列包括源、目标以及转换组件的逻

辑组合,在这里面实现了数据转换的规则。

1、点击Source Analyzer,引入已经存在的数据源表结构。

数据源可以是RDBMS、Flat file、Cobol file、XML file、ERP(SAP 等)等

对于RDBMS、Excel 等数据源需要定义ODBC,通过ODBC 连接

以RDBMS 为例:

图Workspace_2

步骤:A.菜单栏中点Source

B.点击Import from Database按钮

C.选择数据库类型,填入源数据库的用户名和密码

D.选择要导入的表后,点OK键

PS:导入的只是表结构

按照图中标注操作,数据源结构就显示在Source Analyzer 工作区

2、手工创建表结构

在Source Analyzer 状态下,从菜单Sources->Create,弹出下面的界面:

在上面的界面中选择Database type,输入Table name,然后点击Create->Done,这样就创建了一个空的结构。双击或“Edit”,进入Column 定义界面,具体参见下图:

数据源表结构引入后,就需要保存。

7. Step4:引入目标结构

接下来引入目标结构。

在图Workspace_1 点击Warehouse Desinger(Target Designer),界面就由“Sources”变成了“Targets”。引入目标结构的过程同“图Workspace_2

:引入数据源结构”。详细说明入下

步骤:A.菜单栏中点Target

B.点击Import from Database按钮

C.选择数据库类型,填入源数据库的用户名和密码(PS:因为要放入的目标库的表的结构和源数据一样,所以从源数据表中导入即可)

D.选择要导入的表后,点OK键

PS:导入的只是表结构。但是上述步骤后,目标数据库中并没有相应的表,因为上述步骤只是将表结构导入到Designer软件的视图中。所以下面还要在目标库中创建相应的表(结构)。创建方法如下:通过菜单Targets->Generate/Execute SQL… ,见

下图:

在此界面中,generate from下的两项是指要在目标库中创建所有软件的操作界面(target designer)中的所有表还是在界面中选定的表,。Generation options指创建表时,要把界面中的表结构的哪些属性传递给目标库中的表。一般要选Create table,其它项根据实际项目情况选择,此例中按照上图中的选择点上勾就可以了。然后点connect…按钮,在弹出的界面中填入目标库的连接信息以连接目标库,这个操作的作用是连接目标库,以便将最后产生的建表SQL语句在目标库中执行。最后点Generate and execute按钮(作用:生成SQL语句,在目标库进行建表)。完成后,会提示是否保存此次所执行的SQL语句,随意。

8. Step5:设计Mapping

到此,数据源结构和目标结构都已经引入,接下来就可以设计Mapping 了。

Mapping 是ETL 设计的开始,是具体的ETL 规则设计,它包含三方面的信息:数据源信息、转换信

息、目标信息。在Mapping 中,主要工作就是转换。Informatica PowerCenter 提供了20 多种组件,100 多

个转换函数,基本上能够满足正常的需求;另外还可以调用外部的存储过程等。

此处举一个简单的例子,用来说明Mapping 设计流程。

需求描述:

数据源是Customer 表,字段有CUST_ID、CUST_NAME 等,目标是ODS_CUSTOMER_ACTIVE,结

构完全一样;转换的规则是将Customer.CUST_Name 分别加一后缀“_AA ”后赋给

ODS_Customer.CUST_Name,其它数据原样加载。

设计思路:

从需求看,转换部分需要使用表达式组件,负责CUST_Name 字符串处理。在表达式组件中增加一新

的字段,用来作为存储转换后的表达式结果,新的字段是CUST_Name_OUT,这个字段作为输出字段,输

入字段就是CUST_Name(可以直接用鼠标从Source Qualifier 将字段拖入表达式组件),转换的表达式即CUST_Name||’_AA’。

1)点击Mapping Designer,将数据源和目标拖入工作区

2)创建表达式组件,方法有二:

①在工具栏处点击表达式组件,图标见下,直接拖入Mapping Designer 工作区

②或者在菜单Transformation->Create,出现下面的界面

在上图”Select transformation type”选择Expression,并输入新的名字:EXP_Cust_Name 3)将CUST_Name 拖入表达式组件,见下图:

4)双击或编辑表达式组件,选择Ports,见下图

图Workspace_3

点击图Workspace_3 红颜色标注1 的按钮,新增一个Port,命名CUST_NAME_OUT,修改

CUST_NAME 为输入,CUST_NAME_OUT 为输出(按照图Workspace_3 标识的操作)。然后在图Workspace_3 红颜色标注2 处点击进入,书写表达式,见下图:

图Workspace_4

表达式的写法见图Workspace_4 ,这就是规则。

5)将CUST_NAME_OUT 传入目标表CUST_NAME,见下图:

6)由于其它数据不做变化,直接加载,所以将SQL Qualifier 中的其它字段分别拖入目标ODS_CUSTOMER_ACTIVE,也可以利用Informatica 自动匹配功能,具体见下:

①在Mapping Designer 工作区,右键,弹出一个菜单,见下:

②选择Autolink,进入下图界面

From:表示连接的源头,在这里选择SQ_CUSTOMER

To:表示连接的目标,在这里选择ODS_CUSTOMER_ACTIVE

By:Name 是按照名称匹配;Position 是按照位置匹配。由于此处的结构、名字完全一样,所

以选择Name 选项。

③最后选择“Apply Now”,字段关联完毕,最后的Mapping 见下:

7)到此Mapping 设计完毕,保存。下一步就可以进入Step6:设计Workflow。

【补充:根据需求情况,设计自己的ETL 规则。整个过程是相同的,不同的就是选择的组件不同,处理的具体规则不同而已】

9. Step6::设计Workflow

首先要连接资料库和打开Folder,具体参加Step1 和Step2

设计Workflow 有三个主要环节:

1) 生成Session(对应一个Mapping)

2) 建立数据源和目标的连接

3) 修改Session 对应Mapping

首先介绍一下工作区,见下图:

图Workspace_5

Task Developer: 设置当前工作区为Task Developer

有三种类型的任务(Tasks):

Session- 对应Mapping 的实际的数据抽取任务

Command- 在Workflow 中调用操作系统的命令

Email - 在Workflow 中发送email

Worklet Designer: 设置当前工作区为Worklet Designer

Worklet 是一组任务的组合,它可以作为复用逻辑在多个Workflow 中调用。

Workflow Designer: 设置当前工作区为Workflow Designer

Workflow 是一组任务的指令,存储在知识库中,告诉Informatica Server 如何执行抽取任务。1)点击Workflow Designer,进入Wokflow 设计工作区

2)利用向导创建Workflow,从菜单Workflow->Wizard,分三步:

Workflow:第一步输入Workflow 名字和选择Informatica Server

Workflow:第二步选择已经做好的Mapping

Workflow:第三步设置调度信息

最后形成一个简单的工作流,见下图:

3)配置数据源和目标连接

选择菜单栏中的Connecttions,然后选中Relational。为提取源数据库和目标库配置连接,具体参数的配置在打开Relational后点help查看。

4)配置Session 对应的数据源和目标连接信息

在Workflow Designer 工作区选中2)双击或者右键点编辑(Edit)创建的Session:s_m_test1,见下

图:

图Wokspace_6

打开后,所见如图Workspace_6,选择Mapping,此时就需要配置Source 和Target 的信息。按照图中

标注的数字顺序操作配置数据源连接信息:在2 处选择已经配置的数据连接,此处的例子连接是sql_sdbu。目标连接信息的操作同数据源配置过程,选择3,然后也是在2 处选择已经配置好的目标连接。

5)确定,保存

到此一个简单的工作流设计就完成了。一个完整而复杂的工作流涉及到并行与串行,任务分支与连线

状态的判断,时间和事件触发并存。工作流中Task 的具体说明可以参见“Informatica_Training_Chinese”。

10. Step7:运行Workflow

在工作区右键,出现下面的菜单,点击“Start Workflow”

工作开始运行,此时会打开作业监控界面,见Step8

11. Step8:查看作业运行情况

作业运行界面见下:

图Workspace_8

在workflow monitor 中有两种视图:一是Gantt Chart:甘特图的方式显示;一是Task View:以任务列表的方式显示,图Workspace_8 显示的就是Task_View 方式。

监控的信息包括任务名称、开始时间、结束时间、进程状态、处理的记录数、吞吐量等。双击s_m_test1

查看详细信息,见下图:

可以看到数据处理的相关信息

如果还想看到具体的信息,可以查看Session Log,右键s_m_test1,在弹出的菜单中,选择“Get Session Log”。如果任务失败,Session Log 显得更重要了,它详细记录了每一个环节,包括错误信息。

到此,简单演示了一个完整的过程,从规则设计到工作流设计、运行。实际的工作会比这个例子复杂

百倍,但过程都是一样的,况且Informatica 提供了详尽的帮助,它可是你的好帮手吆!(就是文档发档人太2,最关键的地方瞎糊弄,折腾人玩儿)

相关文档