TRSGateway 全文检索数据网关用户手册.doc

上传人:西安人 文档编号:5015878 上传时间:2020-01-28 格式:DOC 页数:136 大小:2.18MB
返回 下载 相关 举报
TRSGateway 全文检索数据网关用户手册.doc_第1页
第1页 / 共136页
TRSGateway 全文检索数据网关用户手册.doc_第2页
第2页 / 共136页
TRSGateway 全文检索数据网关用户手册.doc_第3页
第3页 / 共136页
TRSGateway 全文检索数据网关用户手册.doc_第4页
第4页 / 共136页
TRSGateway 全文检索数据网关用户手册.doc_第5页
第5页 / 共136页
点击查看更多>>
资源描述

《TRSGateway 全文检索数据网关用户手册.doc》由会员分享,可在线阅读,更多相关《TRSGateway 全文检索数据网关用户手册.doc(136页珍藏版)》请在三一文库上搜索。

1、 版权信息 1 全文检索数据网关全文检索数据网关 用用 户户 手手 册册 版本:v2.0 Build1015 北京拓尔思(TRS)信息技术有限公司 版权信息 2 版版版权权权说说说明明明 本手册由北京拓尔思(TRS)信息技术有限公司(以下简称 TRS 公司)出版, 版权属 TRS 公司所有。未经出版者正式书面许可,不得以任何方式复制本文 档的部分或全部内容。 北京拓尔思(TRS)信息技术有限公司 版权所有。保留所有权利。 是北京拓尔思(是北京拓尔思(TRS)信息技术有限公司的注册商标)信息技术有限公司的注册商标 目录 I I 目目 录录 关于本手册.1 读者 .1 手册组织 .1 相关手册 .

2、1 用户反馈意见 .1 联系地址 .1 第一章 TRS 数据网关系统介绍.4 1.1 概述.4 1.2 主要特点.4 1.3 系统需求.5 1.4 产品新增功能.5 第二章 TRS 数据网关的安装.6 2.1 安装介质.6 2.2 安装需求.6 2.3 安装过程.7 2.4 安装结果.7 2.5 系统卸载.7 第三章 使用说明.8 3.1 启动界面.8 3.2 版本升级.17 3.3 任务的导入.18 3.4 任务的导出.19 3.5 任务的视图.20 3.6 创建任务.21 3.6.1 创建“RDBMS=TRS”任务21 3.6.2 创建“TRS=RDBMS”任务34 3.6.3 创建“TR

3、S 格式文件=RDBMS”任务.44 3.6.4 创建“RDBMS=RDBMS”任务 .56 3.6.5 创建“TRS 格式文件=TRS”任务.66 3.6.6 创建“优化 TRS 数据库”任务.76 3.6.7 创建“RDBMS=TRS 格式文件”任务.79 3.7 查看和修改任务属性.91 3.7.1 常规属性 .91 3.7.2 字段匹配 .94 3.7.3 任务的定时 .95 3.7.4 FTP 参数的设置.96 3.8 执行任务.97 3.8.1 任务的排序 97 目录 II II 3.8.2 查看工作日志 .98 3.8.3 查看执行信息 .99 3.8.4 删除执行信息 .99

4、3.9 运行监控 .99 附录 1 字段对应表102 1.1 RDBMS 和 TRS 字段对应表 .102 1.1.1 ORACLE 和 TRS 的字段对应表102 1.1.2 SQL SERVER 和 TRS 的字段对应103 1.1.3 SYBASE 和 TRS 的字段对应.105 1.1.4 DB2 和 TRS 的字段对应.106 1.1.5 INFORMIX 和 TRS 的字段对应 107 附录 2 RDBMS 客户端配置.109 2.1 ORACLE 客户端的配置.109 2.2 SQL SERVER 客户端的配置.113 2.3 SYBASE 的客户端配置 .114 2.4 DB2

5、 的客户端配置.115 2.5 INFORMIX 的客户端配置.117 附录 3 常见问题解答120 3.1 安装 .120 3.1.1 安装 TRS 数据网关有何要求.120 3.1.2 如何升级 TRS 数据网关.120 3.1.3 TRS 数据网关对 ORACLE 的哪些版本提供支持121 3.1.4 TRS 数据网关对 SQL SERVER 的哪些版本提供支持121 3.1.5 TRS 数据网关对 SYBASE 的哪些版本提供支持.122 3.1.6 TRS 数据网关对 DB2 的哪些版本提供支持.123 3.1.7 TRS 数据网关对 informix 的哪些版本提供支持123 3.

6、2 创建任务 .123 3.2.1 如何创建 RDBMS 视图到 TRS 数据库的增量更新任务.123 3.2.2 如何创建过滤大对象文本的任务 125 3.2.3 如何创建字符集转换的任务 126 3.2.4 如何创建指定字符型字段保存 URL 的任务 126 3.2.5 如何在创建任务时选择保存大对象文本还是原格式文件 127 3.3 运行任务 .129 3.3.1 运行大数据量的 RDBMS 任务时有什么需要注意的 129 3.3.2 RDBMS 任务组的任务运行过程中突然没有反映了怎么办 .129 3.3.3 运行多个 TRS 格式文件到 RDBMS 任务时任务中断怎么办.130 3.

7、3.4 运行 TRS=RDBMS 任务中 TRS 数据库中包含多值字段怎么办.130 3.4 管理任务 .130 3.4.1 取消版本转换窗口后如何恢复 130 关于本手册 1 1 关于本手册 本手册介绍的主要内容可以分为四部分。第一部分为系统概述;第二部分是安装指 南;第三部分为使用说明;第四部分为附录。 读者 本手册的读者为 TRS 和 RDBMS 的使用者。 手册组织 本手册的内容组织如下 第一章 TRS 数据网关功能概述 介绍 TRS 数据网关。 第二章 安装 详细描述 TRS 数据网关。 第三章 使用说明 详细描述 TRS 数据网关。 相关手册 TRS 数据网关联机手册 用户反馈意见

8、 TRS 公司感谢您使用 TRS 产品。如果您发现本手册中有错误或者产品运行不正确, 或者您对本手册有任何意见和建议,请及时与 TRS 公司联系。您的意见将是我们做版本 修订时的重要依据。 联系地址联系地址 TRS 总部总部 关于本手册 2 2 营销服务中心:营销服务中心: 北京市海淀区花园东路 10 号高德大厦 401 室 邮编:100083 电话:010-82038858 传真:010-82038878 Email: 产品研发中心:产品研发中心: 北京 北四环中路 35 号健翔桥 北京信息工程学院图书馆三层 邮编:100101 电话:010-64859900 传真:010-64879084

9、 Email: 上海分公司上海分公司 上海市成都北路 333 号 招商局广场南楼 1505 室 邮编:200041 电话:021-52981607/08 传真:021-32013912 Email: 广州分公司广州分公司 广州市先烈路 76 号 中侨大厦 16 层 H 室 邮编:510070 电话:020-87320136 传真:020-87320141 Email: 成都办事处成都办事处 成都市洗面桥街 29 号四川咨询产业大厦 1309 室 邮编:610041 电话:028-85533146 传真:028-85533516 Email: 湖南代表处湖南代表处 湖南省长沙市韶山北路 81 号

10、君临天厦 605 室 邮编:410011 关于本手册 3 3 电话:0731-4126388 Email: Website: 第一章 TRS 数据网关系统介绍 4 4 第一章 TRS 数据网关系统介绍 1.1 概述概述 TRS 全文检索数据网关(以下简称 TRS 数据网关)是由 TRS 信息技术有限公司和五大关系型数 据库厂商 ORACLE、SYBASE、IBM、 INFORMIX、MICROSOFT 鼎力合作,推出的实现 TRS 数据 与主流关系型数据库 Oracle, Sybase, DB2, Informix, SQL Server(以下统称为 RDBMS)数据之间进行 双向数据迁移的工

11、具。该工具实现了 RDBMS 与 TRS 服务器之间数据共享,使用户在享有 RDBMS 卓 越的数据处理功能的同时,拥有 TRS 优秀的全文检索功能。 TRS 数据网关由以下两部分组成: TRS 任务监理控制台 分别对应 Oracle, Sybase, DB2, Informix, SQL Server 的 TRS*RDBMS 任务组件 TRS 任务监理控制台是运行在 Windows 平台上的高度自动化、智能化和定制化的任务处理工具, 它可以独立运行一个 RDBMS 任务组件,也可以同时运行多个 RDBMS 任务组件。它与 RDBMS 任务 组件共同完成: RDMBS 与 TRS 数据库之间数

12、据迁移 TRS 格式文件与 RDBMS/TRS 之间的数据迁移 RDBMS 与 RDBMS 数据库之间的数据迁移 TRS 数据库的优化 以上各种数据迁移与优化任务的管理、维护和定时执行 1.2 主要特点主要特点 TRS for RDBMS Gateway 系列软件是辅助完成数据索引同步更新的自动化工具,它具有如下特 点: 自动化程度高:用户只需要按步跟随“任务创建向导”的提示就可以创建更新任务。 可设置的定时执行任务:对创建好的任务,用户可以设置其自动定时执行。如:用户可以设置一 个增量更新任务每隔 30 分钟执行一次,意即每隔 30 分钟将用户对 RDBMS 数据库表中数据的修 第一章 TR

13、S 数据网关系统介绍 5 5 改向 TRS 数据库中进行一次索引的更新。高度自动化的定时执行功能使用户不必手动进行数据索 引的更新操作,只需启动 TRS*Agent 即可自动定时执行。 实时查看和修改任务的各种属性:对任何一个创建好的任务,用户可以查看其属性,并可修改属 性。 美观友好的界面风格:界面友好,简单易用。 1.3 系统需求系统需求 应用程序运行的硬件环境要求: CPU: 主频 200MH(主频越高性能越好) 。 内存: 256M 硬盘:请确保系统临时目录的可用空间在 500MB 以上。 CDROM: 16X 以上的光盘驱动器。 应用程序运行的软件环境要求: 操作系统:Windows

14、 NT 4.0 +sp6/2000 + sp2 软件环境:安装相应关系数据库的客户端工具。 1.4 产品新增功能产品新增功能 第二章 安装 6 6 Trsagent 是 TRS for RDBMS Gateway 系列软件的最新版本,版本号为 2.0。它相对于 1.0 版有很 大的改进,修正了 1.0 版中的 Bug,还增加了一些新的功能,在 1.0 版中,成功的实现了数据从 RDBMSTRS 的数据同步和更新。在 2.0 中不仅增加了数据从 TRSRDBMS 的数据迁移(包括 TRS 数据 库RDBMS 和 TRS 格式的文件RDBMS)功能,还增加了数据 RDBMS=RDBMS 迁移,实现

15、 RDBMS 数据库 表或视图内部的数据迁移,为用户实现视图到表的转换,从而为提高性能提供一种可能,除了这些, 数据更新的方式增加了追加更新。这些功能的增加,是您在享有各种主要 RDBMS 卓越的数据处理功 能的同时,拥有 TRS 优秀的全文检索功能。 第二章 TRS 数据网关的安装 2.1 安装安装介质介质 安装介质分为两部分 TRS Gateway 控制台和 TRS*RDBMS 组件。 TRS*RDBMS 组件包括:ORACLE、SQL SERVER、SYBASE、DB2、INFORMIX。 2.2 安装需求安装需求 安装 TRS 数据网关需要满足以下软件条件: 安装 TRS 数据网关控制

16、台(必须) 安装 TRS*RDBMS 的数据库组件(必须) 安装与 TRS*RDBMS 数据库组件相同的数据库客户端(必须) 安装 IE 4.0 以上浏览器(浏览联机帮助所必须) 在运行 ORACLE SERVER 的计算机上安装 FTP 服务器(取决于处理数据的条件) 安装 TRS 数据网关需要满足以下硬件条件: CPU:主频 200MH(主频越高性能越好) 。 内存: 256M 第二章 安装 7 7 硬盘:安装目录的可用空间:10M (如果您需要保留出错日志,还需要更多的硬盘空间) 系统临时目录可用空间:500M。 CDROM: 16X 以上的光盘驱动器。 2.3 安装过程安装过程 首先安

17、装 TRS Gateway 控制台,直接运行 Setup.exe 即可,在安装过程中只需指定安装路径即可, 系统缺省的安装路径为 d:TRS4TRSGateway。 接着可以选择安装需要的 RDBMS 组件。 2.4 安装结果安装结果 在开始菜单中有 Gateway 控制台的快捷方式可以直接运行程序。 2.5 系统卸载系统卸载 因为控制台和相应组件相互独立,所以可以独立卸载。选择开始菜单栏中的 TRS 信息检索栏下的 卸载 TRS (RDBMS)任务组件可以单独删除相对应的 RDBMS 任务组件,或选择卸载 TRS Gateway 控制台可以删除控制台和所有组件。 第三章 使用说明 8 8 第

18、三章 使用说明 3.1 启动界面启动界面 启动 TRS 数据网关控制台后,系统将自动检测您的机器上是否存在有效的版本 1.0 的任务,如果 存在,将提示您进行版本转换。 TRS 数据网关控制台的界面由以下几部分组成: 1,菜单: 任务菜单 任务菜单包括以下功能:新建、执行、中断执行、删除、重命名、属性和退出。其中新建功能, 在任务组为 RDBMS 时支持四种任务的创建:RDBMS=TRS;TRS=RDBMS;TRS 格式文件 =RDBMS;RDBMS=RDBMS。任务组为 TRS 时支持两种任务的创建:TRS 格式文件=TRS 和优化 TRS 数据库。执行任务包括:立即执行和定时执行。 查看菜

19、单 查看菜单包括以下四种功能:查看(任务) 、查看工作日志、显示执行信息和删除执行信息。 帮助菜单 帮助菜单包括:目录和索引、关于本产品。 第三章 使用说明 9 9 系统设置菜单 系统设置菜单包括:进程文件设置、启动监控进程、关闭监控进程、文本合并、字段合并、任 务附加属性 这个菜单是在后台启动一个进程监控程序对 Gateway 进行监控。 (1) 、进程文件设置: 进入这个菜单将会弹出如下的对话框: 第三章 使用说明 10 10 A、TRS Gateway 可执行程序的全路径就是 TrsAgent.exe 所在的全路径,包含 TrsAgent.exe。如果用户安装在 D:TRS4Gatewa

20、y 下,那么全路径是: D:TRS4GatewayTrsAgent.exe B、重启 TRS Gateway 的时间间隔(单位:天) ,就是确定多长时间把 TRS Gateway 重新启动, 如果设置为 0 天,那么监控进程不对 Gateway 进行监控。多数增量更新情况下,这个值可设为 110,如果是执行完全更新,则设为 0。 C、监控进程的监控时间间隔(单位:秒)就是监控进程多长时间对 Gateway 进行一次监控 (就是扫描一次 Gateway 的状态) 。这个时间多设为 10(不允许为 0) 。 D、重新启动 TRS Gateway 的时刻就是用户要指定在那一个时间点上重新启动 TRS

21、 Gateway。如果在B中的值设为 5,这是此项设为 20:00:00,将表示在五天之后的 20:00:00 分重新启动 TRS Gateway。 E、重新启动系统就是重新启动 Windows 系统,这个项我们强烈建议用户不要设置。 (2) 、启动监控进程: 启动一个后台的按照配置的监控进程,使之能对指定的进程进行监控。 (3) 、关闭监控进程: 关闭一个后台的按照配置的监控进程,使之不能对指定的进程进行监控。 (4) 、文本合并: 第三章 使用说明 11 11 文本合并主要只针对多值的情况下进行相关的大对象中文本合并到一个 TRS 的 Document 类型字段中的过程。这种情况会在诸如一

22、个作者对应多个文章的情况中,而 TRS 的 Document 类型是不支持多值的,为此当需要对所有的文章进行全文检索时,就需要文本合并。 进入文本合并菜单,将弹出如下对话框: 选择其中的数据库种类,如果在已经创建的任务中存在多值,将会出现如下的信息: 可以选择那些任务必须合并文本,那些不用合并文本。选择合并文本的任务,其注解将变 为:“多值文本合并” 。注意,系统缺省默认都是不合并文本的。 注意:目前版本下,Oracle 和 Sybase 还是没有提供这个功能。 (5)字段合并: 第三章 使用说明 12 12 字段合并是解决在某些情况下,需要把多个字段的值合并到一个字段中的功能。 选择后将会弹

23、出如下的对话框: 选择任务类型后选择任务名,显示下图: 只要单击合并设置中某一行,就会显示弹出可选合并的源字段名,如图: 第三章 使用说明 13 13 例子中,分别“WINHEIGHT、DOCKEYWORDS、DOCORDER”等三个字段合并到 DOCRELWORDS 中,如图: (6)任务附加属性: 任务附加属性主要是设置 Gateway 在进行某个任务时,中间缓存数据的路径。这样可以更方便 用户维护。 第三章 使用说明 14 14 存在“逐个设置”和“一次全部设置”两个设置项, “逐个设置”就是一个一个地设置任务。 “一次全部设置”则是一次性地对所有任务进行设置。 当选“一次全部设置”时将

24、会弹出路径选择狂,如下图: 选定目录后,按下“确定” ,将会出现如下的效果: 第三章 使用说明 15 15 例子是选择“H:incoming”做缓冲路径。 如果是选择“逐个设置” ,则必须单选某个任务后才能弹出选择路径的对话框。如图: 对任务“FULL_FTPDIR1”选择了“D:Download”作为缓冲目录。 2,工具条 工具条上包含了新建、查看任务、执行、中断执行、删除、重命名、属性、查看工作日志、删除 工作日志和帮助九个按钮。其中新建按钮可以打开一下拉菜单提供六种任务的创建。 3,窗口 第三章 使用说明 16 16 左上部:任务组窗口 任务组窗口反映的是当前控制台支持的有效的数据库组件

25、,其中在最多的情况下,任务组窗口 将包含六个组件:ORACLE,SQL SERVER,DB2,SYBASE,INFORMIX 和 TRS。任何时候有且只有一个 任务组为选中状态,选中任务组图标为彩色显示,其他的为灰色显示。 右上部:任务窗口 任务窗口是一用来显示当前已创建任务信息的列表窗口,该列表在任务组为 RDBMS 时共有八列: 定时、任务类型、任务名、源数据、目标数据、下次运行时间、创建时间和描述;当任务组为 TRS 时,列表为七列:定时、任务类型、任务名、目标数据、下次运行时间、创建时间和描述。 对任务一列,点击该列的列表头均可以实现对当前任务组的所有任务按该列的升/降排序。 用户可以

26、通过选择查看任务的方式,查看所有任务或指定的某一任务类型的任务。缺省情况下, 为查看所有任务。 下部:执行信息窗口 执行信息窗口是反映了当前任务组指定任务的历次执行信息。该窗口可以显现或隐含,点击 “查看”菜单的“显示执行信息”或工具条上的“显示执行信息”按钮将控制该窗口的显隐状态。 点击“查看”菜单中的“删除执行信息”项将当前任务组的所有执行信息全部清空。 第三章 使用说明 17 17 3.2 版本升级版本升级 启动 TRS 数据网关控制台后,系统将自动检测是否需要进行版本升级,如果同时满足以下条件, 系统将弹出版本转换对话框: 1.您的机器上存在有效的版本 1.0 的任务; 一个有效的 T

27、RS 数据网关 1.0 的任务是指: o由 V1 生成的非优化 TRS 数据库的任务, o且 V2 安装了与对应任务相关数据库组件。 2.您上一次使用“版本升级”功能时,未选择“下次启动不再显示本窗口”选项。 版本转换对话框包括的选项有: 将版本 V1 的任务升级到 V2,同时保留 V1 的任务。 (该种情况为缺省选择) 将版本 V1 的任务升级到 V2,删除 V1 已经完成转换的任务。 不做版本升级。 下次启动时不再显示本窗口。 该选项将封闭版本转换功能,如果您在封闭版本转换功能后确实还需要再次进行版本转换, 请将您系统目录下./WINNT/win.ini 文件中的以下信息修改为: TRS

28、AGENT VersionConvert=TRUE 进行版本升级需要注意以下几个问题: 第三章 使用说明 18 18 1.版本升级时,需要与数据库连接进行参数校验,连接失败或已经无效的任务将不进行转换。 2.版本升级后,所有在 V1 中设置的定时将无效。 3.版本升级后,在 V1 中如果存在 ORACLE 的 CLOB 与 TRS 的 PHRASE 字段的对应,将取消。 4.版本升级后,在 V2 中显示的任务名为 V1 中创建的任务名后+“_V1“组成。 5.升级后的任务没有任务的创建时间。 6.如果 V1 的一个任务进行了一次版本转换后,在 V1 中修改了该任务的属性,再次转换,如果 该任务

29、在 V2 仍保持程序自动生成的文件名,该任务属性将自动修改。 3.3 任务的导入任务的导入 TRS 数据网关允许您将运行在不同机器上的任务导入或导出到其他机器上。点击“任务”菜单的“导 入任务”将打开任务导入对话框。 导入任务时,需要指定拟定导入的文件名以及拟定导入到任务组。 在以下情况,您需要使用“编辑”功能打开拟定导入的文件,修改部分参数: 1.拟定导入的 RDBMS 任务来源于其他的机器,修改 RDBMS 服务名。 由于 RDBMS 任务组登录的本机 RDBMS 客户端创建的服务,如拟定导入文件的服务名在本机 不存在,或者与本机的服务名所指的 RDBMS 数据库不同,将导致任务运行时登录

30、 RDBMS 失 败。 在这种情况下,需要修改的服务名参数保存在 SourceServer 或 TargetServer 下(是源或目标取 决于具体任务中 RDBMS 是作为源还是目标。 ) TaskName=任务名 SourceServer=ora8i TargetServer= 2.拟定导入的 RDBMS 任务的本机创建的一个增量更新的任务,希望导入后转为完全更新任务。 修改更新状态。 第三章 使用说明 19 19 更新状态的参数保存在 UpdateMode 中,0 表示完全更新,1 表示追加更新,2 表示增量更新。 TaskName=任务名 UpdateMode=0 切记:A,不要将完全

31、更新或追加更新的任务手工修改为增量更新,因为增量更新任务正常运 行所需的 Trigger 是由创建任务时完成的,手工修改任务后将没有对应的 Trigger,任务运行将 导致失败。 B,导入增量更新任务时一定要慎重,切实保证该增量更新任务所需的 Trigger 是有效的。 如果拟定导入的文件中包含的任务不属于指定的任务组,则导入任务失败。 3.4 任务的导出任务的导出 TRS 数据网关允许您将运行在不同机器上的任务导入或导出到其他机器上。点击“任务”菜单的“导入任 务”将打开任务导出对话框。 任务导出对话框包括以下内容: 当前任务组:显示进行任务导出功能时的任务组信息。 目标文件名:由用户指定导

32、出的文件名,文件后缀为“.tsk“。 任务范围: 第三章 使用说明 20 20 o当前任务:如果进入任务导出功能时为在任务窗口指定任何任务,则该项灰显。 o所有任务:指当前任务窗口中显示的所有任务。 o指定范围:指当前任务窗口中显示的所有任务的子集,单个任务间一“,”分隔,多个任 务间以“-”分隔,填写任务必须在任务说明的有效范围之内。 3.5 任务的视图任务的视图 TRS 数据网关提供按任务类型查看任务的方法。 在当前任务组,点击“查看”菜单的“查看”子项并选择不同的任务的方式,任务窗口将显示单前任 务组指定任务类型的任务。 针对 RDBMS 任务组,可查看的任务类型包括: 所有任务 RDB

33、MS=TRS 任务 TRS=RDBMS 任务 TRS 格式文件=RDBMS 任务 RDBMS=RDBMS 任务 针对 TRS 任务组,可以查看的任务类型包括: TRS 格式文件=TRS 任务 优化 TRS 数据库任务 第三章 使用说明 21 21 3.6 创建任务创建任务 3.6.1 创建创建“RDBMS=TRS”任务任务 所谓“RDBMS=TRS”任务就是将保存在 RDBMS(ORACLE,SYBASE,DB2,SQL SERVER,INFORMIX)数据库中的数据向 TRS 数据库进行迁移的任务。 创建“RDBMS=TRS”任务可以单击“任务”菜单的“新建|RDBMS=TRS”菜单项,或单

34、击工具条上 的“创建任务”的“RDBMS=TRS”项。创建“RDBMS=TRS”任务共有九步组成: 第一步:登录第一步:登录 RDBMS 和和 TRS 数据库数据库; 创建“RDBMS=TRS“任务的第一步是登录 RDBMS 和 TRS 数据库。 登录 RDBMS 数据库需要填写的参数包括: 服务器地址:指安装 RDBMS 的服务器名,如果 RDBMS 是 ORACLE 的话,请填写本机 CLIENT 端设置的有效服务名。用户名:指登录 RDBMS 服务器的用户名。密码: 指登录 RDBMS 服务器的 密码。是否保存密码:是:下次进入创建任务界面时自动显示上次使用的 RDBMS 服务器登录信息

35、及 其密码;否:下次进入创建任务界面时只显示上次使用的 RDBMS 服务器和用户信息,不显示密码。 登录 TRS 数据库需要填写的参数包括:服务器地址:指安装 TRS 服务器 4.0 的 IP 地址。服务器端口: 指 TRS 服务器 4.0 的端口号,缺省为 8888。用户名:指登录 TRS 服务器的用户名。密码: 指登录 TRS 服务器的密码。是否保存密码:是:下次进入创建任务界面时自动显示上次使用的 TRS 服务器登 录信息及其密码;否:下次进入创建任务界面时只显示上次使用的 TRS 服务器和用户信息,不显示密 码。 如果在登录过程中出现异常,请在左下角的状态框中查看出错的原因。 第三章

36、使用说明 22 22 第二步:指定数据来源于第二步:指定数据来源于 RDBMS 数据库表或视图数据库表或视图; 创建“RDBMS=TRS”任务的第二步是指定数据来源。 源为 RDBMS 数据库时,数据来源可以是 RDBMS 的一个表或一个视图。 源为表需要选择源数据库及其表名。如果源数据库为 ORACLE,则无需指定源数据库名。 源为视图需要选择源数据库、视图,以及指定视图所在的主表。如果源数据库为 ORACLE, 则无需指定源数据库名。如果当前数据库中没有符合要求的视图,用户可以通过“新建视图”按 钮创建新的视图。 第三章 使用说明 23 23 第三步:指定第三步:指定 RDBMS 表或视图

37、的主键;表或视图的主键; 创建“RDBMS=TRS”任务的第三步是指定 RDBMS 表或视图的主键,该页面并不是在所有情况下 均出现。 数据源为 RDBMS 表 如果指定的数据源来自 RDBMS 表时,系统将自动检测该表在创建时是否设置了主键,如果设 置了主键,则跳过该页面,否则需要指定主键。在系统提示的指定主键列表中列出了指定的源数 据库表中所有可能成为主键的字段。可能成为主键的字段是指字段类型为 NUMBER, CHAR,DATE,VARCHAR2 的字段。选定其中的一个字段后,系统将根据该字段在当前的数据 库表中保存的所有数据是否唯一判断该字段是否可以做为主键。成功,则进入下一页。如果

38、RDBMS 数据库为 ORACLE 数据库,指定主键为 ROWID 时,不进行检测。如果建成多值处理的 任务,主键可能不唯一,此时应该选中“多值处理”多选框再进入下一页。 建议:ORACLE 数据库采用 ROWID 字段作为表的主键。 数据源为 RDBMS 视图 如果指定的数据源来自 RDBMS 视图,则必须指定主键。在系统提示的指定主键列表中列出了 指定的源数据库视图中所有可能成为主键的字段。可能成为主键的字段是指字段类型为 NUMBER, CHAR,DATE,VARCHAR2 的字段。选定其中的一个字段后,系统将根据该字段 第三章 使用说明 24 24 在当前的数据库表中保存的所有数据是否

39、唯一判断该字段是否可以做为主键。 特别需要注意地是:由于一个视图必须有一个主表,而记录任务更新的 TRIGGER 是创建在主 表的主键上的,在设置视图主键时必须保证指定的视图的主键必须同时是其主表的主键,且视图 使用的主键名必须和主表使用的主键名一致。 如果指定的字段不能作为主键,请在左下角的状态框中查看出错的原因。 第四步:指定第四步:指定 TRS 目标数据库表以及数据迁移的更新类型、源目标数据库表以及数据迁移的更新类型、源 RDBMS 表的字符集;表的字符集; 创建“RDBMS=TRS”任务的第四步是“设置目标数据库参数”。 需要设置的参数包含以下四个部分: 目标数据库名:目标数据库为 T

40、RS 时,该项为空 目标表如果在当前显示的 TRS 目标列表中未包含您认为合适的 TRS 数据库,您可以单击新建 表按钮,创建新的 TRS 数据库。 更新方式 RDBMS=TRS 支持的更新方式包括三种: o完全更新:就是在每次执行任务时,先将指定的目标数据库表中的内容清空,然后再 将所有源数据库表中符合条件的数据迁移到目标数据库中。 第三章 使用说明 25 25 o追加更新:就是在每次执行任务时,并不将目标数据库表中的内容清空,而是直接将 所有源数据库表中符合条件的数据迁移到目标数据库中。 o增量更新:就是自该任务创建成功时起,通过记录 RDBMS 源数据库表或视图记录的 更新状态,在执行任

41、务时,将所有更新了的源数据库表中符合条件的数据迁移到目标 数据库中。 TRS DOCUMENT 字段保存 RDBMS 大对象数据的方式 当目标 TRS 数据库在创建时选择了保存数据的情况下,将 RDBMS 的大对象数据库迁移到 TRS DOCUMENT 的对应字段时是存在两种可能的: o将 RDBMS 大对象中的原格式文件(PDF/HTML)过滤为文本后保存到 TRS DOCUMENT 字段 o将 RDBMS 大对象中的原格式文件(PDF/HTML)过滤为文本后保存到 TRS DOCUMENT 字段,同时将原格式文件也保存到 TRS DOCUMENT 字段。 RDBMS 源数据库表的语言 我们

42、将 RDBMS 字符集的转换分为两部分: o全表统一字符集:是指用户保存在 RDBMS 指定表中的所有记录均采用相同的字符集。 对 ORACLE 来说,安装本系统的机器上必须采用简体中文。 o由字段指定字符集:是指用户指定一个字符型(CHAR 或者 VARCHAR)字段,在该 字段中说明保存在 RDBMS 指定表中的每一条记录的字符集。对于每一种 RDBMS 支 持的字符集以及正确的说明文字,请查看“字符集转换”。 第三章 使用说明 26 26 第五步:字段匹配;第五步:字段匹配; 创建“RDBMS=TRS”任务的第五步是“字段匹配”。 字段匹配页面由三部分组成: 字段列表 oRDBMS 源数

43、据库表字段 源数据库字段显示的是指定的 RDBMS 源数据库表/视图的所有字段以及它们的类型、长度、 主键和其他属性。当字段类型不为字符型(CHAR/VARCHAR)时,所有的长度均为 0。 如果以上字段中包含了字符型(CHAR/VARCHAR)字段,则用户还可以设置“URL”列信 息;如果以上字段中包含了大对象字段,则用户还可以设置大对象的属性和类型。 oTRS 目标数据库字段 目标数据库字段显示的是指定的 TRS 目标数据库的所有字段以及它们的类型和长度。当 字段类型不为字符型(CHAR)时,所有的长度均为 0。 o右键菜单 点击位于源数据字段列表左上方或位于目标数据库字段列表右上方的图标

44、,将分别 第三章 使用说明 27 27 打开一个右键菜单,其中源数据库字段列表的右键菜单的形式为:;目 标数据库字段列表的右键菜单为:位于源/目标数据库表字段列表上方的 右键菜单说明的是源/目标数据库字段列表支持显示的基本列信息,除“字段名”外,其他 列可以通过取消选中该列而隐含该列的显示。 URL 的设置 点击简单的字符型字段的 URL 列,该列将自动显示一个字母“U“,说明已将该字段说明为 URL,再次点击将取消“U“,即取消设置。 需要特别说明的是,字符型字段在未指定保存 URL 之前是不允许和 TRS 的 BIT 类型字段进行 匹配的。如果用户需要将该字段中保存的 URL(例如:htt

45、p:/192.9.200.21/pic/1.gif)作为文件 保存到 BIT 字段,请先将该字段指定为 URL。注意:如果某一个字符型字段已经被设置为主 键,则该字段禁止设置为 URL。 大对象的设置 大对象的处理可以分为三种情况,其中缺省时为“不处理”。 o不做处理 所谓“不做处理”,就是如果用户在创建 TRS 数据库时选择保存数据,则将原格式文件直 接保存到 TRS 数据库中;如果用户在创建 TRS 数据库中选择为只保存索引,则该字段 内容不装入 TRS 数据库。 如果当前的大对象类型为 ORACLE 的“LONG/CLOB/NCLOB“,SQL SERVER 的 “text/ntext“

46、则不做处理即作为“txt“处理;其他大对象类型时,如果用户指定的文件格式在 TRS 支持识别的 48 种格式之外,请选择“bit”作为您指定的文件格式。 第三章 使用说明 28 28 o类型唯一 所谓“类型唯一”,是指在大对象字段中保存的数据格式为.txt, .htm/.html,.pdf(只支持 PDF 3.0) ,.doc, .rtf, .xls, .ppt 格式之一时,系统将自动提取原格式文件的文本作为索引保 存到 TRS 数据库的指定字段中。如果用户在创建 TRS 数据库时选择保存数据同时创建 任务时选择保存原格式文件,则将原格式文件同时保存到 TRS 数据库。如果用户将非以 上格式的

47、数据说明为以上格式之一,数据迁移时按记录进行分析,分析失败后该条记录 指定字段在 TRS 数据库对应字段中保存的内容为空。 o由字段说明 所谓“由字段说明”,就是指当用户在一个大对象字段中保存多种格式的大对象数据(可 以是多种文本格式,也可以是多种二进制文件格式,也可以同时保存多种文本格式和多 种二进制文件格式)时,用户需要在 RDBMS 数据库表/视图中,指定一个用于说明每条 记录保存数据格式的字段,该字段的类型可以为 CHAR 或 VARCHAR。保存在该字段中 的内容应说明大对象数据的“文件后缀名”。例如:某条记录的大对象字段保存的是 “test.html”文件,则说明字段为“html”

48、。需要特别说明的是:以“*.html”或“.html”的形式 来描述均为不正确的描述方式。说明文字的大小无关,如果说明的内容不正确,则该记 录的格式将作为“txt”处理。 需要说明的是:如果该 RDBMS 大对象字段匹配的 TRS 目标 字段为 BIT 类型,则无论采用何种设置,在 BIT 类型字段中均保存文件的原格式,而非 过滤后文本。 字段的匹配 源数据字段与目标数据字段的匹配是通过鼠标的拖放进行的。您可以选中源数据列表的 一行,按住鼠标左键,然后拖放到目标数据库列表中。如果选中的源数据列表的指定字段的 类型能够和目标数据库列表的鼠标所在行的字段类型进行匹配,则光标将显示为,否则 为。如果

49、您希望该源指定字段和某一支持匹配的目标字段进行匹配,松开鼠标左键即可。 当源字段类型和目标字段类型可以进行匹配,但源字段的长度小于目标字段的长度时时 第三章 使用说明 29 29 进行匹配时,系统将提示您 选择“是”,将完成匹配, “否”,将不做任何操作。 功能按钮: o按目标匹配:所谓“按目标匹配”就是系统自动根据源数据字段名和目标数据字段名进 行匹配,也即使说如果某一源字段名与某一目标字段名相同且上述两个字段的类型与 长度均符合匹配条件,则自动匹配。 o删除匹配:在源或目标字段中选中一行已经进行匹配的字段,点击“删除匹配”将删除 指定字段以及它的对应字段的匹配信息。 o还原:取消所有已经设置的字段匹配信息,并将源字段信息恢复到初始状态。 报告出错信息的对话框:点

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 商业贸易


经营许可证编号:宁ICP备18001539号-1