一种分布异构信息资源集成方法

发明专利无效专利

申请号：
CN200810116970.2
IPC分类号：G06F17/30
申请日期：
2008-07-22
申请人：
华北电力大学

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种分布异构信息资源集成方法
申请号	CN200810116970.2	申请日期	2008-07-22
法律状态	权利终止	申报国家	中国
公开/公告日	2008-12-24	公开/公告号	CN101329682
优先权	暂无	优先权号	暂无
主分类号	G06F17/30 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06F 电数字数据处理（基于特定计算模型的计算机系统入G06N） G06F17/00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法〔6〕 G06F17/30 信息检索；及其数据库结构〔6〕	IPC分类号	G;0;6;F;1;7;/;3;0查看分类表>
申请人	华北电力大学	申请人地址	北京市德胜门外朱辛庄华北电力大学变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	华北电力大学	当前权利人	华北电力大学
发明人	李国栋;柳长安;刘琳;赵娜
代理机构	北京众合诚成知识产权代理有限公司	代理人	朱琨

摘要

本发明属于信息处理技术领域，尤其涉及一种分布异构信息资源集成方法。该方法通过信息资源提供者端和信息资源汇集端的操作，实现分布异构信息资源的集成和共享，其实现步骤如下：(1)信息资源提供者端依次执行：异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传，即将封装好的数据以数据包的形式上传到信息资源汇集端；(2)信息资源汇集端收到信息资源提供者端传来的数据包后，进行解压、配置文件解析和数据存储。本方法充分考虑结构的灵活性和扩展性，解决数据库种类异构和数据表异构，解决分布式信息资源的集中存储或分布管理，实现分布异构信息资源的统一目录存储，解决了日益严重的“信息孤岛”问题，有效完成了分布异构信息资源的集成和共事。

1.一种分布异构信息资源集成方法，其特征在于，通过信息资源提供者端和信息资源汇集端的操作，实现分布异构信息资源的集成和共享，所述方法的实现步骤如下：
(1)信息资源提供者端依次执行：异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传，即将封装好的数据以数据包的形式上传到信息资源汇集端；
(2)所述信息资源汇集端收到所述信息资源提供者端传来的数据包后，进行数据包解压、配置文件解析和数据存储；
所述异构数据发现通过判别数据库的类型，加载不同数据库驱动程序，屏蔽数据库系统的异构性，并通过数据表字段描述信息的填写和关键字段的选取，屏蔽数据库表的异构性；
所述元数据配置实现对信息资源的元描述，由数据资源提供者填写数据资源的信息，并将信息记录到用户目录配置文件中；
所述目录生成为信息资源提供者提供构建自主目录服务的途径，帮助信息资源提供者创建目录，并对信息资源提供者的数据文件进行归类；所述目录融合采用集中式或分布式的融合方法，实现信息资源提供者自主构建的目录与信息资源汇集端目录体系的融合和关联，实现对分布信息资源的统一管理；
所述数据封装为将信息资源提供者填写的配置文件和提取的数据文件或目录信息进行压缩和打包；
所述数据上传是通过FTP的数据传输方法将数据包上传到信息资源汇集端；
所述数据包解压为对接收到的信息资源提供者上传的数据包进行解压，从中获得数据存储及目录融合所需的配置信息，为实现信息资源的存储做准备；
所述配置文件解析为将解压后的配置文件进行解析，提取元数据配置信息、中英文配置信息、对应字段描述配置信息及目录融合配置信息，为元数据、实体数据及目录存储提供支持；
所述数据存储为通过分析元数据配置信息、中英文配置信息和对应字段描述配置信息，实现对元数据和实体数据的存储；通过分析用户目录与系统目录的关联关系，建立关联关系表，进行数据或目录的存储，实现目录融合。
2.根据权利要求1所述的分布异构信息资源集成方法，其特征在于，所述方法能够识别的异构数据库系统包括SQL Server数据库、Oracle数据库、MySQL数据库、DB2数据库和Sybase数据库，数据库类型通过加载不同的数据库驱动来扩充。

技术领域\n本发明属于信息处理技术领域，尤其涉及一种分布异构信息资源集成方法。\n背景技术\n随着我国信息产业技术的发展，网络信息资源数量剧增，资源异构、分散、不规范的问题愈加突出，资源的分类体系也不统一，各个数据库、应用系统以孤岛形式独立运作，跨平台、跨领域、跨地域的信息资源整合与共享困难重重。现有技术并不能够较好的解决上述问题，而且现有解决方案的灵活性和扩展性不强。\n发明内容\n鉴于现有技术的不足，本发明提出一种分布异构信息资源集成方法，目的是解决分布异构信息资源的集成及共享问题。该方法通过系统处理，实现分布异构信息资源的集中式存储或分布式管理，并实现统一的分类及共享。\n所述分布异构信息资源集成方法，其技术方案为：通过信息资源提供者端和信息资源汇集端的操作，实现分布异构信息资源的集成和共享，所述方法的实现步骤如下：\n(1)信息资源提供者端依次执行：异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传，即将封装好的数据以数据包的形式上传到信息资源汇集端；\n(2)所述信息资源汇集端收到所述信息资源提供者端传来的数据包后，进行解压、配置文件解析和数据存储。\n所述异构数据发现为：通过判别数据库的类型，加载不同数据库驱动程序，屏蔽数据库系统的异构性，并通过数据表字段描述信息的填写和关键字段的选取，屏蔽数据库表的异构性。\n所述方法能够识别的异构数据库系统包括SQL Server数据库、Oracle数据库、MySQL数据库、DB2数据库和Sybase数据库等，数据库类型可以通过加载不同的数据库驱动来扩充。\n所述元数据配置实现对信息资源的元描述，从宏观的角度解决信息资源的异构问题，并为信息资源汇集后对数据的查询和获取提供支持。\n所述目录生成为信息资源提供者提供构建自主目录服务的途径，帮助信息资源提供者创建目录，并对信息资源提供者的数据文件进行归类；目录融合采用集中式或分布式的融合方法，实现信息资源提供者自主构建的目录与信息资源汇集端目录体系的融合和关联，最终实现对分布信息资源的统一管理。所述集中式融合为将数据表连同数据表间的目录关系一并提交到信息资源汇集端；所述分布式融合为只将数据表的目录关系提交到信息资源汇集端，而数据表仍然在信息资源提供者端存储。\n所述数据封装为将信息资源提供者填写的配置文件和提取的数据文件或目录信息进行压缩和打包，数据上传是通过FTP的数据传输方法将数据包上传到信息资源汇集端。\n所述数据包解压为对接收到的信息资源提供者上传的数据包进行解压，从中获得数据存储及目录融合所需的配置信息，为实现信息资源的存储做准备。\n所述配置文件解析为将解压后的配置文件进行解析，提取元数据配置信息、中英文配置信息、对应字段描述配置信息及目录融合配置信息，为元数据、实体数据及目录存储提供支持。\n所述数据存储为通过分析元数据配置信息、中英文配置信息和对应字段描述配置信息，实现对元数据和实体数据的存储；通过分析用户目录与系统目录的关联关系，建立关联关系表，进行数据或目录的存储，实现目录融合。\n通过以上过程，最终实现对分布异构信息资源的集成和共享。\n本发明的有益效果：本方法充分考虑结构的灵活性和扩展性，屏蔽各个节点数据库系统的异构性，将分布异构的信息资源按照统一的分类汇集起来，并进行统一的目录存储，以实现信息资源的高度共享，有效解决了数据库种类异构和数据表异构以及分布式信息资源的集中存储或分布管理，在一定程度上解决了目前日益严重的“信息孤岛”问题，实现分布异构信息资源的集成。\n附图说明\n图1为本发明分布异构信息资源集成方法结构示意图；\n图2为本发明分布异构信息资源集成方法图形化实例过程图。\n具体实施方式\n下面结合附图说明此模型的具体实施方式：\n图1为本发明分布异构信息资源集成方法结构示意图，其中，101为信息资源提供者端，102为信息资源汇集端。\n本方法的流程图如图1所示，图中对本方法的具体实现过程进行了图形化的表示：信息资源提供者端101依次完成异构数据发现、元数据配置、目录生成融合和数据封装，然后通过FTP上传方式将打包好的数据上传到信息资源汇集端102，信息资源汇集端将数据包进行解压、解析数据文件，最后完成数据的存储，最终实现分布异构信息资源的共享。\n图2为本发明采用集中式融合方法进行分布异构信息资源集成的图形化实例过程图。\n其中，201为信息资源提供者端，202为信息资源汇集端，203为各类分布异构数据库，204为数据库连接，205为信息资源提供者，206为信息资源配置，207为关键字段选取，208为中英文描述，209为元数据配置，210为目录生成及融合，211为数据封装，212为被封装的配置文件，213为被封装的数据文件，214为压缩的数据包，215为解压后的配置文件及数据文件，216为所提交数据表详细描述信息，217为所提交数据表字段列表，218为用户目录结构描述，219为数据文件，220为信息资源汇集端数据表，221为目录关系表，222为关键字段信息表，223为资源信息表，224为元数据配置表，225为实体数据表，226为信息资源汇集端数据库。\n现选取SQL Server2000数据库中的数据表“树木”为例对本方法具体实施方式进行阐述：\n1)异构数据发现\n针对不同类型数据库系统，通过加载不同数据库驱动程序的方法实现对异构数据库屏蔽。信息资源提供者端首先定制数据库连接，通过输入数据库服务器IP、数据库名等连接到相应数据库；选定集中式融合方法，利用数据库查询语句获取数据表中的数据资源，并将查询到的结果集写入到数据文件中。通过数据表字段描述信息的填写和关键字段的选取，屏蔽数据表的异构。\n选取数据表“树木”，选取如下关键字段：\n信息标题：name；\n信息描述：description。\n然后对本数据表的各个字段进行中英文对照描述：\nid：编号；\nname：学名；\nprovince：出产地；\ndescription：描述；\nclass：分类描述。\n2)元数据配置\n元数据配置需要数据资源提供者填写数据资源的标题、主题、创始人、描述、发布者、来源、描述语言等信息，并将信息记录到用户目录配置文件中。\n对选取的数据表“树木”进行如下元数据配置：\n标题：树木数据库；\n主题：树木数据库；\n创始人：华北电力大学；\n描述：描述各种树木信息；\n发布者：华北电力大学；\n来源：北京市；\n描述语言：中文。\n3)目录生成融合\n目录生成融合利用图形化目录框架建立目录树，信息资源提供者可以对自己的信息资源的结构进行组织，并且通过对目录树节点拖拽的方式实现信息资源提供者自主构建的目录与信息汇集端目录体系的融合和关联，并将关联关系记录到配置文件中。\n如在刚刚建立的信息资源“树木数据库”根目录下建立新的节点“园林树木”，完成后拖动该节点到系统目录的国民经济行业分类-＞农、林、牧、渔业-＞林业子目录下。\n4)数据封装上传\n数据封装上传为资源提供者填写的配置文件和提取的数据文件进行压缩和打包，并且通过FTP的数据传输方法将数据包上传到信息资源汇集端。\n5)数据包解压\n数据包解压通过解压程序实现对上传数据包的解压。\n6)数据解析\n数据解析通过分析配置文件标示各个数据表的结构及相互间的关联关系。\n7)数据存储\n数据存储通过调用存储过程实现，存储过程利用解析的配置文件获取相应信息，提取数据表的结构信息及相互间的关联关系，将数据按信息资源汇集端的目录结构存储。分析所述数据解析得到的详细描述信息、字段列表、用户目录结构描述等配置文件，根据目录结构描述将各表的目录关系记入目录关系表，从详细描述信息表中提取关键字段记入关键字段信息表，根据详细描述信息将每个数据表的描述信息记入资源信息表，从用户目录结构中提取元数据配置信息记入元数据表，根据字段列表及相应的数据文件还原实体数据表，为后续的资源数据展示提供数据准备。\n以上实施例为基于本发明的技术特征，以集中式融合方法具体阐述发明。而本发明同样适用于采用分布式融合方法。采用分布式融合方法与集中式融合方法有以下不同：在异构数据发现过程中，应选择分布式目录融合方法；在数据封装上传时，不生成带有实体数据信息的相关文件；在数据包解压时，不生成带有实体数据信息的文件；在数据解析存储时，不执行实体数据表还原。而其他实施步骤与采用集中式融合方法相同，这里不再赘述。\n以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN101094173A	2007-12-26	2007-06-28	分布式异构环境下的数据交换集成系统无效专利	上海交通大学
2	CN1687922A	2005-10-26	2005-05-30	分布式数据源数据集成系统及方法失效专利	北京慧讯信息技术有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供