著录项信息
专利名称 | 分布式多点数据抽取方法 |
申请号 | CN201410208607.9 | 申请日期 | 2014-05-17 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-08-06 | 公开/公告号 | CN103970880A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 白崇明 | 申请人地址 | 云南省昆明市盘龙区星雅俊园8幢2单元3207室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 白崇明 | 当前权利人 | 白崇明 |
发明人 | 白崇明 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明具体涉及分布式多点数据抽取方法;包括以下步骤:步骤101:首先针对外部数据源DB及字段结构建立数据源表,步骤102:建立数据源表;步骤103的建立内部数据源表;步骤104:选取需引入数据字段和步骤105:添加数据表定位字段GUID,步骤106:生成内部数据源表结构;步骤107:GUID定位码生成器,步骤108:生成带定位码的内部数据源表;步骤109:建立程序定位数据表,步骤110:约束条件智能生成器,步骤111:用户录入筛选条件,步骤112:单元格位置标注筛选条件及颜色,步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;步骤114的GUID条件,步骤115:生成SELECT;步骤116:获取目标数据,步骤117:聚类分析判断;步骤118:分析报告表;让用户获取需要的任何数量的筛选数据结果。
1.分布式多点数据抽取方法,其特征在于:包括以下步骤:
步骤101:针对外部数据源DB及字段结构;
步骤102:建立数据源表,然后再进行判断是否要建立内部数据源表,如果是,则进入步骤103:建立内部数据源表;如果否则进入步骤107:GUID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加内部数据源表定位字段GUID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:GUID定位码生成器,由GUID定位码生成器对生成的内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立定位数据表,对建立定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤
113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;由步骤
113得出步骤114的GUID条件,针对GUID条件进入步骤115:生成SELECT语句;从而进入步骤
116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。
分布式多点数据抽取方法\n技术领域\n[0001] 本发明涉及数据处理技术领域,具体涉及分布式多点数据抽取方法。\n背景技术\n[0002] 通常数据分析技术的主要方式,是通过数据筛选,获取满足条件的数据元素。目前,实现数据分析筛选,在SQL、Access、Oracle等数据平台中,是通过编制程序语句实现数据筛选,其优势是可以通过其语句函数等,编制程序写语句实现各种筛选结果。但并不能在其数据平台上直接通过鼠标或键盘点击指令界面化操作,实现数据筛选,不能直接构建出将筛选条件与数据元素绑定并记载。在Excel软件中,可以设置筛选条件获取筛选结果,但用户筛选条件无法保存,更不能将筛选条件与单元格绑定;其他现有中外应用或专用软件,公开发表的信息中也未出现上述权利要求涉及到的分布式多点数据抽取技术。\n发明内容\n[0003] 本发明的目的为了解决上述问题,提供了分布式多点数据抽取方法。\n[0004] 为实现上述目的,本发明提供了分布式多点数据抽取方法,包括以下步骤:\n[0005] 步骤101:针对外部数据源DB及字段结构;\n[0006] 步骤102:建立数据源表,然后再进行判断是否要建立内部数据源表,如果是,则进入步骤103:建立内部数据源表;如果否则进入步骤107:GUID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加内部数据源表定位字段GUID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:GUID定位码生成器,由GUID定位码生成器对生成的内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立定位数据表,对建立定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤\n113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;由步骤\n113得出步骤114的GUID条件,针对GUID条件进入步骤115:生成SELECT语句;从而进入步骤\n116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。\n[0007] 本发明具有以下有益效果:采用本发明的方法,可在不编写程序语句的情况下,让用户能完整的设定任何数量的数据筛选条件,获取需要的任何数量的筛选数据结果,且将任何数量的筛选条件组合记载于数据表中。\n附图说明\n[0008] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。\n[0009] 图1为本发明分布式多点数据抽取方法处理流程图。\n具体实施方式\n[0010] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。\n[0011] 参见图1,本发明提供了分布式多点数据抽取方法,包括以下步骤:\n[0012] 步骤101:针对外部数据源DB及字段结构;\n[0013] 步骤102:建立数据源表,然后再进行判断是否要建立内部数据源表,如果是,则进入步骤103:建立内部数据源表;如果否则进入步骤107:GUID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加内部数据源表定位字段GUID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:GUID定位码生成器,由GUID定位码生成器对生成的内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立定位数据表,对建立定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤\n113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;由步骤\n113得出步骤114的GUID条件,针对GUID条件进入步骤115:生成SELECT语句;从而进入步骤\n116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。\n[0014] 二维数据表中,以单元格位置信息为绑定点,记载用户所设定的数据分析筛选的条件,并将行的各单元格已经设置的若干个数据筛选条件进行数理逻辑关联,应用数据筛选语句抽取满足组合条件的数据样本。而若干个单元格和数据行形成的筛选条件集合,将用户需要筛选的数据,以语句方式完整的与各数据单元关联,形式上分布于数据单元中,形成分布式多点数据抽取技术。\n[0015] 本发明举例说明:二维数据设列标识X和行标识Y:\n[0016] 列集合X={X1,X2,X3,X4,X5......Xn}\n[0017] 行集合Y={Y1,Y2,Y3,Y4,Y5......Yn}\n[0018]\n[0019]\n[0020] i为行数值:i={1,2,3,4,5......m},\n[0021] j为列数值:j={1,2,3,4,5......n}\n[0022] 列子集X:Xj={Dj1,Dj2,Dj3,Dj4,Dj5......Djm}Xj∈XY第j列的全集[0023] 行子集Y:Yi={Di1,Di2,Di3,Di4,Di5......Din}Yi∈XY第i行的全集[0024] 行列子集:Dxy={Dij}\n[0025] 数据单元(元素)D:Dij\n[0026] Dxj∈XjDxj是第j列集合的子集;\n[0027] Dyi∈XiDyi是第i行集合的子集。\n[0028] 第一,设定条件,抽取列样本子集:\n[0029] 在单元Dij设置抽取样本条件Pij,从字段列中求满足条件Pij的元素子集Dxj:\n[0030] Dxj∈Xj表示为:Dxj={Xji|Pij}Pij为获取Xj列集合的一个条件元素。\n[0031] 表示为Dxj集合是从j列集合中抽取的满足Pij的样本集合。\n[0032] 第二,在行记录中设定抽取样本的条件集合Pi:\n[0033] Pi={Pxj}\n[0034] 表示为在第i行的各个列(X)设定条件的多个组合,这些条件集合按照相关逻辑形成数理逻辑集合,作为在全集XY中抽取样本的条件集合。\n[0035] 第三,通过条件集合Pi将从XY全集中抽取多行多列元素样本子集Dxy:\n[0036] Dxy={XY|Pi}\n[0037] 第四,Pn为n行的条件Pi的集合,将抽取出多组样本集合Dxy,为此我们设整个二维数据中的条件全集为Pn,则:Pn={Pi}\n[0038] 抽取的样本集合为Dn:Dn={Dxy|Pn}Dn∈XY\n[0039] 采用本发明的方法,在二维数据表中,建立具有唯一性的行ID号,与特定表的字段相对应锁定每一数据单元的位置信息,运用程序产生成软件操作界面,由用户在软件界面中根据实际需要,设定数据筛选条件及数理逻辑关系,通过程序设计将数据单元格位置信息与该筛选条件组合绑定,表现为在对应表单元格中有效记载了用户筛选分析条件,在对应的单元格执行筛选将获取若干组不同的数据样本。\n[0040] 本发明是应用信息理论、集合论和计算机技术等,总结信息社会对数据分析自由记载分析条件及成果的需要,提出将对多维数据的筛选条件与对应的数据元素绑定,记载用户需要获取的筛选数据样本。多维数据所含的各数据元素均具备记载不同筛选条件的环境,从而产生多点数据抽取功能。如在类似二维数据表中,将筛选条件记载于数据元素相关信息位置中,在用户设定筛选条件后,在相应单元格均可筛选出预期的筛选数据样本。其数学理论依据是基于子集合条件,设定有条件的集合算法,从全集中抽取子集元素样本,并建立以条件为对象的集合,从而获取多元化的子集。从信息理论的角度,则是通过信息融合技术,从总体信息中根据信息需求获取具有同质性(类同)的信息,并实现任何数量的类条件,获取多元化的聚类信息样本。\n[0041] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
法律信息
- 2018-12-18
- 2014-09-03
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201410208607.9
申请日: 2014.05.17
- 2014-08-06
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2013-01-30
|
2012-09-20
| | |
2
| |
2013-08-07
|
2013-04-19
| | |
3
| |
2012-02-01
|
2011-11-11
| | |
4
| |
2013-04-24
|
2011-10-21
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |