著录项信息
专利名称 | 一种海量数据管理方法 |
申请号 | CN200610027565.4 | 申请日期 | 2006-06-11 |
法律状态 | 撤回 | 申报国家 | 中国 |
公开/公告日 | 2007-12-12 | 公开/公告号 | CN101086732 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G06F17/30查看分类表>
|
申请人 | 上海全成通信技术有限公司 | 申请人地址 | 上海市延安西路726号(华敏翰尊国际)7楼J***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海全成通信技术有限公司 | 当前权利人 | 上海全成通信技术有限公司 |
发明人 | 冯谧 |
代理机构 | 上海科盛知识产权代理有限公司 | 代理人 | 赵志远 |
摘要
本发明提供了一种海量数据管理方法,该方法将一个数据库大表分成多个分区,每个分区相当于一个数据库小表,按日期划分分区,数据插入按分区顺序进行并在分区号范围内循环更新;另外建立五个数据库表空间,以进一步提高数据库并行插入和查询效率。采用本发明的方法能够避免由于数据量大而降低整个应用系统性能,进而降低整个软件系统运行平台的费用,提高其运行效率。
1、一种海量数据管理方法,其特征在于,包括以下步骤:
A、把一个数据库大表分成多个分区,每个分区相当于一个数据库小表, 按日期划分分区,数据插入按分区顺序进行并在分区号范围内循环更新;
B、建立五个数据库表空间,一个分区使用一个表空间,相隔五个号的分 区使用相同的表空间,即第6个分区使用和第1个分区相同的表空间,其他类 推;
C、建立好数据库表空间后,每隔15分钟,从短信网关通过FTP协议,取 CDR文件到本地指定目录,取得数据库的连接,设置数据库的自动提交模式为 False,保证不是每条记录都自动提交,以降低和数据库交互的开销,提高插入 速度;
D、读入一条CDR记录,检查记录是否合法,检查各字段是否正确;
E、字段校验通过后,根据CDR的申请时间计算数据要插入的分区号,把 该条记录加入批处理命令中,如果已有1000条批命令未处理,或已到达文件 的结尾,则执行批处理,将批记录提交到数据库,插入的记录自动根据每条记 录的分区号,插入到数据库的不同分区中;
F、如果未达到1000条的批命令,则继续处理下一条记录直到该文件处理 完毕;
G、按同样的方法处理下一个文件,直到处理完目录下的全部文件。
2、根据权利要求1所述的一种海量数据管理方法,其特征在于:步骤A 中所述的分区为91个,用于保存连续90天的数据,每天的数据依序插入各个 分区,当90天的数据分别插入90个分区后,第91天的数据插入第91个分区, 然后删除第1个分区的数据,实现始终保存最近90天的数据。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2010-10-12 | 2010-10-12 | | |
2 | | 2008-03-18 | 2008-03-18 | | |
3 | | 2013-06-24 | 2013-06-24 | | |
4 | | 2010-12-29 | 2010-12-29 | | |
5 | | 2010-12-29 | 2010-12-29 | | |
6 | | 2015-04-13 | 2015-04-13 | | |
7 | | 2009-02-25 | 2009-02-25 | | |
8 | | 2008-05-15 | 2008-05-15 | | |
9 | | 2010-10-12 | 2010-10-12 | | |
10 | | 2012-09-29 | 2012-09-29 | | |
11 | | 2012-12-26 | 2012-12-26 | | |
12 | | 2008-12-04 | 2008-12-04 | | |
13 | | 2010-03-24 | 2010-03-24 | | |
14 | | 2015-07-22 | 2015-07-22 | | |
15 | | 2008-06-30 | 2008-06-30 | | |
16 | | 2014-01-24 | 2014-01-24 | | |