1、一种按投递地址段自动制作商函的方法,其特征在于该方法包括如下步骤:
a.由商函工作站(5)采集待投递商函用户的原始名称和地址;
b.所述商函工作站(5)把所述待投递商函用户的原始名称和地址送入名址匹配引 擎(1);
c.由所述名址匹配引擎(1)先对用户的原始名称和地址的字符编码进行标准化;
d.所述名址匹配引擎(1)调用由系统预置的地名数据库(2)的地名数据,利用该 地名数据库(2)的地名数据对标准化了的用户地址进行分词处理,然后进行地址层次分 析和投递段分析,最后获得按商函投递段顺序排列的用户地址;
e.所述名址匹配引擎(1)把所述按商函投递段顺序排列的用户地址输出到商函打 印机(3);
f.所述商函打印机(3)按照商函投递段有顺分类打印制作商函从而实现商函的自动 分拣。
2、根据权利要求1所述的按投递地址段自动制作商函的方法,其特征在于:所述步 骤c中对用户的原始名称和地址的字符编码进行标准化包括如下步骤:
a.把商函用户的原始名称和地址所包含的字符串中的小写字符转换为大写字符;
b.把商函用户的原始名称和地址所包含的字符串中的全角字符转换为半角字符;
c.把商函用户的原始名称和地址所包含的字符串中的中文数字转换为阿拉伯数字。
3、根据权利要求1所述的按投递地址段自动制作商函的方法,其特征在于:所述系 统预置的地名数据库(2)存放的数据包括:地址树的树状结构的地址节点以及该地址节 点对应的站段规则。
4、根据权利要求3所述的按投递地址段自动制作商函的方法,其特征在于:所述地 址树是由地市的地名层次节点所形成的一个树状结构;
所述地名树上一层次节点包含下一节点的地址范围,末节点建立在能够区分不同投 递段的地址范围上,不完全建立在具体的门牌上,所述地名树详细收集和描述了一个地 市辖区内的所有地名及主要组织机构名称的信息;
地名树的数据结构中包括以下字段:
1)节点编号,字段名为LNo,字段类型为Numeric,字长为8个字节;
2)父节点编号,字段名为PNo,字段类型为Numeric,字长为8个字节;
3)节点名称,字段名为MS,字段类型为VARCHAR2,字长为40个字节;
4)是否是别名,字段名为BZ,字段类型为Numeric,字长为1个字节;
5)地名类型,字段名为NTYPE,字段类型为Numeric,字长为2个字节;
6)不包括别名的节点孩子数,字段名为NCHILDREN,字段类型为Numeric,字长 为6个字节;
7)地址字节长度,字段名为NLEN,字段类型为Numeric,字长为2个字节;
8)使用次数,字段名为NREPEAT,字段类型为Numeric,字长为2个字节;
9)节点级别,字段名为NLEVEL,字段类型为Numeric,字长为2个字节;
10)是否关键词,字段名为IS KEY,字段类型为Numeric,字长为1个字节。
5、根据权利要求3所述的按投递地址段自动制作商函的方法,其特征在于:所述地 址树的地址节点对应的站段规则包括,站段编码以及该站段编码指明某个地址节点由那 些投递段投递;
该站段规则的数据结构包括如下字段:
1)序列号,字段名为TDNO,字段类型为Numeric,字长为12个字节;
2)节点编号,字段名为LNO,字段类型为Numeric,字长为8个字节;
3)投递段号,字段名为SNO,字段类型为Numeric,字长为8个字节;
4)投递规则,字段名为MS,字段类型为Numeric,字长为40个字节;
5)门牌起始编号,字段名为BEGINNO,字段类型为Numeric,字长为6个字节;
6)门牌结束编号,字段名为ENDNO,字段类型为Numeric,字长为6个字节;
7)投递顺序号,字段名为ord,字段类型为Numeric,字长为6个字节。
6、根据权利要求1所述的按投递地址段自动制作商函的方法,其特征在于:所述分 词处理实现以下功能,名址匹配引擎(1)用正向最大匹配的方法将待分析的地址汉字字 符串与所述地名库(2)中的某个词条进行匹配,若在所述地名库(2)中找到该待分析 的地址汉字字符串,则匹配成功,或称识别出一个地名;
分词处理的工作流程如下:
a.字符编码进行标准化的名称和地址字符输入分词处理模块(12),该模块中的当 前位置指针置0,并计算当前地址长度;
b.判断当前位置指针是否不大于输入地址的长度与最小关键词长的差;
c.如果步骤b判断为“是”,则分词处理完毕;
d.如果步骤b判断为“否”,则对输入的地址按词长由大至小的顺序,到所述按 照关键词的词长构建的哈希表中,按照词长由大到小查找关键词;
e.步骤d没有找到关键词,则当前位置指针增加1,然后进行步骤b的流程;
f.如果步骤d找到了关键词,则当前位置指针加上关键词的词长作为位置指针,然 后进行步骤b的流程。
7、根据权利要求6所述的按投递地址段自动制作商函的方法,其特征在于:所述分 词处理的字符串结果还要被名址匹配引擎(1)整理,地址别名将被标准化。
8、根据权利要求1所述的按投递地址段自动制作商函的方法,其特征在于:所述的 地址层次分析实现以下功能,计算机根据地名树对用户地址进行语义分析、定位地名, 即从众多候选词中选出唯一正确识别到段的地址节点;所述的地址层次分析工作流程如 下:
a.进行了分词处理的用户地址输入地址层次分析模块(13),其分词结果为地址包 含的关键词列表,该模块(13)对关键词进行判断,是否为最后一个关键词;
b.如果a步骤判断为“是”,则输出路径及站段匹配的最优节点;
c.如果a步骤判断为“否”,则计算该关键词所有上级节点在地址中出现的次数, 判断出现的次数是否最大;
d.如果c步骤判断为“是”,则记录该最大值,并且计算该节点站段匹配次数, 设此值为最大值;
e.找到下一个关键词,并再执行a步骤;
f.如果c步骤判断为“否”,则判断c步骤中该关键词所有上级节点在地址中出现 的次数与最大的次数相比是否相等;
g.如果f步骤判断为“是”,则计算该关键词站段匹配次数,并判断该站段匹配次 数是否最大;
h.如果g步骤判断为“是”,则该节点站段匹配次数设为最大值,再执行步骤e;
i.如果g步骤或f步骤判断为“否”,则执行步骤e。
9、根据权利要求1所述的按投递地址段自动制作商函的方法,其特征在于:所述投 递段分析是指,地址层次分析模块(13)对不同投递段的用户名称和地址分别配置到相 应的地址段。
10、一种按投递地址段自动制作商函的的系统,包括:
商函工作站(5),该商函工作站(5)设置在各商函局或邮政支局,用于采集待投递 商函用户的原始名称和地址信息;
地名数据库(2),用于按系统规定的数据格式存储城市地名及商函投递段的数据信 息,供系统的其他模块调用;
商函打印机(3),用于按照商函投递段有顺分类打印制作商函;
其特征在于:还包括名址匹配引擎(1),用于接收所述商函工作站(5)输出的待投 递商函用户的原始名称和地址信息,并对该商函用户的原始名称和地址信息进行标准化 处理、分词处理,地址层次分析和投递段分析;
所述名址匹配引擎(1)的输入端通过数据线连接所述商函工作站(5)和地名数据 库(2),其输出端通过数据线连接所述商函打印机(3)。
11、根据权利要求10所述的按投递地址段自动制作商函的,其特征在于:所述名址 匹配引擎(1)包括:顺序单向连接的字符串输入接口(10)、标准化模块(11)、分词处 理模块(12)、地址层次分析模块(13)和字符串输出接口(14);用户的原始名称和地 址由字符串输入接口(10)输入,所述字符串输出接口(14)连接所述商函打印机(3)。
12、根据权利要求10所述按投递地址段自动制作商函的系统,其特征在于:所述名 址匹配引擎(1)为与所述商函工作站(5)、地名数据库(2)和商函打印机(3)连成网 络的电子计算机。
13、根据权利要求10所述按投递地址段自动制作商函的系统,其特征在于:所述地 名数据库(2)存储有地名树及与地名树相关的投递段信息库,所述地名数据库(2)的 数据信息可以进行更新。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2011-10-12 | 2011-10-12 | | |
2 | | 2012-11-30 | 2012-11-30 | | |
3 | | 2010-06-24 | 2010-06-24 | | |
4 | | 2015-10-14 | 2015-10-14 | | |
5 | | 2011-09-26 | 2011-09-26 | | |
6 | | 2010-06-24 | 2010-06-24 | | |