加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种从Web网页中获取汉语简称的方法

发明专利无效专利
  • 申请号:
    CN201110253121.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-08-31
  • 申请人:
    镇江诺尼基智能技术有限公司
著录项信息
专利名称一种从Web网页中获取汉语简称的方法
申请号CN201110253121.3申请日期2011-08-31
法律状态撤回申报国家中国
公开/公告日2013-03-06公开/公告号CN102955819A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人镇江诺尼基智能技术有限公司申请人地址
江苏省镇江市丁卯经十二路468号双子研发楼北楼18楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人镇江诺尼基智能技术有限公司当前权利人镇江诺尼基智能技术有限公司
发明人王石;丁远钧;符建辉;王卫民
代理机构南京知识律师事务所代理人汪旭东
摘要
本发明涉及一种从Web网页中获取汉语简称的方法,包括输入已知全称,选择查询模式来构造查询项,提交查询项到Google中获取锚文本,再从锚文本中获取全简称语料,最后利用提取算法提取候选简称,并利用优先级综合函数对候选简称进行排序;其中涉及的查询模式有三种,对应的提取简称的提取算法有两种。本发明还定义了全简称关系的约束,包括一组约束公理和一组约束函数,其中约束公理定性地表示全称和简称之间的约束,约束函数集定量地表示了全称和简称之间的约束,并基于全简称约束提出了一种全简称的分类方法。本发明还定义了全简称关系图,提出了一种基于全简称关系图和全简称关系约束的联合验证方法。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供