加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于导航信息检索的中文分词方法

发明专利有效专利
  • 申请号:
    CN201310731944.1
  • IPC分类号:G06F17/30
  • 申请日期:
    2013-12-25
  • 申请人:
    沈阳美行科技有限公司
著录项信息
专利名称一种基于导航信息检索的中文分词方法
申请号CN201310731944.1申请日期2013-12-25
法律状态授权申报国家中国
公开/公告日2014-03-26公开/公告号CN103678684A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人沈阳美行科技有限公司申请人地址
辽宁省沈阳市浑南新区远航西路3号1T国际202室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人沈阳美行科技有限公司当前权利人沈阳美行科技有限公司
发明人李潍希;于航;解威;朱小莹
代理机构沈阳晨创科技专利代理有限责任公司代理人任玉龙
摘要
一种基于导航信息检索的中文分词方法,其特征在于:分词系统的实现步骤:加载词典,文本编码转换;断句处理,把源字符串分隔成多个稍微简单一点的短句;原子分词,是指该短句中不可分割的最小语素单位;逐词遍历匹配法实现成词全匹配;筛选匹配结果生成若干最佳结果;人名、地名和专有名词处理;修正词典,主要通过对未登录词的新词添加和对已有词的属性改善;最终合并各个短句处理的结果,输出。本发明的优点:通过中文分词技术可以把用户输入的内容做成词处理,可以优化速度,并且以词为基础可以进行错别字矫正,可以提供更符合的结果。中文分词技术可以提高信息检索引擎对语义的理解,充分对提供的结果集进行较好的调整。

专利服务由北京酷爱智慧知识产权代理公司提供