加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于中文文本处理系统的中文分词方法

发明专利有效专利
  • 申请号:
    CN02127005.8
  • IPC分类号:G06F17/21
  • 申请日期:
    2002-07-25
  • 申请人:
    摩托罗拉公司
著录项信息
专利名称用于中文文本处理系统的中文分词方法
申请号CN02127005.8申请日期2002-07-25
法律状态暂无申报国家中国
公开/公告日2004-01-28公开/公告号CN1471024
优先权暂无优先权号暂无
主分类号G06F17/21IPC分类号G;0;6;F;1;7;/;2;1查看分类表>
申请人摩托罗拉公司申请人地址
美国马萨诸塞州 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人赛伦斯运营公司当前权利人赛伦斯运营公司
发明人陈桂林;陈芳
代理机构北京纪凯知识产权代理有限公司代理人沙捷
摘要
一种用于中文文本处理系统的中文分词方法,包括取得输入汉字串的前两个汉字;在词库中检索出与前两个汉字的起始汉字相关的索引节点;取得该索引节点中的指针,该指针指向该词库中相应的词汇集合;在词汇集合中进行近似二分查找,如果找到该两个汉字词汇,则保存该词汇的索引,否则,保存与该两个汉字最接近的词汇的索引;对于输入汉字串,在该词汇集合中执行邻近匹配,以获得具有最大长度的匹配词汇,并把该匹配的词汇作为当前分词的结果。对于上述分词结果,本发明还进行切分歧义消解、识别中文人名、归并数词、量词和叠词、识别翻译人名、归并单字以及归并前后缀和识别地名。本发明在分词准确率和响应时间方面得到了重大改进。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供