加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种切分索引分词的方法及系统

发明专利有效专利
  • 申请号:
    CN200710123051.3
  • IPC分类号:G06F17/27;G06F17/30
  • 申请日期:
    2007-06-22
  • 申请人:
    腾讯科技(深圳)有限公司
著录项信息
专利名称一种切分索引分词的方法及系统
申请号CN200710123051.3申请日期2007-06-22
法律状态暂无申报国家中国
公开/公告日2007-11-14公开/公告号CN101071420
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;3;0查看分类表>
申请人腾讯科技(深圳)有限公司申请人地址
广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人腾讯科技(深圳)有限公司,深圳市腾讯计算机系统有限公司当前权利人腾讯科技(深圳)有限公司,深圳市腾讯计算机系统有限公司
发明人王启明
代理机构北京集佳知识产权代理有限公司代理人逯长明
摘要
本发明公开了一种切分索引分词的方法,包括以下步骤:读取字符流;识别所述字符流,确定汉字、英文字符或数字以及不可识别字符;将已经确定的汉字、英文字符或数字与预先建立的词典树比较,确定匹配的分词;将英文字符或数字进行ASCII码通用模糊匹配,确定英文字符串或者数字串的分词;将上述匹配的分词和所述英文字符串或者数字串的分词以及不可识别字符,按所述字符流顺序进行排序;按所述排序后的分词和所述英文字符串或者数字串排序的顺序划分所述字符流。本发明还公开切分索引分词的系统。本发明提供一种切分索引分词的方法及系统,能够同时解决分词准确、一定量的冗余词以及单字分词的问题,增强用户体验。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供