加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

中文分词系统

发明专利有效专利
  • 申请号:
    CN201910410686.4
  • IPC分类号:G06F17/27
  • 申请日期:
    2019-05-17
  • 申请人:
    交通银行股份有限公司太平洋信用卡中心
著录项信息
专利名称中文分词系统
申请号CN201910410686.4申请日期2019-05-17
法律状态实质审查申报国家中国
公开/公告日2019-09-20公开/公告号CN110263325A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人交通银行股份有限公司太平洋信用卡中心申请人地址
上海市浦东新区松涛路80号1、2幢 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人交通银行股份有限公司太平洋信用卡中心当前权利人交通银行股份有限公司太平洋信用卡中心
发明人王志伟
代理机构上海浦一知识产权代理有限公司代理人王江富
摘要
本发明公开了一种中文分词系统,其包括字向量提取模块、字向量分类模块及模型输出模块;字向量提取模块用于提取中文句子的字特征得到中文句子的字向量,字特征维度包括四种词位置分类,分别为:词的首字B、词的中间字M、词的尾字E、单字成词S;字向量分类模块,用于根据中文句子的字向量,得到每个字向量的各种词位置分类的概率;模型输出模块,用于对中文句子的每个字向量的各种词位置分类的概率根据上下文信息进行修订,得到中文句子的目标字向量模型,中文句子的目标字向量模型的维度为(m,4),m为中文句子的字数,每个字对应4个浮点值,分别表示对应四种词位置分类BMES的概率。本发明的中文分词系统,能降低中文分词的人工特征工程量,并能够捕捉更远上下文的语义,提高分词的准确率。

专利服务由北京酷爱智慧知识产权代理公司提供