加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文本的实体识别方法、设备及存储介质

发明专利有效专利
  • 申请号:
    CN201911013316.3
  • IPC分类号:G06F40/295;G06F40/242;G06F16/35
  • 申请日期:
    2019-10-23
  • 申请人:
    北京字节跳动网络技术有限公司
著录项信息
专利名称文本的实体识别方法、设备及存储介质
申请号CN201911013316.3申请日期2019-10-23
法律状态实质审查申报国家中国
公开/公告日2020-01-31公开/公告号CN110738055A
优先权暂无优先权号暂无
主分类号G06F40/295IPC分类号G;0;6;F;4;0;/;2;9;5;;;G;0;6;F;4;0;/;2;4;2;;;G;0;6;F;1;6;/;3;5查看分类表>
申请人北京字节跳动网络技术有限公司申请人地址
北京市石景山区实兴大街30号院3号楼2层B-0035房间 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京字节跳动网络技术有限公司当前权利人北京字节跳动网络技术有限公司
发明人邸凡祎
代理机构上海光栅知识产权代理有限公司代理人马雯雯
摘要
本公开实施例提供一种文本的实体识别方法、设备及存储介质,通过获取待处理文本;识别待处理文本中的机构实体全称,根据预设的目标机构实体后缀词典识别机构实体全称中的目标机构实体全称,得到第一类目标机构实体;根据预设的目标机构实体简称词典识别待处理文本中的目标机构实体简称,得到第二类目标机构实体;根据预先训练的识别模型对待处理文本中进行实体识别,得到第三类目标机构实体;将各类目标机构实体合并,作为待处理文本中包含的目标机构实体进行输出。本公开实施例通过对待处理文本进行多个层面的实体识别,能识别待处理文本中目标机构实体全称和目标机构实体简称,提高目标机构实体识别的准确率和召回率,节约人力成本和时间成本。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供