加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于多类型病历文本的结构化信息提取方法

发明专利有效专利
  • 申请号:
    CN202110548210.4
  • IPC分类号:G06F40/284;G06F40/295;G06N3/04;G16H10/60
  • 申请日期:
    2021-05-19
  • 申请人:
    大连东软教育科技集团有限公司
著录项信息
专利名称一种基于多类型病历文本的结构化信息提取方法
申请号CN202110548210.4申请日期2021-05-19
法律状态实质审查申报国家中国
公开/公告日2021-09-03公开/公告号CN113343680A
优先权暂无优先权号暂无
主分类号G06F40/284IPC分类号G;0;6;F;4;0;/;2;8;4;;;G;0;6;F;4;0;/;2;9;5;;;G;0;6;N;3;/;0;4;;;G;1;6;H;1;0;/;6;0查看分类表>
申请人大连东软教育科技集团有限公司申请人地址
辽宁省大连市甘井子区软件园路8-9号206室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人大连东软教育科技集团有限公司当前权利人大连东软教育科技集团有限公司
发明人彭苏婷;温涛;于丹
代理机构大连东方专利代理有限责任公司代理人姜玉蓉;李洪福
摘要
本发明公开了一种基于多类型病历文本的结构化信息提取方法,包括:S1:确定病历类型,将获得的文本数据进行预处理以去除冗余信息后,通过文本相似度匹配的方法,判断病历的类型;S2:结构化信息提取,从医疗数据库中获取特定病历类型需要提取的属性列表,根据属性列表设置实体类别,并对文本数据中的实体进行标注构建命名实体识别数据集,通过算法进行训练以获得可能有用的实体,最后设定规则提取实体或其对应的值。S3:审核保存,将提取结果交由医生进行审核。本发明可以将传统的半结构化病历转换成结构化信息,提取并存储其中的重要信息,会更加便于医生快速浏览、阅读和查找病历,同时也便于后续的数据挖掘和深度利用。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供