加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于预训练模型的招投标数据命名实体识别方法

发明专利有效专利
  • 申请号:
    CN202110816996.3
  • IPC分类号:G06F40/295;G06F40/30;G06F40/126;G06Q30/08
  • 申请日期:
    2021-07-20
  • 申请人:
    湖南达德曼宁信息技术有限公司
著录项信息
专利名称一种基于预训练模型的招投标数据命名实体识别方法
申请号CN202110816996.3申请日期2021-07-20
法律状态授权申报国家中国
公开/公告日2021-08-20公开/公告号CN113283244A
优先权暂无优先权号暂无
主分类号G06F40/295IPC分类号G;0;6;F;4;0;/;2;9;5;;;G;0;6;F;4;0;/;3;0;;;G;0;6;F;4;0;/;1;2;6;;;G;0;6;Q;3;0;/;0;8查看分类表>
申请人湖南达德曼宁信息技术有限公司申请人地址
湖南省长沙市雨花区金海路128号领智工业园A2栋502号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人湖南达德曼宁信息技术有限公司当前权利人湖南达德曼宁信息技术有限公司
发明人刘洋
代理机构长沙惟盛赟鼎知识产权代理事务所(普通合伙)代理人滕澧阳
摘要
本发明涉及一种基于预训练模型的招投标数据命名实体识别方法,具体包括如下步骤:S1:获取开源预训练模型;S2:获取无标注语料,进行数据预处理;S3:训练S1中的预训练模型;S4:使用标注数据有监督训练,得到基准模型M;S5:使基准模型M对无标注数据进行预测得到伪标签数据;S6:将伪标签数据加入训练集,将真实标签数据也加入到训练集中共同训练得到模型M';S7:构建片段解码网络;S8:将文本输入模型M'进行编码;S9:将文本编码输入片段解码网络;S10:提取实体片段及其类别。本发明在预训练模型之后以片段识别方式进行模型解码预测实体的开头和结尾位置,可以加快解码速度并获得较好精度的实体结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供