加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于BBLC模型的旅游命名实体识别方法

发明专利有效专利
  • 申请号:
    CN202010059415.1
  • IPC分类号:G06F40/295;G06N3/04
  • 申请日期:
    2020-01-19
  • 申请人:
    陕西师范大学
著录项信息
专利名称一种基于BBLC模型的旅游命名实体识别方法
申请号CN202010059415.1申请日期2020-01-19
法律状态实质审查申报国家中国
公开/公告日2020-06-19公开/公告号CN111310471A
优先权暂无优先权号暂无
主分类号G06F40/295IPC分类号G;0;6;F;4;0;/;2;9;5;;;G;0;6;N;3;/;0;4查看分类表>
申请人陕西师范大学申请人地址
陕西省西安市长安区西长安街620号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人陕西师范大学当前权利人陕西师范大学
发明人薛乐义;曹菡;李鹏
代理机构北京慕达星云知识产权代理事务所(特殊普通合伙)代理人符继超
摘要
本发明公开的一种基于BBLC模型的旅游命名实体识别方法,包括对语料库中的语句进行BIO标注,获得BIO标注集;BIO标注集输入至BERT预训练语言模型,输出语句中每个字的向量表示,即每个语句中的字嵌入序列;步骤三、将字嵌入序列作为双向LSTM各个时间步的输入,进行进一步语义编码,获得语句特征矩阵;将语句特征矩阵作为CRF模型的输入,对语句x进行标注解码,得到语句x的字标签序列,输出语句x的标签等于y的概率值,使用动态规划的Viterbi算法来求解最优路径,输出概率最大标签序列。本发明通过添加BERT预训练语言模型可以获得局部上下文信息,准确率、召回率和F值更高,泛化能力和鲁棒性更强,有助于弥补传统模型的不足。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供