加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于强表示深度哈希的跨模态检索模型

发明专利有效专利
  • 申请号:
    CN202110922490.0
  • IPC分类号:G06F16/583;G06F16/38;G06K9/62;G06N3/08
  • 申请日期:
    2021-08-12
  • 申请人:
    中国石油大学(华东)
著录项信息
专利名称一种基于强表示深度哈希的跨模态检索模型
申请号CN202110922490.0申请日期2021-08-12
法律状态公开申报国家中国
公开/公告日2021-11-12公开/公告号CN113641846A
优先权暂无优先权号暂无
主分类号G06F16/583IPC分类号G;0;6;F;1;6;/;5;8;3;;;G;0;6;F;1;6;/;3;8;;;G;0;6;K;9;/;6;2;;;G;0;6;N;3;/;0;8查看分类表>
申请人中国石油大学(华东)申请人地址
山东省青岛市黄岛区长江西路66号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国石油大学(华东)当前权利人中国石油大学(华东)
发明人段友祥;陈宁;孙歧峰
代理机构暂无代理人暂无
摘要
本发明提出了一种基于强表示深度哈希的跨模态检索模型,包括图像编码器f和文本编码器g,每个编码器又包括特征提取部分和哈希码学习部分。图像编码器f,主要用于将输入的图像转换为汉明空间中的哈希码;文本编码器g,主要用于将输入的文本转换为汉明空间中的哈希码。特征提取部分,负责将输入图像转换为强表示的特征矩阵(或者向量)。哈希码学习部分,负责将经过特征提取部分得到的特征,经过多层网络层映射为哈希码。大多数跨模态哈希方法,对特征提取部分不够重视,往往获得特征的弱表示。尤其是对于文本模态,单词间的顺序很重要,而这些方法缺大多仅仅使用全连接层进行特征提取,使用bag‑of‑words(BOW)进行文本词向量的表示,仅考虑独立的单词,忽略了单词之间的顺序关系,因此得到了离散且稀疏的文本弱表示。本发明所提出的深度哈希跨模态检索模型,认为数据的特征提取部分很重要,其对生成哈希码的有效性起到了关键的作用,通过该模型处理的数据可以获得特征的强表示,进而生成更加有效且更具有区分性的哈希码,进一步提高了模型的性能。

专利服务由北京酷爱智慧知识产权代理公司提供