加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种视频密集描述方法、装置及介质

发明专利有效专利
  • 申请号:
    CN202110489246.X
  • IPC分类号:G06V20/40;G06V10/774;G06V10/80;G06N3/04
  • 申请日期:
    2021-05-06
  • 申请人:
    华南理工大学;广东微步智能科技有限公司
著录项信息
专利名称一种视频密集描述方法、装置及介质
申请号CN202110489246.X申请日期2021-05-06
法律状态授权申报国家暂无
公开/公告日2021-08-27公开/公告号CN113312980A
优先权暂无优先权号暂无
主分类号G06V20/40IPC分类号G;0;6;V;2;0;/;4;0;;;G;0;6;V;1;0;/;7;7;4;;;G;0;6;V;1;0;/;8;0;;;G;0;6;N;3;/;0;4查看分类表>
申请人华南理工大学;广东微步智能科技有限公司申请人地址
广东省广州市天河区五山路381号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人华南理工大学,广东微步智能科技有限公司当前权利人华南理工大学,广东微步智能科技有限公司
发明人肖焕侯;史景伦;胡晨晨;熊静远;沈卫强
代理机构广州嘉权专利商标事务所有限公司代理人黎扬鹏
摘要
本发明公开了一种视频密集描述方法、装置及介质,其中方法包括采用C3D网络对输入视频进行特征提取;根据视频特征和双向SST算法对事件定位模块进行训练;结合事件定位模块、特征损失和基于注意力模型的事件描述模块进行训练,获得密集描述系统;将待处理视频输入密集描述系统进行预测,经过联合排序后,将排序靠前的事件候选框及其对应的描述句子提取出来作为最终的密集描述结果。本发明采用能同时利用过去信息和未来信息的双向SST算法来获得视频的事件候选框;使用基于注意力机制的分层LSTM模型来获得描述句子;使用联合排序的方法来综合定位模块和描述模块的置信度,提高系统整体的密集描述质量,可广泛应用于计算机视觉领域。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供