加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于张量表示的多模态视频语义概念检测方法

发明专利无效专利
  • 申请号:
    CN200810059125.6
  • IPC分类号:G06K9/62;G06K9/00
  • 申请日期:
    2008-01-14
  • 申请人:
    浙江大学
著录项信息
专利名称基于张量表示的多模态视频语义概念检测方法
申请号CN200810059125.6申请日期2008-01-14
法律状态权利终止申报国家中国
公开/公告日2008-11-05公开/公告号CN101299241
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2;;;G;0;6;K;9;/;0;0查看分类表>
申请人浙江大学申请人地址
浙江省杭州市浙大路38号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浙江大学当前权利人浙江大学
发明人吴飞;庄越挺;刘亚楠;郭同强
代理机构杭州求是专利事务所有限公司代理人张法高
摘要
本发明公开了一种基于张量表示的多模态视频语义概念检测方法。包括如下步骤:1)对训练集合及测试集合中的视频镜头均提取图像、音频、文本三种模态的底层特征,每个视频张量镜头由这三种底层特征形成3阶张量来表达;2)根据视频张量镜头集合的流形空间本征结构,通过寻找转换矩阵实现对原始高维张量的维度降低及子空间嵌入;3)采用支持张量机对降维后的视频张量镜头集合建立分类器模型;4)对于测试镜头,由训练集合计算得到的转换矩阵进行投影后,再通过分类器模型进行语义概念检测。本发明充分利用视频中的多模态数据,将视频镜头表示为3阶张量,并基于此种表达提出了一种子空间嵌入的降维方法,实现了视频镜头的语义概念检测,对视频语义进行了较好的分析与理解。

专利服务由北京酷爱智慧知识产权代理公司提供