加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于音频辨识的扩展的视频镜头媒体引擎

发明专利无效专利
  • 申请号:
    CN201210206001.2
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-06-14
  • 申请人:
    索尼公司
著录项信息
专利名称用于音频辨识的扩展的视频镜头媒体引擎
申请号CN201210206001.2申请日期2012-06-14
法律状态撤回申报国家中国
公开/公告日2013-02-06公开/公告号CN102915320A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人索尼公司申请人地址
日本东京都 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人索尼公司当前权利人索尼公司
发明人普里彦·甘塔堤雷克;董·恩古因;阿布希舍克·帕提尔;迪鹏杜·萨哈
代理机构北京东方亿思知识产权代理有限责任公司代理人宋鹤
摘要
本发明公开了用于音频辨识的扩展的视频镜头媒体引擎。用于自动分析多媒体数据的系统、方法和计算机程序产品被公开。实施例接收多媒体数据;检测具有指定的音频特征的部分;并且输出多媒体数据的相应子集和生成的元数据。包括下载的或流传输的电影中的语音、非语音的声音和隐藏字幕在内的音频内容特征像人们可能做的那样被识别,然而实质上是实时的。特定说话者、最有意义的内容声音以及字词和相应的时间戳经由数据库比较被辨识,并且可按照匹配概率的次序被呈现。实施例响应性地预先取得相关数据、辨识地点并且提供相关广告。内容特征也可被发送给搜索引擎从而进一步的相关内容可被识别。用户反馈和确认可随时间过去而改进实施例。

专利服务由北京酷爱智慧知识产权代理公司提供