加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种语音数据处理方法以及装置

发明专利有效专利
  • 申请号:
    CN202010135093.4
  • IPC分类号:G10L21/028;G10L21/0208;G10L25/57;G10L15/25;G10L15/18
  • 申请日期:
    2020-03-02
  • 申请人:
    阿里巴巴集团控股有限公司
著录项信息
专利名称一种语音数据处理方法以及装置
申请号CN202010135093.4申请日期2020-03-02
法律状态实质审查申报国家中国
公开/公告日2021-09-07公开/公告号CN113362849A
优先权暂无优先权号暂无
主分类号G10L21/028IPC分类号G;1;0;L;2;1;/;0;2;8;;;G;1;0;L;2;1;/;0;2;0;8;;;G;1;0;L;2;5;/;5;7;;;G;1;0;L;1;5;/;2;5;;;G;1;0;L;1;5;/;1;8查看分类表>
申请人阿里巴巴集团控股有限公司申请人地址
英属开曼群岛大开曼资本大厦一座四层847号邮箱 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人阿里巴巴集团控股有限公司当前权利人阿里巴巴集团控股有限公司
发明人吴纲律;王加芳;王全占;古鉴;李名杨
代理机构北京清源汇知识产权代理事务所(特殊普通合伙)代理人冯德魁;窦晓慧
摘要
本申请公开了一种音频数据处理方法以及装置,该方法包括:获得原始视频数据对应的原始音频数据;获得原始视频数据中的音频相关运动特征数据,音频相关运动特征数据指的是与原始视频数据对应的发声事件相关联的运动状态数据;根据音频相关运动特征数据,从原始音频数据中分析获得目标音频数据;按照预定的音频加工方式,对目标音频数据进行加工。通过使用本方法,可利用原始视频数据中的音频相关运动特征数据,从当前场景中的原始音频数据中获得对应的目标音频数据,并结合具体场景对该目标音频数据进行数据增强或数据抑制处理,该方法将图像数据应用到语音分离的场景中,使得语音分离的过程更加高效准确。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供