加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

使用端到端模型的讲话者分割

发明专利有效专利
  • 申请号:
    CN201980033104.3
  • IPC分类号:G10L17/04;G10L17/18
  • 申请日期:
    2019-04-15
  • 申请人:
    谷歌有限责任公司
著录项信息
专利名称使用端到端模型的讲话者分割
申请号CN201980033104.3申请日期2019-04-15
法律状态实质审查申报国家中国
公开/公告日2021-05-14公开/公告号CN112805780A
优先权暂无优先权号暂无
主分类号G10L17/04IPC分类号G;1;0;L;1;7;/;0;4;;;G;1;0;L;1;7;/;1;8查看分类表>
申请人谷歌有限责任公司申请人地址
美国加利福尼亚州 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人谷歌有限责任公司当前权利人谷歌有限责任公司
发明人王泉;亚什·舍斯;伊格纳西奥·洛佩斯·莫雷诺;利·万
代理机构中原信达知识产权代理有限责任公司代理人李佳;邓聪惠
摘要
描述了用于训练和/或利用端到端讲话者分割模型的技术。在各种实施方式中,该模型是递归神经网络(RNN)模型,诸如包括至少一个诸如长短期记忆(LSTM)层的记忆层的RNN模型。音频数据的音频特征可以作为输入应用于根据本文公开的实施方式训练的端到端讲话者分割模型,并且该模型被利用以处理音频特征以通过模型生成讲话者分割结果作为直接输出。此外,端到端讲话者分割模型可以是序列到序列模型,其中序列可以具有可变长度。因此,该模型可以被利用以为各种长度的音频分段中的任何一个生成讲话者分割结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供