著录项信息
专利名称 | 一种视频电话中同步显示字幕的方法 |
申请号 | CN200810056994.3 | 申请日期 | 2008-01-28 |
法律状态 | 撤回 | 申报国家 | 中国 |
公开/公告日 | 2009-08-05 | 公开/公告号 | CN101500127 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N7/14 | IPC分类号 | H;0;4;N;7;/;1;4;;;H;0;4;N;5;/;2;7;8;;;G;1;0;L;1;5;/;0;0查看分类表>
|
申请人 | 德信智能手机技术(北京)有限公司 | 申请人地址 | 北京市朝阳区酒仙桥北路甲10号D区2楼4-6层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 德信智能手机技术(北京)有限公司 | 当前权利人 | 德信智能手机技术(北京)有限公司 |
发明人 | 郭晓丹 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明涉及一种在视频电话中同步显示字幕的方法。本发明主要由语音识别模块、字幕处理模块和图像合成模块来实现。在视频电话通话过程中,应用语音识别技术生成字幕,然后根据用户预设的字幕显示规则,将字幕叠加到本端图像中,经处理后传送给远端用户。在视频电话中增加字幕显示是对视频通话的重要补充,能够提高通话质量并改善交流效果。另外,使用本发明生成的字幕可直接显示在支持视频电话功能的手机上,而不需增加软件程序或硬件设备,方便实用。
1.一种视频电话中同步显示字幕的方法,其特征在于:使用语音识别模块(1)、 字幕处理模块(2)和图像合成模块(3),在视频电话通话过程中,首先应用 语音识别技术生成字幕,再根据用户预设的字幕显示规则,将字幕叠加到 本端图像中,经处理后传送给远端用户。
2.如权利要求1所述的语音识别模块(1),其特征在于将口述语言逐字转换为 相应文字,产生字幕,并存储到字幕处理模块(2)。
3.如权利要求1所述的语音识别模块(1),其特征在于可以根据情况,选择使 用软件或硬件识别技术。
4.如权利要求1所述的字幕处理模块(2),其特征在于根据预置的显示方式, 将一定数量的字幕传递到图像合成模块(3)。
5.如权利要求1所述的图像合成模块(3),其特征在于按照字幕设置信息的要 求,将收到的字幕与背景视频进行叠加,生成带字幕的视频数据流。
6.如权利要求5所述的字幕设置信息,其特征在于包括文字字体、行数、每 行字数、文字颜色、驻留时间、更新时间、字幕显示区域及大小等。
7.如权利要求4所述的字幕显示方式可以采用以下方法:
字幕处理模块上的存储区若有更新,即通知图像合成模块(3)进行图像叠 加,进而对叠加后的图像数据进行编解码处理、传输和显示。当字幕显示区域 中的字数满足字幕设置要求后,即清空显示区域,等待存储区的更新。若更新 时间到达后存储区域却未更新,则字幕显示区域也将全部清空,等待下次处理。
8.如权利要求4所述的字幕显示方式可以采用以下方法:
当字幕存储区中的字数满足字幕设置所要求的一组字幕后,即通知图像合 成模块(3)进行叠加,进而对叠加后的图像数据进行编解码处理、传输和显示。 若更新时间到达后存储区域却未更新,则将存储区内不足一组字幕的数据通过 图像合成模块(3)进行叠加,并进行相应的处理、传输和显示;否则继续等待 存储区更新。如果一组字幕的显示时间已经达到驻留时间,则清空字幕显示区 域,继续监听存储区的更新。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2012-05-11 | 2012-05-11 | | |
2 | | 2010-05-26 | 2010-05-26 | | |
3 | | 2016-03-21 | 2016-03-21 | | |
4 | | 2016-12-05 | 2016-12-05 | | |