著录项信息
专利名称 | 播放流媒体字幕的方法及其流媒体播放器 |
申请号 | CN200510034548.9 | 申请日期 | 2005-05-01 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2006-11-08 | 公开/公告号 | CN1859565 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N7/24 | IPC分类号 | H;0;4;N;7;/;2;4;;;H;0;4;N;7;/;1;7;3查看分类表>
|
申请人 | 腾讯科技(深圳)有限公司 | 申请人地址 | 广东省深圳市福田区振兴路赛格科技园2栋东410号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 腾讯科技(深圳)有限公司 | 当前权利人 | 腾讯科技(深圳)有限公司 |
发明人 | 伍海君;王宇 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 宋志强;麻海明 |
摘要
本发明公开了一种播放流媒体字幕的方法,以解决现有技术在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题;该方法通过向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕服务,由所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕流,所述流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播放。
1、一种播放流媒体字幕的方法,其特征在于包括下述步骤:
向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕 服务;
所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕 流;
流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳 的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差 值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间 戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播 放。
2、如权利要求1所述的方法,其特征在于,先向流媒体服务器请求流媒体 服务,并在得到流媒体服务器的应答后再向字幕服务器请求字幕流服务。
3、如权利要求1所述的方法,其特征在于,所述流媒体服务器和/或字幕服 务器在收到请求后还要求验证签名,并在对请求方提供的签名验证成功后向流 媒体播放器发送流媒体和/或字幕流。
4、如权利要求1所述的方法,其特征在于,在判断时间戳是否匹配时,若 当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不 大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,否 则确定时间戳不匹配。
5、如权利要求1至4任一项所述的方法,其特征在于,若所述流媒体中包 含有视频流,则从流媒体中分离出视频流并与所字幕流合成新的视频流后进行 播放。
6、如权利要求5所述的方法,其特征在于,在合成视频流前还分别对视频 流和字幕流进行解码。
7、如权利要求6所述的方法,其特征在于,将视频流解码为位图格式,在 合成视频流时,将位图上待显示字幕点阵所占用位置的位图点阵替换成字幕颜 色。
技术领域\n本发明涉及流媒体技术,尤其涉及播放流媒体字幕的方法及流媒体播放器。\n背景技术\n流媒体(Streaming Media)技术是一种新兴的网络传输技术,用于在互联网 上实时顺序地传输和播放视/音频等多媒体内容的连续时基数据流,流媒体技术 包括流媒体数据采集、视/音频编解码、存储、传输、播放等领域。在网络上传 播多媒体信息主要有两种方式:下载和流式传输。下载方式是传统的传输方式, 指在播放之前由用户下载多媒体文件至本地。流式传输则把多媒体信息通过服 务器向用户实时地提供,采用这种方式时,用户不必等到整个文件全部下载完 毕,而只需经过几秒或几十秒的启动时延即可播放,之后,客户端边接收数据 边播放。\n目前,流媒体技术广泛应用在多媒体新闻发布、网上演示、在线直播、网 络广告、电子商务、视频点播、远程教育、实时视频会议和即时通讯等互联网 的信息服务上。为了向用户提供更丰富的流媒体服务,一般在向用户提供流媒 体服务的同时还提供字幕服务,现有技术提供字幕服务有以下两种方案:\n1、流媒体服务器端解决方案,该方案在制作媒体流的时候同时制作好字幕 流,再存储为媒体流和字幕流按时间顺序交错的媒体流文件;播放时,由客户 端播放器直接解码媒体流和字幕流。\n这种方案的缺点是字幕流和媒体流交错存储在文件里,对所有的用户都是 提供相同的字幕流,不能针对不同的用户发送不同的字幕流,其灵活性较差, 而且修改字幕流也不方便。\n2、流媒体播放器客户端解决方案,该方案预先制作和对应媒体流匹配的字 幕流文件,将该文件保存在客户端本地,客户端播放媒体流文件的同时显示相 应字幕。\n这种方案的缺点是字幕流内容不受服务器端控制,而且字幕流也不受流媒 体供应商控制,对于一些现场直播类媒体流的字幕服务不能及时更新,因此, 其灵活性和动态可控性差。\n发明内容\n本发明提供一种播放流媒体字幕的方法及流媒体播放器,以解决现有技术 在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题。\n一种传送流媒体字幕的方法,该方法包括下述步骤:\n向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕 服务;\n所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕 流;\n流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳 的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差 值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间 戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播 放。\n其中:\n先向流媒体服务器请求流媒体服务,并在得到流媒体服务器的应答后再向 字幕服务器请求字幕流服务。\n所述流媒体服务器和/或字幕服务器在收到请求后还要求验证签名,并在对 请求方提供的签名验证成功后向流媒体播放器发送流媒体和/或字幕流。\n在判断时间戳匹配时,若当前媒体样本的时间戳与当前字幕流样本的时间 戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳 与当前字幕流时间戳匹配,否则确定时间戳不匹配。\n若所述流媒体中包含有视频流,则从流媒体中分离出视频流并与所字幕流 合成新的视频流后进行播放。\n本发明在播放媒体流的过程中,将媒体流中的视频流与字幕流动态的合成 新的视频流播放,因而在对IM用户提供流媒体服务的时候,可以灵活的提供对 应的字幕服务,这种字幕可以是对应的视频对白、音频字幕、广告字幕、消息 字幕等;在本发明中字幕服务由服务器端提供,其动态可控性好,能够根据需 要及时更新。采用本发明不仅能够满足不同的业务需求,而且也可作为一种增 值服务为流媒体服务商增加收入来源、为用户提供更丰富的流媒体服务。\n附图说明\n图1为实现本发明网络系统结构示意图;\n图2为媒体流和字幕流服务的流程示意图;\n图3A为媒体流的存储格式示意图;\n图3B为字幕流存储格式示意图;\n图4为流媒体播放器结构示意图;\n图5为字幕组件处理字幕流的流程图。\n具体实施方式\n为了满足多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、 视频点播、远程教育、实时视频会议和即时通讯等信息服务对流媒体字幕技术 的不同需求,提高其灵活性,本发明由字幕服务器控制字幕流,在流媒体播放 器请求流媒体服务器提供流媒体服务时,向字幕服务器请求该流媒体对应的字 幕服务;流媒体播放器接收到流媒体服务器和字幕服务器发送来的媒体流和字 幕流后匹配时间戳,在字幕流时间戳与媒体流时间戳匹配时,将该字幕流转换 为视频流与所述媒体流同步播放。\n以下主要以即时通讯服务为例,结合附图对实现本发明进行详细说明:\n如图1所示,实现本发明的即时网络系统包括即时通讯用户客户端(IM Client)400(用户客户端为多个)、即时通讯服务器(IM Server)100、流媒体 服务器200和字幕服务器300。其中:即时通讯服务器100负责管理用户和对即 时通讯用户(IM User)登录进行认证,并对用户发放签名。流媒体服务器200 向用户提供流媒体服务,并对访问流媒体服务器的用户进行认证。字幕服务器 300向用户提供字幕服务,并对访问字幕服务器的用户进行认证。\n参阅图2所示,在即时通讯客户端具有流媒体播放器500,该流媒体播放器 500包括媒体流处理单元510、合成单元520和播放单元530。媒体流处理单元 510接收和解码流媒体服务器通过网络传送来的媒体流,合成单元520将媒体流 处理单元510输出的媒体流和字幕服务器300通过网络传送来的字幕流合成新 的媒体流,播放单元530播放合成单元520输出的媒体流。\n流媒体播放器500中,除合成单元520外,媒体流处理单元510和播放单 元530可以是Windows操作系统上安装的Windows Media Player中的单元。\n参阅图3A所示,媒体流在流媒体服务器200上的存储格式和普通的流媒体 服务器媒体流储存格式一致。\n参阅图3B所示,在字幕服务器300上,期望和媒体流里某时间点同时出现 的字幕则打上和该媒体流里相同的时间戳,以保证流媒体播放和字幕流同步显 示。字幕服务器300上的字幕流采用无损压缩编码算法进行编码,如LZ77算法。\n参阅图4所示,媒体流处理单元510包括:接收/缓冲组件511、音/视频媒 体流分离组件512、音频解码组件513和视频解码组件514。接收/缓冲组件511 接收并缓存从流媒体服务器200传送来的流媒体;音/视频媒体流分离组件512 将接收/缓冲组件511输出的媒体流分离为音频流和视频流,并分别输出到音频 解码组件513和视频解码组件514;音频解码组件513对音频流进行解码,视频 解码组件514对视频流进行解码。\n合成单元520包括:字幕接收/缓冲组件521、字幕解码组件522和视频/字 幕合成组件523。字幕接收/缓冲组件521接收由字幕服务器300发送来的字幕 流,并把接收到的字幕流按字幕流时间样本先后顺序保存在本地的一个缓冲队 列里;字幕解码组件522对字幕接收/缓冲组件521输出的已编码字幕流数据, 采用相应的解码算法进行解码,并将解码后的数据流写入字幕缓冲文件,如, 字幕服务器300上的字幕流采用LZ77算法编码,字幕解码组件522则采用LZ77 解码算法进行解码。既使用和字幕流编码对应的解码算法解码。视频/字幕合成 组件523将视频解码组件514输出的视频流和字幕解码组件522输出的字幕流 合成新的视频流并输出。\n播放单元530包括音频播放组件531和视频播放组件532,音频播放组件 531用于播放音频解码组件513输出的音频流,视频播放组件532用于播放视频 /字幕合成组件523输出的视频流。\n为了使字幕流和对应的媒体流同步播放,字幕流的时间戳必须与对应的媒 体流的时间戳匹配(或者说明媒体流和字幕流的时间戳必须一致)。流媒体播放 器500在确定字幕流和媒体流的时间戳是否匹配时,以第一个媒体流样本的时 间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时 间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则 确定所述当前媒体流时间戳与当前字幕流时间戳匹配。如:阈值设定为2,媒体 流的第一个媒体样本的时间戳是10,字幕流第一个样本的时间戳是110,则参 考值为110-10=100。若经过5秒以后,当前媒体流的时间戳为10+5=15,此时 收到的字幕流样本的时间戳为116,则当前字幕流样本的时间戳与当前媒体流样 本时间戳的差值101(116-15=101)与参考值100的差为1,此时该差值1小于 阈值2,流媒体播放器500则确定字幕流时间戳与流媒体时间戳匹配。\n参阅图5所示,播放流媒体字幕的过程如下:\n步骤10:即时通讯用户A首先向流媒体服务器200申请流媒体服务(标识 该流媒体为C),在收到流媒体服务器200的应答后,通讯用户A再向字幕服务 器300申请媒体流C对应的字幕服务。流媒体服务器对即时通讯用户A的应答 中包括了是否需要认证、是否提供字幕流服务等信息。\n步骤20:流媒体服务器200和字幕服务器300分别检查后确认可为该新用 户提供流媒体服务和字幕服务,并要求用户A提供签名。\n步骤30:用户A向即时通讯服务器100获取用于访问流媒体服务器200和 字幕服务器300的签名,即时通讯服务器100返回一个可访问流媒体服务器的 签名S1和一个可访问字幕服务器的签名S2,由用户发送签名给流媒体服务器 200和字幕服务器300。\n步骤40:流媒体服务器200和字幕服务器300分别认证签名S1和签名S2, 若两个签名均通过认证,则流媒体服务器200和字幕服务器300分别向用户A 发送媒体流C和对应的字幕流。若签名未通过认证,则服务器不会向用户A提 供服务。\n步骤50:即时通讯用户A客户端(IM Client)上启动的流媒体播放器500 接收媒体流C和对应的字幕流,由媒体流处理单元510解码媒体流C并分离出 音频流和视频流,合成单元520接收到视频流和解码后的字幕服务流后,判断 视频流的时间戳与字幕流的时间戳是否匹配,如果匹配,则将该视频流和字幕 流合成新的视频流,播放单元530播放媒体流处理单元510输出的音频流和合 成单元520输出的视频流,从而达到媒体流和对应的字幕流同频播放。若不匹 配,则缓存该字幕流,如果该字幕流时间戳的绝对差值和当前媒体流时间戳的 绝对差值大于限定值,则认为该字幕样本已经无效,丢弃该样本。\n在媒体流处理单元510中,视频解码组件514将媒体流中的视频流解码后, 以位图(Bitmap)的格式传输给合成单元520中的视频/字幕合成组件523,视 频/字幕合成组件523合成新的视频帧时将要显示字幕点阵在位图上对应的位置 的位图点阵替换成字幕颜色,处理完当前帧要显示的所有字符的点阵即完成一 帧的字幕、视频合成。\n若上述的媒体流中不包含视频流即仅有音频流,视频/字幕合成组件523将 字幕流单独转化成视频流的格式发送给视频显示组件532进行显示。\n当然,流媒体服务器200和字幕服务器300也可能不需要用户提供签名而 直接提供服务,即在上述步骤20、步骤30和步骤40中没有要求签名、获取签 名和签名认证过程。\n本发明在多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、 视频点播、远程教育和实时视频会议服务上的实现与上述即时通讯服务上的实 现同理,在此不再赘述。\n显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发 明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及 其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
法律信息
- 2009-01-14
- 2007-01-03
- 2006-11-08
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2004-11-03
|
2004-03-22
| | |
2
| | 暂无 |
1995-11-28
| | |
3
| |
2004-06-16
|
2002-12-04
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |