字幕数据的处理方法及装置

发明专利无效专利

申请号：
CN200810056153.2
IPC分类号：H04N5/278;H04N7/52
申请日期：
2008-01-14
申请人：
中国网通集团宽带业务应用国家工程实验室有限公司;联合信源数字音视频技术（北京）有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	字幕数据的处理方法及装置
申请号	CN200810056153.2	申请日期	2008-01-14
法律状态	权利终止	申报国家	中国
公开/公告日	2009-07-22	公开/公告号	CN101489052
优先权	暂无	优先权号	暂无
主分类号	H04N5/278 ? IPC结构图谱： H 电学 H9 电学 H04 电通信技术 H04N 图像通信，如电视 H04N5/00 电视系统的零部件（扫描部件或其与供电电压产生的组合入H04N 3/00）〔4，2011.01〕 H04N5/222 电视演播室线路；电视演播室装置；电视演播室设备〔4〕 H04N5/262 电视演播室线路，例如用于混合、开关、转换、改变图像特性及其他特殊效果〔4〕 H04N5/278 配制说明字幕〔4〕	IPC分类号	H;0;4;N;5;/;2;7;8;;;H;0;4;N;7;/;5;2查看分类表>
申请人	中国网通集团宽带业务应用国家工程实验室有限公司;联合信源数字音视频技术（北京）有限公司	申请人地址	北京市亦庄经济技术开发区中和街1号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	中国网通集团宽带业务应用国家工程实验室有限公司,联合信源数字音视频技术（北京）有限公司	当前权利人	中国网通集团宽带业务应用国家工程实验室有限公司,联合信源数字音视频技术（北京）有限公司
发明人	刘红旗;马少红;张伦泳;宋益波;陈熙霖;呼大明;杨长水;王军;杨帆
代理机构	北京同立钧成知识产权代理有限公司	代理人	臧建明

摘要

本发明公开了一种字幕数据的处理方法及装置，该方法包括：获取字幕图象数据和字幕控制数据；获取字幕位图的有效区域；根据有效区域重新生成字幕图象数据，并修改字幕控制数据；将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。该装置包括：字幕流数据解析单元，用于获取字幕图象数据和字幕控制数据；有效区域识别单元，用于获取字幕位图的有效区域；剪裁合成单元，用于根据有效区域重新生成字幕图象数据，并修改字幕控制数据；输出单元，将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。本发明降低了字幕数据量，提高了应用系统的网络带宽利用率，提升了字幕数据后续处理单元的效率。

1.一种字幕数据的处理方法，其特征在于，包括：
对字幕流数据进行解析，获取字幕图象数据和字幕控制数据；
对字幕图象数据进行识别，获取字幕位图的有效区域；
根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据；
将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。
2.根据权利要求1所述的方法，其特征在于，所述有效区域具体为所述字幕位图中的非透明区域。
3.根据权利要求2所述的方法，其特征在于，所述对字幕图象数据进行识别，获取字幕位图的有效区域具体为：
对偶场数据块和奇场数据块中的行数据进行解析，识别出字幕位图中的透明行，然后通过统计计算得到所述字幕位图中的非透明区域。
4.根据权利要求3所述的方法，其特征在于，所述根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据具体为：
分别对奇场数据块和偶场数据块的非透明区域的数据进行提取，然后修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据。
5.根据权利要求1所述的方法，其特征在于，在所述对字幕流数据进行解析，获取字幕图象数据和字幕控制数据之前还包括：从节目流数据中提取字幕流数据。
6.根据权利要求1至5任一权利要求所述的方法，其特征在于，所述有效区域为矩形。
7.一种字幕数据的处理装置，其特征在于，包括：
字幕流数据解析单元，用于对字幕流数据进行解析，获取字幕图象数据和字幕控制数据；
有效区域识别单元，用于对字幕图象数据进行识别，获取字幕位图的有效区域；
剪裁合成单元，用于根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据；
输出单元，将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。
8.根据权利要求7所述的装置，其特征在于，还包括：字幕流数据提取单元，用于从节目流数据中提取字幕流数据。
9.根据权利要求7所述的装置，其特征在于，所述对字幕图象数据进行识别，获取字幕位图的有效区域具体为：
对偶场数据块和奇场数据块中的行数据进行解析，识别出字幕图象中的透明行，然后通过统计计算得到所述字幕图象中的非透明区域。
10.根据权利要求7所述的装置，其特征在于，所述根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据具体为：
分别对奇场数据块和偶场数据块的非透明区域的数据进行提取，然后修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据。

技术领域\n本发明涉及一种字幕数据的处理方法及装置，尤其是一种对字幕数据进行剪裁处理的处理方法及装置。 \n背景技术\n多路传输的音频、视频流对于传输带宽有很高要求，因此，出现了许多方法对音视频的数据进行压缩，然后再传输，以减少数据传输量及终端的解码的输出处理量，但现有技术中，经过压缩的音频、视频基本已没有再缩减的可能。 \n字幕数据是和视频流一起进行传输的，现有技术中的字幕数据处理方法，直接从视频流中提取出字幕数据，将一帧字幕数据中的奇场数据和偶场数据进行合成，然后直接和该帧图象一起进行显示。 \n现有技术中的字幕显示处理方法，没有对字幕数据量进行有效的压缩处理，字幕数据中存在大量的冗余数据，例如，行与行之间的间距等；现有的字幕数据编码应用模式，将整幅图像完全编码，虽然可以降低一定数据量，但并没有达到最高效的应用，对于字幕数据来说，还存在很大的压缩空间。 \n发明内容\n本发明的目的是提供一种字幕数据的处理方法及装置，以减少字幕数据传输量以及终端解码的字幕数据量，进而提高整体视频系统的资源消耗及运行效率。 \n为实现上述目的，本发明提供了一种字幕数据的处理方法，包括： \n对字幕流数据进行解析，获取字幕图象数据和字幕控制数据； \n对字幕图象数据进行识别，获取字幕位图的有效区域； \n根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据； \n将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。 \n本发明还提供了一种字幕数据的处理装置，包括： \n字幕流数据解析单元，用于对字幕流数据进行解析，获取字幕图象数据和字幕控制数据； \n有效区域识别单元，用于对字幕图象数据进行识别，获取字幕位图的有效区域； \n剪裁合成单元，用于根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据； \n输出单元，将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。 \n由上述技术方案可知，本发明通过对字幕数据的剪裁处理，降低了字幕数据量，提高了应用系统的网络带宽利用率，减少了终端解码的字幕数据量，提升了字幕数据后续处理单元的效率。 \n下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。 \n附图说明\n图1为本发明实施例一字幕数据的处理方法的流程图； \n图2为本发明实施例二字幕数据的处理装置的结构示意图。 \n具体实施方式\n实施例一 \n终端设备的字幕显示和图像显示原理类似，都是分成奇场偶场两块进行隔行扫描显示，字幕数据一般分别对奇场偶场数据分别进行编码和流化。 \n本实施例涉及一种字幕数据的处理方法，如图1所示，主要包括如下步骤： \n步骤11、对字幕流数据进行解析，获取字幕图象数据和字幕控制数据； \n字幕流数据中包含有多帧字幕数据，每一帧字幕数据包含两部分内容：字幕图像数据和字幕控制数据。字幕图像数据主要是将字幕位图编码后的数据，该数据分成两块，分别是偶场数据块和奇场数据块，对这两块数据分别解码将得到两张隔行显示的位图，将两张隔行显示的位图合并形成，便完整的字幕位图。字幕控制数据主要记录了字幕位图尺寸、颜色、显示坐标原点、显示时间、奇偶数据块边界等数据。 \n步骤12、对字幕图象数据进行识别，获取字幕位图的有效区域； \n字幕位图往往包含大量无用的透明区域，这类区域是冗余的，而且给终端显示带来了过多的计算量，降低了数据处理的效率，本实施例通过识别出可裁减的透明区域，进而降低数据冗余。 \n具体识别方法，可以通过对奇场、偶场数据块行数据的解析，识别出透明行，然后通过统计计算得到非透明区域的有效矩形区域。 \n步骤13、根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据； \n该步骤可以具体为：对奇场、偶场数据块的有效矩形区域数据进行提取，然后修改字幕控制数据，即字幕位图尺寸和坐标原点、奇偶数据块边界三项数据，形成新的字幕帧。 \n步骤14、将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。 \n通过本实施例中对字幕数据的剪裁处理，最后在终端显示的效果与未剪裁过的图象显示完全一致，而数据量平均减少35％，终端计算量也大大减少。 \n在本实施例中，在步骤1之前还可以包括： \n步骤10、从节目流数据中提取字幕流数据； \n字幕流主要来自于节目流的私有数据流中的子数据流，该数据流可以承载多个字幕流，通过该数据流负载首字节来识别字幕流的类型和字幕流ID从而识别多个字幕流。 \n实施例二 \n本实施例涉及一种字幕数据的处理装置，如图2所示，包括： \n字幕流数据解析单元1，用于对字幕流数据进行解析，获取字幕图象数据和字幕控制数据； \n有效区域识别单元2，用于对字幕图象数据进行识别，获取字幕位图的有效区域； \n剪裁合成单元3，用于根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据； \n输出单元4，将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据，并输出。 \n其中，该装置还可以进一步包括：字幕流数据提取单元，用于从节目流数据中提取字幕流数据。 \n其中，所述对字幕图象数据进行识别，获得字幕位图的有效区域可以具体为： \n对偶场数据块和奇场数据块中的行数据进行解析，识别出字幕图象中的透明行，然后通过统计计算得到所述字幕图象中的非透明区域。 \n所述根据所述有效区域重新生成字幕图象数据，并修改字幕控制数据可以具体为： \n分别对奇场数据块和偶场数据块的非透明区域的数据进行提取，然后修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据。 \n通过上述实施例可以看出，通过对字幕数据的剪裁处理，进一步降低字幕数据量，可提高应用系统的网络带宽利用率，提升字幕数据后续处理单元的效率。 \n本发明实施例的字幕数据处理方法及装置通过有效区域识别、裁剪技术，可以应用于多音轨、多字幕AVS(Audio Video coding Standard，音频视频编码标准)IPTV(交互式网络电视)系统的字幕进进行处理，但不限于上述系统中，从而降低数据流量，减轻终端处理负荷，同时和还可以保证终端输出字幕显示的正确性，从而提升系统应用空间。 \n本领域普通技术人员可以理解：实现上述方法及装置的实施例的全部或部分步骤及处理单元，可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。 \n最后应说明的是：以上实施例仅用以说明本发明的技术方案而非对其进行限制，尽管参照较佳实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对本发明的技术方案进行修改或者等同替换，而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN1992861A	2007-07-04	2005-12-26	储存字幕数据结构之记录媒体及播放该字幕数据之方法无效专利	财团法人工业技术研究院
2	CN1585464A	2005-02-23	2004-08-20	控制字幕位置的装置和方法失效专利	三星电子株式会社
3	CN101086834A	2007-12-12	2006-06-06	一种控制字幕显示效果的方法及控制设备无效专利	华为技术有限公司
4	CN1897652A	2007-01-17	2006-05-30	隐藏式字幕解码方法无效专利	深圳创维-RGB电子有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供