著录项信息
专利名称 | 字幕调节方法及装置 |
申请号 | CN201310690684.8 | 申请日期 | 2013-12-16 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-03-19 | 公开/公告号 | CN103647909A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N5/278 | IPC分类号 | H;0;4;N;5;/;2;7;8;;;G;0;6;F;1;7;/;2;2查看分类表>
|
申请人 | 宇龙计算机通信科技(深圳)有限公司 | 申请人地址 | 广东省深圳市南山区高新技术工业园北区酷派信息港1栋6层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 宇龙计算机通信科技(深圳)有限公司 | 当前权利人 | 宇龙计算机通信科技(深圳)有限公司 |
发明人 | 范俊君 |
代理机构 | 工业和信息化部电子专利中心 | 代理人 | 秦莹 |
摘要
本发明公开了一种字幕调节方法及装置。该方法包括:获取音视频文件的音频信息和外挂字幕文件,对音频信息中的对白进行解析,生成对白时间表,对外挂字幕文件的内容进行解析,生成字幕时间表;将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息与字幕文件之间的字幕时间差,并根据字幕时间差对字幕文件进行调节,输出调节后的字幕文件。借助于本发明的技术方案,使字幕能够自动适应电影的播放时间,当外挂字幕与视频对白不一致时,能自动调整,无需用户手动操作,提高了用户的使用体验。
1.一种字幕调节方法,其特征在于,包括:
获取音视频文件的音频信息和外挂字幕文件,对所述音频信息中的对白进行解析,生
成对白时间表,对所述外挂字幕文件的内容进行解析,生成字幕时间表;
其中,所述对白时间表包括:每句对白的对白开始时间、对白结束时间、对白持续时间
长度、以及与前一句对白的间隔时间;
其中,所述字幕时间表包括:每句对白的对白开始时间、对白结束时间、对白持续时间
长度、以及与前一句对白的间隔时间;
将所述对白时间表和所述字幕时间表进行匹配,根据匹配结果确定所述音频信息与所
述字幕文件之间的字幕时间差,并根据所述字幕时间差对所述字幕文件进行调节,输出调
节后的字幕文件。
2.如权利要求1所述的方法,其特征在于,获取音视频文件的音频信息,对所述音频信
息中的对白进行解析,生成对白时间表具体包括:
获取当前音视频文件播放时间点之前的一定时间段内的所述音频信息,利用人声特性
过滤分析得到所述音频信息中的预定句的连续对白;
确定所述连续对白中每句对白的时间信息,并根据所述时间信息生成所述对白时间
表。
3.如权利要求1所述的方法,其特征在于,获取音视频文件的外挂字幕文件,对所述外
挂字幕文件的内容进行解析,生成字幕时间表具体包括:
获取音视频文件的外挂字幕文件,从所述外挂字幕文件中提取所有对白的时间信息,
并根据所述时间信息生成所述字幕时间表。
4.如权利要求1所述的方法,其特征在于,将所述对白时间表和所述字幕时间表进行匹
配,根据匹配结果确定所述音频信息与所述字幕文件之间的字幕时间差具体包括:
获取所述对白时间表中每个对白所对应的对白持续时间长度和与前一句对白的间隔
时间;
将所述对白时间表中记录的所有对白作为一组对白,并以所述一组对白中每个对白所
对应的对白持续时间长度和与前一句对白的间隔时间为参数,将所述一组对白作为一个整
体与所述字幕时间表进行匹配,获取匹配结果,并从所述匹配结果中确定最佳匹配项;
从所述最佳匹配项中分别提取对白开始时间和字幕开始时间,并根据所述对白开始时
间和字幕开始时间的差值确定所述字幕时间差。
5.如权利要求4所述的方法,其特征在于,将所述对白时间表中记录的所有对白作为一
组对白,并以所述一组对白中每个对白所对应的对白持续时间长度和与前一句对白的间隔
时间为参数,将所述一组对白作为一个整体与所述字幕时间表进行匹配,获取匹配结果,并
从所述匹配结果中确定最佳匹配项具体包括:
第n个匹配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);
所述最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,
A2,......,An,......,AN-M);
其中,P为所述字幕时间表,P时间长度n和P时间间隔n为所述字幕时间表第n项的对白持续时间长
度和与前一句对白的间隔时间,1≤n≤N,N为所述字幕时间表中的对白总句数,Q为所述对
白时间表,Q时间长度m和Q时间间隔m为所述对白时间表上第m项的对白持续时间长度和与前一句对白
的间隔时间,1≤m≤M,M为所述对白时间表中的对白句数,F为所使用的匹配函数。
6.如权利要求4所述的方法,其特征在于,将所述一组对白作为一个整体与所述字幕时
间表进行匹配之前,所述方法进一步包括:
设置偏差值,将所述字幕时间表中的对白持续时间长度加上所述偏差值,并将所述字
幕时间表中的与前一句对白的间隔时间减去所述偏差值。
7.如权利要求4所述的方法,其特征在于,根据所述字幕时间差对所述字幕文件进行调
节,输出调节后的字幕文件具体包括:
在确定所述字幕时间差大于预先设置的阈值后,将所述字幕文件中的所述最佳匹配项
后面的对白开始时间和对白结束时间都加上所述字幕时间差,得到调节后的字幕文件并输
出。
8.一种字幕调节装置,其特征在于,包括:
音频解析模块,用于获取音视频文件的音频信息对所述音频信息中的对白进行解析,
生成对白时间表;
字幕文件解析模块,用于获取音视频文件的外挂字幕文件,对所述外挂字幕文件的内
容进行解析,生成字幕时间表;
时间匹配模块,用于将所述对白时间表和所述字幕时间表进行匹配,根据匹配结果确
定所述音频信息与所述字幕文件之间的字幕时间差;
字幕校准模块,用于根据所述字幕时间差对所述字幕文件进行调节,输出调节后的字
幕文件;
其中,所述对白时间表包括:每句对白的对白开始时间、对白结束时间、对白持续时间
长度、以及与前一句对白的间隔时间;
其中,所述字幕时间表包括:每句对白的对白开始时间、对白结束时间、对白持续时间
长度、以及与前一句对白的间隔时间。
9.如权利要求8所述的装置,其特征在于,所述音频解析模块具体用于:
获取当前音视频文件播放时间点之前的一定时间段内的所述音频信息,利用人声特性
过滤分析得到所述音频信息中的预定句的连续对白;
确定所述连续对白中每句对白的时间信息,并根据所述时间信息生成所述对白时间
表。
10.如权利要求8所述的装置,其特征在于,所述字幕文件解析模块具体用于:
获取音视频文件的外挂字幕文件,从所述外挂字幕文件中提取所有对白的时间信息,
并根据所述时间信息生成所述字幕时间表。
11.如权利要求8所述的装置,其特征在于,所述时间匹配模块具体用于:
获取所述对白时间表中每个对白所对应的对白持续时间长度和与前一句对白的间隔
时间;
将所述对白时间表中记录的所有对白作为一组对白,并以所述一组对白中每个对白所
对应的对白持续时间长度和与前一句对白的间隔时间为参数,将所述一组对白作为一个整
体与所述字幕时间表进行匹配,获取匹配结果,并从所述匹配结果中确定最佳匹配项;
从所述最佳匹配项中分别提取对白开始时间和字幕开始时间,并根据所述对白开始时
间和字幕开始时间的差值确定所述字幕时间差。
12.如权利要求11所述的装置,其特征在于,第n个匹配结果为:An=F(P时间长度n,Q时间长度1)+
F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);
所述最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,
A2,......,An,......,AN-M);
其中,P为所述字幕时间表,P时间长度n和P时间间隔n为所述字幕时间表第n项的对白持续时间长
度和与前一句对白的间隔时间,1≤n≤N,N为所述字幕时间表中的对白总句数,Q为所述对
白时间表,Q时间长度m和Q时间间隔m为所述对白时间表上第m项的对白持续时间长度和与前一句对白
的间隔时间,1≤m≤M,M为所述对白时间表中的对白句数,F为所使用的匹配函数。
13.如权利要求11所述的装置,其特征在于,所述时间匹配模块进一步用于:
设置偏差值,将所述字幕时间表中的对白持续时间长度加上所述偏差值,并将所述字
幕时间表中的与前一句对白的间隔时间减去所述偏差值。
14.如权利要求11所述的装置,其特征在于,所述字幕校准模块具体用于:在确定所述
字幕时间差大于预先设置的阈值后,将所述字幕文件中的所述最佳匹配项后面的对白开始
时间和对白结束时间都加上所述字幕时间差,得到调节后的字幕文件并输出。
字幕调节方法及装置\n技术领域\n[0001] 本发明涉及计算机领域,特别是涉及一种字幕调节方法及装置。\n背景技术\n[0002] 目前,高清电影通常配有外挂字幕,不同网站发布的同一部电影可能由于片头被\n改动了导致字幕与电影播放时间不一致。在现有技术中,当发现字幕与电影播放时间不一\n致时,需要用户进行人为判断,并通过系统提供的接口手动对字幕进行向前或者向后调整。\n上述调整字幕的方法需要用户人为操作,调整不是十分方便,用户使用体验不高。\n发明内容\n[0003] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上\n述问题的字幕调节方法及装置。\n[0004] 本发明提供一种字幕调节方法,包括:获取音视频文件的音频信息和外挂字幕文\n件,对音频信息中的对白进行解析,生成对白时间表,对外挂字幕文件的内容进行解析,生\n成字幕时间表;将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息与字幕\n文件之间的字幕时间差,并根据字幕时间差对字幕文件进行调节,输出调节后的字幕文件。\n[0005] 优选地,获取音视频文件的音频信息,对音频信息中的对白进行解析,生成对白时\n间表具体包括:获取当前音视频文件播放时间点之前的一定时间段内的音频信息,利用人\n声特性过滤分析得到音频信息中的预定句的连续对白;确定连续对白中每句对白的时间信\n息,并根据时间信息生成对白时间表,其中,对白时间表包括:每句对白的对白开始时间、对\n白结束时间、对白持续时间长度、以及与前一句对白的间隔时间。\n[0006] 优选地,获取音视频文件的外挂字幕文件,对外挂字幕文件的内容进行解析,生成\n字幕时间表具体包括:获取音视频文件的外挂字幕文件,从外挂字幕文件中提取所有对白\n的时间信息,并根据时间信息生成字幕时间表,其中,字幕时间表包括:每句对白的对白开\n始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时间。\n[0007] 优选地,将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息与字\n幕文件之间的字幕时间差具体包括:获取对白时间表中每个对白所对应的对白持续时间长\n度和与前一句对白的间隔时间;将对白时间表中记录的所有对白作为一组对白,并以一组\n对白中每个对白所对应的对白持续时间长度和与前一句对白的间隔时间为参数,将一组对\n白作为一个整体与字幕时间表进行匹配,获取匹配结果,并从匹配结果中确定最佳匹配项;\n从最佳匹配项中分别提取对白开始时间和字幕开始时间,并根据对白开始时间和字幕开始\n时间的差值确定字幕时间差。\n[0008] 优选地,将对白时间表中记录的所有对白作为一组对白,并以一组对白中每个对\n白所对应的对白持续时间长度和与前一句对白的间隔时间为参数,将一组对白作为一个整\n体与字幕时间表进行匹配,获取匹配结果,并从匹配结果中确定最佳匹配项具体包括:第n\n个匹配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,A2,......,An,......,AN-M);其中,P为字幕时间表,P时间长度n和P时间间隔n为字幕时间表第n项的对白持续时间长度和与前一句对白的\n间隔时间,1≤n≤N,N为字幕时间表中的对白总句数,Q为对白时间表,Q时间长度m和Q时间间隔m为对\n白时间表上第m项的对白持续时间长度和与前一句对白的间隔时间,1≤m≤M,M为对白时间\n表中的对白句数,F为所使用的匹配函数。\n[0009] 优选地,将一组对白作为一个整体与字幕时间表进行匹配之前,上述方法进一步\n包括:设置偏差值,将字幕时间表中的对白持续时间长度加上偏差值,并将字幕时间表中的\n与前一句对白的间隔时间减去偏差值。\n[0010] 优选地,根据字幕时间差对字幕文件进行调节,输出调节后的字幕文件具体包括:\n在确定字幕时间差大于预先设置的阈值后,将字幕文件中的最佳匹配项后面的对白开始时\n间和对白结束时间都加上字幕时间差,得到调节后的字幕文件并输出。\n[0011] 本发明还提供了一种字幕调节装置,包括:音频解析模块,用于获取音视频文件的\n音频信息对音频信息中的对白进行解析,生成对白时间表;字幕文件解析模块,用于获取音\n视频文件的外挂字幕文件,对外挂字幕文件的内容进行解析,生成字幕时间表;时间匹配模\n块,用于将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息与字幕文件之\n间的字幕时间差;字幕校准模块,用于根据字幕时间差对字幕文件进行调节,输出调节后的\n字幕文件。\n[0012] 优选地,音频解析模块具体用于:获取当前音视频文件播放时间点之前的一定时\n间段内的音频信息,利用人声特性过滤分析得到音频信息中的预定句的连续对白;确定连\n续对白中每句对白的时间信息,并根据时间信息生成对白时间表,其中,对白时间表包括:\n每句对白的对白开始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时\n间。\n[0013] 优选地,字幕文件解析模块具体用于:获取音视频文件的外挂字幕文件,从外挂字\n幕文件中提取所有对白的时间信息,并根据时间信息生成字幕时间表,其中,字幕时间表包\n括:每句对白的对白开始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间\n隔时间。\n[0014] 优选地,时间匹配模块具体用于:获取对白时间表中每个对白所对应的对白持续\n时间长度和与前一句对白的间隔时间;将对白时间表中记录的所有对白作为一组对白,并\n以一组对白中每个对白所对应的对白持续时间长度和与前一句对白的间隔时间为参数,将\n一组对白作为一个整体与字幕时间表进行匹配,获取匹配结果,并从匹配结果中确定最佳\n匹配项;从最佳匹配项中分别提取对白开始时间和字幕开始时间,并根据对白开始时间和\n字幕开始时间的差值确定字幕时间差。\n[0015] 优选地,第n个匹配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,A2,......,\nAn,......,AN-M);其中,P为字幕时间表,P时间长度n和P时间间隔n为字幕时间表第n项的对白持续时\n间长度和与前一句对白的间隔时间,1≤n≤N,N为字幕时间表中的对白总句数,Q为对白时\n间表,Q时间长度m和Q时间间隔m为对白时间表上第m项的对白持续时间长度和与前一句对白的间隔\n时间,1≤m≤M,M为对白时间表中的对白句数,F为所使用的匹配函数。\n[0016] 优选地,时间匹配模块进一步用于:设置偏差值,将字幕时间表中的对白持续时间\n长度加上偏差值,并将字幕时间表中的与前一句对白的间隔时间减去偏差值。\n[0017] 优选地,字幕校准模块具体用于:在确定字幕时间差大于预先设置的阈值后,将字\n幕文件中的最佳匹配项后面的对白开始时间和对白结束时间都加上字幕时间差,得到调节\n后的字幕文件并输出。\n[0018] 本发明有益效果如下:\n[0019] 通过将对白时间表和字幕时间表进行匹配,根据匹配结果对字幕文件进行调节,\n解决了现有技术中需要用户人为操作,调整不是十分方便,用户使用体验不高的问题,使字\n幕能够自动适应电影的播放时间,当外挂字幕与视频对白不一致时,能自动调整,无需用户\n手动操作,提高了用户的使用体验。\n[0020] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,\n而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够\n更明显易懂,以下特举本发明的具体实施方式。\n附图说明\n[0021] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通\n技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明\n的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:\n[0022] 图1是本发明实施例的字幕调节方法的流程图;\n[0023] 图2是本发明实施例的音频解析模块输入输出的示意图;\n[0024] 图3是本发明实施例的音频解析模块对电影音频进行解析的示意图;\n[0025] 图4是本发明实施例的字幕解析模块输入输出的示意图;\n[0026] 图5是本发明实施例的对白时间匹配模块输入输出的示意图;\n[0027] 图6是本发明实施例的字幕校准模块输入输出的示意图;\n[0028] 图7是本发明实施例的字幕调节方法的详细处理的流程图;\n[0029] 图8是本发明实施例的字幕调节装置的结构示意图。\n具体实施方式\n[0030] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开\n的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例\n所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围\n完整的传达给本领域的技术人员。\n[0031] 以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述\n的具体实施例仅仅用以解释本发明,并不限定本发明。\n[0032] 方法实施例\n[0033] 根据本发明的实施例,提供了一种字幕调节方法,图1是本发明实施例的字幕调节\n方法的流程图,如图1所示,根据本发明实施例的字幕调节方法包括如下处理:\n[0034] 步骤101,获取音视频文件的音频信息和外挂字幕文件,对音频信息中的对白进行\n解析,生成对白时间表,对外挂字幕文件的内容进行解析,生成字幕时间表;\n[0035] 在步骤101中,获取音视频文件的音频信息,对音频信息中的对白进行解析,生成\n对白时间表具体包括:获取当前音视频文件播放时间点之前的一定时间段内的音频信息,\n利用人声特性过滤分析得到音频信息中的预定句的连续对白;确定连续对白中每句对白的\n时间信息,并根据时间信息生成对白时间表,其中,对白时间表包括:每句对白的对白开始\n时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时间。\n[0036] 在步骤101中,获取音视频文件的外挂字幕文件,对外挂字幕文件的内容进行解\n析,生成字幕时间表具体包括:获取音视频文件的外挂字幕文件,从外挂字幕文件中提取所\n有对白的时间信息,并根据时间信息生成字幕时间表,其中,字幕时间表包括:每句对白的\n对白开始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时间。\n[0037] 步骤102,将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息与字\n幕文件之间的字幕时间差,并根据字幕时间差对字幕文件进行调节,输出调节后的字幕文\n件。\n[0038] 在步骤102中,将对白时间表和字幕时间表进行匹配,根据匹配结果确定音频信息\n与字幕文件之间的字幕时间差具体包括:\n[0039] 获取对白时间表中每个对白所对应的对白持续时间长度和与前一句对白的间隔\n时间;将对白时间表中记录的所有对白作为一组对白,并以一组对白中每个对白所对应的\n对白持续时间长度和与前一句对白的间隔时间为参数,将一组对白作为一个整体与字幕时\n间表进行匹配,获取匹配结果,并从匹配结果中确定最佳匹配项;从最佳匹配项中分别提取\n对白开始时间和字幕开始时间,并根据对白开始时间和字幕开始时间的差值确定字幕时间\n差。\n[0040] 例如,第n个匹配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,A2,......,\nAn,......,AN-M);其中,P为字幕时间表,P时间长度n和P时间间隔n为字幕时间表第n项的对白持续时\n间长度和与前一句对白的间隔时间,1≤n≤N,N为字幕时间表中的对白总句数,Q为对白时\n间表,Q时间长度m和Q时间间隔m为对白时间表上第m项的对白持续时间长度和与前一句对白的间隔\n时间,1≤m≤M,M为对白时间表中的对白句数,F为所使用的匹配函数。\n[0041] 优选地,将一组对白作为一个整体与字幕时间表进行匹配之前,可以设置一个偏\n差值,将字幕时间表中的对白持续时间长度加上偏差值,并将字幕时间表中的与前一句对\n白的间隔时间减去偏差值。\n[0042] 在步骤102中,根据字幕时间差对字幕文件进行调节,输出调节后的字幕文件具体\n包括:在确定字幕时间差大于预先设置的阈值后,将字幕文件中的最佳匹配项后面的对白\n开始时间和对白结束时间都加上字幕时间差,得到调节后的字幕文件并输出。\n[0043] 以下结合附图,以电影为例,对本发明实施例的上述技术方案进行详细说明。\n[0044] 根据本发明实施例的字幕调节方法可以通过以下四个模块完成上述处理:音频解\n析模块、字幕文件解析模块、时间匹配模块、字幕校准模块。\n[0045] 图2是本发明实施例的音频解析模块输入输出的示意图,如图2所示,该模块的输\n入为电影音频,输出为对白时间表。图3是本发明实施例的音频解析模块对电影音频进行解\n析的示意图,如图3所示,音频解析模块在电影播放过程中获取电影音频输出,利用人声特\n性过滤分析得到其中的对白部分,量化后确定对白中每句话的时间点,并通过这些时间点\n生成对白时间表。对白时间表以每句对白作为列表中的一项,每项包含下面几个内容,第n\n句对白的开始时间、结束时间、时间长度、与前一句对白的间隔时间。其中,对白时间表中第\n一句对白的间隔时间取值为0(该电影音频的第一句对白的时间间隔也可以取值为0)。优选\n地,该对白时间表只需包含用于匹配的3至5句对白的内容。取多少句连续对白可以根据实\n际情况需要,取的对白越多,后面的匹配越准确。\n[0046] 图4是本发明实施例的字幕解析模块输入输出的示意图,如图4所示,字幕解析模\n块的输入为字幕文件,输出为字幕时间表。其中,字幕文件可以包括主流的后缀为srt、ass、\nkrc、ksc、ssa、stxt、vst等格式,字幕文件包含的基本内容为每句话的开始时间、结束时间\n和字幕内容。通过解析字幕文件的内容可以提取第m句对白的开始时间、结束时间、时间长\n度、与前一句对白的间隔时间,生成与对白时间表类似的字幕时间表。同样,第一句对白的\n间隔时间取值为0。该字幕时间表包含了所有对白的时间点。\n[0047] 图5是本发明实施例的时间匹配模块输入输出的示意图,如图5所示,时间匹配模\n块的输入对白时间表和字幕时间表,通过匹配后输出为字幕时间误差。对白时间表只包含\n当前视频播放时间点的前M句对白的时间数据,而字幕时间表包含了视频全部对白的时间\n数据,即对白时间表为字幕时间表的子集。这两个表为有序表,根据表项的开始时间进行排\n列。\n[0048] 因此,对白时间匹配可以通过以对白时间表为模板,取每个表项的对白句时间长\n度和间隔时间为特征,在字幕时间表上滑动求其与各个点的匹配程度。匹配可以使用平方\n差匹配法、归一化平方差匹配法、相关匹配法、归一化相关匹配法、相关系数匹配法、归一化\n相关系数匹配法(前面两种方法为越小的值表示越匹配,后四种方法值越大越匹配)等模板\n匹配方法。匹配程度结果为一个数列,求取该数列的最佳匹配项(根据匹配方法不同取最小\n值或者最大值)。\n[0049] 假设P为字幕时间表,P时间长度n和P时间间隔n为字幕时间表第n项的对白持续时间长度和\n与前一句对白的间隔时间,1≤n≤N,N为字幕时间表中的对白总句数,Q为对白时间表,\nQ时间长度m和Q时间间隔m为对白时间表上第m项的对白持续时间长度和与前一句对白的间隔时间,1\n≤m≤M,M为对白时间表中的对白句数,经验值可取5,F为所使用的匹配函数。则有第n个匹\n配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);最佳匹配项:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,A2,......,An,......,AN-M)。\n[0050] 另外,考虑到实际情况中,字幕的出现时间一般会比对白所用的时间要长,同时也\n会导致间隔时间变短。因此可以设定一个1至3秒的偏差值,匹配的时候所有的字幕时间表\n的时间长度都加上这个偏差值,间隔时间都减去这个偏差值,然后再去求匹配。\n[0051] 从最佳匹配结果中分别提取对白时间的开始时间和字幕时间的开始时间,求差可\n得字幕时间差=字幕表项的开始时间-对白表项的开始时间。\n[0052] 图6是本发明实施例的字幕校准模块输入输出的示意图,如图6所示,字幕校准模\n块根据字幕时间差对字幕文件进行修正,输出修正后的字幕文件。当误差时间大于设定的\n阈值后,将最佳匹配时间点后面的对白开始时间和结束时间都加上误差时间,即可以得到\n修正后的字幕文件。\n[0053] 图7是本发明实施例的字幕调节方法的详细处理的流程图,如图7所示,具体包括\n如下处理:\n[0054] 步骤701,启动字幕自动调节功能后,首先判断当前播放视频是否在使用外挂字\n幕,如果是则对外挂字幕文件进行解析,按照字幕时间解析模块的方法生成字幕时间列表,\n同时进入音频解析模块;\n[0055] 步骤702,获取视频对白中的5句对白,按照对白时间解析模块的方法生成对白时\n间表;\n[0056] 步骤703,根据字幕时间表和对白时间表的匹配结果得到字幕时间误差;\n[0057] 步骤704,根据字幕时间差对原字幕文件进行修正,得到修正后的字幕文件;\n[0058] 步骤705,等待若干时间后再进行下一次检测,进入步骤702。\n[0059] 综上所述,借助于本发明实施例的技术方案,通过将对白时间表和字幕时间表进\n行匹配,根据匹配结果对字幕文件进行调节,解决了现有技术中需要用户人为操作,调整不\n是十分方便,用户使用体验不高的问题,使字幕能够自动适应电影的播放时间,当外挂字幕\n与视频对白不一致时,能自动调整,无需用户手动操作,提高了用户的使用体验。\n[0060] 装置实施例\n[0061] 根据本发明的实施例,提供了一种字幕调节装置,图8是本发明实施例的字幕调节\n装置的结构示意图,如图8所示,根据本发明实施例的字幕调节装置包括:音频解析模块80、\n字幕文件解析模块82、时间匹配模块84、字幕校准模块86,以下对本发明实施例的各个模块\n进行详细的说明。\n[0062] 音频解析模块80,用于获取音视频文件的音频信息对音频信息中的对白进行解\n析,生成对白时间表;\n[0063] 音频解析模块80具体用于:获取当前音视频文件播放时间点之前的一定时间段内\n的音频信息,利用人声特性过滤分析得到音频信息中的预定句的连续对白;确定连续对白\n中每句对白的时间信息,并根据时间信息生成对白时间表,其中,对白时间表包括:每句对\n白的对白开始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时间。\n[0064] 字幕文件解析模块82,用于获取音视频文件的外挂字幕文件,对外挂字幕文件的\n内容进行解析,生成字幕时间表;\n[0065] 字幕文件解析模块82具体用于:获取音视频文件的外挂字幕文件,从外挂字幕文\n件中提取所有对白的时间信息,并根据时间信息生成字幕时间表,其中,字幕时间表包括:\n每句对白的对白开始时间、对白结束时间、对白持续时间长度、以及与前一句对白的间隔时\n间。\n[0066] 时间匹配模块84,用于将对白时间表和字幕时间表进行匹配,根据匹配结果确定\n音频信息与字幕文件之间的字幕时间差;\n[0067] 时间匹配模块84具体用于:获取对白时间表中每个对白所对应的对白持续时间长\n度和与前一句对白的间隔时间;将对白时间表中记录的所有对白作为一组对白,并以一组\n对白中每个对白所对应的对白持续时间长度和与前一句对白的间隔时间为参数,将一组对\n白作为一个整体与字幕时间表进行匹配,获取匹配结果,并从匹配结果中确定最佳匹配项;\n从最佳匹配项中分别提取对白开始时间和字幕开始时间,并根据对白开始时间和字幕开始\n时间的差值确定字幕时间差。\n[0068] 优选地,第n个匹配结果为:An=F(P时间长度n,Q时间长度1)+F(P时间间隔n,Q时间间隔1)+F(P时间长度n+1,Q时间长度2)+F(P时间间隔n+1,Q时间间隔2)+......+F(P时间长度n+m-1,Q时间长度m)+F(P时间间隔n+m-1,Q时间间隔m);最佳匹配项为:Abest=MAX(A1,A2,......,An,......,AN-M),或者,Abest=MIN(A1,A2,......,\nAn,......,AN-M);其中,P为字幕时间表,P时间长度n和P时间间隔n为字幕时间表第n项的对白持续时\n间长度和与前一句对白的间隔时间,1≤n≤N,N为字幕时间表中的对白总句数,Q为对白时\n间表,Q时间长度m和Q时间间隔m为对白时间表上第m项的对白持续时间长度和与前一句对白的间隔\n时间,1≤m≤M,M为对白时间表中的对白句数,F为所使用的匹配函数。\n[0069] 时间匹配模块84进一步用于:设置偏差值,将字幕时间表中的对白持续时间长度\n加上偏差值,并将字幕时间表中的与前一句对白的间隔时间减去偏差值。\n[0070] 字幕校准模块86,用于根据字幕时间差对字幕文件进行调节,输出调节后的字幕\n文件。\n[0071] 字幕校准模块86具体用于:在确定字幕时间差大于预先设置的阈值后,将字幕文\n件中的最佳匹配项后面的对白开始时间和对白结束时间都加上字幕时间差,得到调节后的\n字幕文件并输出。\n[0072] 综上所述,借助于本发明实施例的技术方案,通过将对白时间表和字幕时间表进\n行匹配,根据匹配结果对字幕文件进行调节,解决了现有技术中需要用户人为操作,调整不\n是十分方便,用户使用体验不高的问题,使字幕能够自动适应电影的播放时间,当外挂字幕\n与视频对白不一致时,能自动调整,无需用户手动操作,提高了用户的使用体验。\n[0073] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精\n神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围\n之内,则本发明也意图包含这些改动和变型在内。
法律信息
- 2017-05-17
- 2014-04-16
实质审查的生效
IPC(主分类): H04N 5/278
专利申请号: 201310690684.8
申请日: 2013.12.16
- 2014-03-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-05-10
|
2004-11-01
| | |
2
| |
2013-09-25
|
2012-03-22
| | |
3
| |
2010-06-23
|
2009-12-04
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |