著录项信息
专利名称 | 检测新闻主播的影音特征以将电视新闻分段的方法 |
申请号 | CN200510091769.X | 申请日期 | 2005-08-17 |
法律状态 | 权利终止 | 申报国家 | 暂无 |
公开/公告日 | 2007-02-21 | 公开/公告号 | CN1917588 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N5/262 | IPC分类号 | H;0;4;N;5;/;2;6;2查看分类表>
|
申请人 | 智辉研发股份有限公司 | 申请人地址 | 中国台湾桃园县
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 智辉研发股份有限公司 | 当前权利人 | 智辉研发股份有限公司 |
发明人 | 李士弘;叶家宏;施宣辉;郭宗杰 |
代理机构 | 北京市柳沈律师事务所 | 代理人 | 黄小临;王志森 |
摘要
本发明揭露一种图像分段方法,用来根据图像片段的内容剪辑图像片段。该方法包含有:利用第一水平扫描线来扫描该图像画面的像素,判断该像素的颜色是否落于预定颜色范围内;利用多个连续的图像画面中位于该第一水平扫描线上的像素来产生色彩地图;如果色彩地图显示预定数目的连续图像画面中,皆包含稳定的像素区域,并且该像素皆落于该预定的颜色范围,则将目前的图像段落标示为候选的图像段落;以及对该稳定的像素区域执行色谱曲线颜色比较,以检测镜头转换。可以进一步分析该图像片段的声音信号以验证该候选的图像段落。
1. 一种图像分段方法,用来根据图像片段的内容剪辑图像片段,该方法 包含有:
接收包含有多个图像画面的图像信号;
利用第一水平扫描线来分析该图像信号的图像画面,其中该第一水平扫 描线是选取至少一列像素来作分析;
分析图像画面中位于该第一水平扫描线上的像素以决定该像素的颜色是 否落于预定颜色范围之内;
在该图像画面中指出落于该预定颜色范围之内的相邻像素所含盖的区 域;
利用多个连续的图像画面中位于该第一水平扫描线上的像素来产生色彩 地图;
如果色彩地图显示预定数目的连续图像画面中,皆包含稳定的像素区域, 并且该像素皆落于该预定的颜色范围,则将目前的图像段落标示为候选的图 像段落;
对于每一个候选的图像段落,自每N个图像画面中选出一个图像画面, 并且针对每个选出的图像画面的稳定区域,产生色谱曲线;
执行第一色谱曲线比较,比较每一对连续选出的图像画面的色谱曲线;
当该第一色谱曲线比较所得的第一色谱曲线差大于第一临界值时,执行 第二色谱曲线比较,比较介于该对连续选出的图像画面之间的每一对连续的 图像画面的稳定区域,其中该对连续选出的图像画面的色谱曲线差是大于该 第一临界值;以及
当该第二色谱曲线比较所得的第二色谱曲线差大于第二临界值时,指示 该候选的图像段落中有镜头改变。
2. 根据权利要求1所述的方法,其中该自每N个图像画面中选出一个图 像画面是包含选取第N个图像画面。
3. 根据权利要求1所述的方法,其中该第一水平扫描线是位于图像画面 中自顶端往下大约三分之一画面的地方。
4. 根据权利要求1所述的方法,还包含有在分析该图像画面中位于该第 一水平扫描线上的像素前,执行RGB色彩至Lab色彩转换,来判断该像素的 颜色是否落于该预定颜色范围。
5. 根据权利要求1所述的方法,其中该预定数目的连续图像画面是构成 三秒钟的图像。
6. 根据权利要求1所述的方法,还包含有:
利用第二水平扫描线来分析该图像信号的图像画面,其中该第一、第二 水平扫描线是选取相同数目的列来作分析;
如果图像画面上位于该第一、第二水平扫描线上的像素的颜色落于该预 定颜色范围内,则将该像素设定为逻辑值“1”;
利用位于该第一及第二水平扫描线上的相对应的像素,执行“或”逻辑 运算,来产生合成的像素数据;以及
利用该合成的像素数据来指出该图像画面中落于该预定颜色范围的相邻 像素的区域,以及利用该多个连续的图像画面来产生该色彩地图。
7. 根据权利要求6所述的方法,其中该第一、第二水平扫描线位于图像 画面中自顶端往下大约三分之一画面的地方。
8. 根据权利要求1所述的方法,还包含有移除长度小于预定时间的候选 的图像段落。
9. 根据权利要求1所述的方法,还包含有:
接收与该已接收的图像信号相关联的声音信号;以及
分析该声音信号以过滤该候选的图像段落,其中该声音信号是在预定尺 寸的声音栏框中进行处理。
10. 根据权利要求9所述的方法,还包含将声音样本转换至频域以分析 该声音栏框的频率响应,以及计算该声音栏框的总体声音能阶。
11. 根据权利要求10所述的方法,还包含有:
计算该声音栏框的背景声音能阶;
比较该背景声音能阶与该总体声音能阶;以及
如果该背景声音能阶对该总体声音能阶的比例并未落在第一特定范围, 则消除该候选的图像段落。
12. 根据权利要求11所述的方法,还包含有:
计算声音能阶低于该背景声音能阶的声音栏框数对所有声音栏框数的比 例;以及
如果该比例是未落于第二特定范围,则消除该候选的图像段落。
13. 根据权利要求10所述的方法,还包含有:
计算频率落于8-13kHz的声音栏框的平均声音能量;
计算频率落于8-13kHz的声音栏框的平均声音能量对总体声音能阶的比 例;以及
如果该比例未落于特定的范围,则消除该候选的图像段落。
14. 根据权利要求10所述的方法,还包含有:
计算该目前候选图像段落的频率中心的变异数;以及
如果该频率中心的变异数未落于特定的范围,则消除该候选的图像段落。
15. 根据权利要求1所述的方法,还包含有:
接收与该已接收的图像信号相关联的声音信号;
利用第一水平扫描线与第二水平扫描线来分析该图像信号的图像画面, 其中该第一水平扫描线与该第二水平扫描线是各选取至少一列像素来作分 析;
如果图像画面上位于该第一、第二水平扫描线上的像素的颜色是落于预 定颜色范围内,则将该像素设定为逻辑值“1”;
利用位于该第一及第二水平扫描线上的相对应的像素,执行“或”逻辑 运算,来产生合成的像素数据;
利用该合成的像素数据来指出该图像画面中落于该预定颜色范围的相邻 像素的区域;以及
分析该声音信号以过滤该候选的图像段落,其中该声音信号的特征是藉 由处理该声音信号的多个预定尺寸的声音栏框而取得。
16. 根据权利要求15所述的方法,其中该第一、第二水平扫描线是位于 图像画面中自顶端往下大约三分之一画面的地方。
技术领域\n本发明是有关一种图像分段技术,尤指一种检测电视新闻主播,并将电 视新闻节目分段的方法。\n背景技术\n因为电视上的新闻频道日益增加,所以可以取得的新闻信息也愈来愈多, 因此观众愈来愈不容易搜寻并找出想要的新闻节目。一个新闻节目通常包含 有若干段不同的新闻,而每一段新闻之间通常没有太多的关联。为了让搜寻 以及分类每段新闻变得更加便利,可以利用电视新闻主播的图像来判别每一 段新闻何时开始以及何时结束。因此在每一段新闻画面中,电视新闻主播的 镜头成为最重要的镜头,电视新闻主播通常在每一段新闻开始时做引言介绍, 或是在每一段新闻结束时对新闻内容讲评或整理。因此电视新闻主播的镜头 可以有效地传达新闻内容的主要概念,观众也可以根据电视新闻主播的镜头 来浏览新闻节目,也就是说可以藉由检测新闻主播来识别每一段新闻。\n传统将新闻分段的方法用的是一种机器学习(machine learning)技术, 该技术会自动将新闻分类,然而该现有技术的效能会受到某些编辑特效的限 制,例如将画面分割之后来显示不同来源的数据。也有其它使用较复杂算法 的方法,例如脸部辨识以及语者识别(speaker identification)的方法,因 为电视新闻主播是谁以及他在画面中的位置是未知的。以下所列是几种已知 的分段方法:头部检测、嘴型检测、口音及音乐的分类或辨识、隐藏式字幕 (closed-caption)提取以及图像光学文字辨识系统(optical character recognition,OCR),以及模型基础方法(model-based method)。然而上述的 方法皆仰赖极为复杂的算法。\n发明内容\n本发明的目的之一在于提供一种扫描新闻节目图像画面的方法,来解决 上述的问题,此方法是藉由比对画素颜色与肤色范围来检测电视新闻主播是 否出现于图像画面中。\n根据本发明的实施例,其是揭露一种图像分段方法,用来根据图像片段 的内容剪辑图像片段。该方法包含有:接收包含有多个图像画面的图像信号; 利用第一水平扫描线来分析该图像信号的图像画面,其中该第一水平扫描线 是选取至少一列像素来作分析;分析图像画面中位于该第一水平扫描线上的 像素以决定该像素的颜色是否落于预定颜色范围之内;在该图像画面中指出 落于该预定颜色范围之内的相邻像素所含盖的区域;利用多个连续的图像画 面中位于该第一水平扫描线上的像素来产生色彩地图;如果色彩地图显示预 定数目的连续图像画面中,皆包含稳定的像素区域,并且该像素皆落于该预 定的颜色范围,则将目前的图像段落标示为候选的图像段落;对于每一个候 选的图像段落,自每N个图像画面中选出一个图像画面,并且针对每个选出 的图像画面的稳定区域,产生色谱曲线;执行第一色谱曲线比较,比较每一 对连续选出的图像画面的色谱曲线;当该第一色谱曲线比较所得的第一色谱 曲线差大于第一临界值时,执行第二色谱曲线比较,比较介于该对连续选出 的图像画面之间的每一对连续的图像画面的稳定区域,其中该对连续选出的 图像画面的色谱曲线差是大于该第一临界值;以及当该第二色谱曲线比较所 得的第二色谱曲线差大于第二临界值时,指示该候选的图像段落中有镜头改 变。\n根据本发明的另一实施例,其是揭露一种图像分段方法,用来根据图像 片段的内容剪辑图像片段。该方法包含有:接收包含有多个图像画面的图像 信号;接收与该已接收的图像信号相关联的声音信号;利用第一水平扫描线 与第二水平扫描线来分析该图像信号的图像画面,其中该第一水平扫描线与 该第二水平扫描线是各选取至少一列像素来作分析;如果图像画面上位于该 第一、第二水平扫描线上的像素的颜色是落于预定颜色范围内,则将该像素 设定为逻辑值“1”;利用位于该第一及第二水平扫描线上的相对应的像素, 执行“或(OR)”逻辑运算,来产生合成的像素数据;利用该合成的像素数据 来指出该图像画面中落于该预定颜色范围的相邻像素的区域;利用多个连续 的图像画面中的合成的像素数据来产生色彩地图;如果色彩地图显示预定数 目的连续图像画面中,皆包含稳定的像素区域,并且该像素皆落于该预定的 颜色范围,则将目前的图像段落标示为候选的图像段落;对于每一个候选的 图像段落,自每N个图像画面中选出一个图像画面,并且针对每个选出的图 像画面的稳定区域,产生色谱曲线;执行第一色谱曲线比较,比较每一对连 续选出的图像画面的色谱曲线;当该第一色谱曲线比较所得的第一色谱曲线 差大于第一临界值时,执行第二色谱曲线比较,比较介于该对连续选出的图 像画面之间的每一对连续的图像画面的稳定区域,其中该对连续选出的图像 画面的色谱曲线差是大于该第一临界值;当该第二色谱曲线比较所得的第二 色谱曲线差大于第二临界值时,指示该候选的图像段落中有镜头改变;以及 分析该声音信号以过滤该候选的图像段落,其中该声音信号的特征是藉由处 理该声音信号的多个预定尺寸的声音栏框(audio frame)而取得。\n根据本发明的另一实施例,其亦揭露一种图像分段方法,该方法是根据 检测电视新闻图像片段中的电视新闻主播来剪辑该电视新闻图像片段。该方 法包含有:接收包含有多个新闻图像画面的图像信号;利用第一水平扫描线 来分析该图像信号的新闻图像画面,其中该第一水平扫描线是选取至少一列 像素来作分析;分析新闻图像画面中位于该第一水平扫描线上的像素以决定 该像素的颜色是否落于预定颜色范围之内,以检测该电视新闻主播的肤色; 在该新闻图像画面中指出落于该预定颜色范围之内的相邻像素所含盖的区 域;利用多个连续的新闻图像画面中位于该第一水平扫描线上的像素来产生 色彩地图;如果色彩地图显示预定数目的连续新闻图像画面中,皆包含稳定 的像素区域,并且该像素皆落于该预定的颜色范围,则将目前的图像段落标 示为候选的图像段落;对于每一个候选的图像段落,自每N个新闻图像画面 中选出一个新闻图像画面,并且针对每个选出的新闻图像画面的稳定区域, 产生色谱曲线;执行第一色谱曲线比较,比较每一对连续选出的新闻图像画 面的色谱曲线;当该第一色谱曲线比较所得的第一色谱曲线差大于第一临界 值时,执行第二色谱曲线比较,比较介于该对连续选出的新闻图像画面之间 的每一对连续的新闻图像画面的稳定区域,其中该对连续选出的新闻图像画 面的色谱曲线差是大于该第一临界值;以及当该第二色谱曲线比较所得的第 二色谱曲线差大于第二临界值时,指示该候选的图像段落中有镜头改变。\n本发明的优点之一在于,本发明所提出的方法利用简单的算法来检测图 像画面中是否出现落于肤色范围的像素,然后再判断落于肤色范围的像素的 位置是否对应于电视新闻主播的位置而呈现稳定状态。再者,利用比较色谱 曲线的方法,本案可以很快地判断出何时电视新闻主播已经没有继续出现在 新闻画面上,而找出新闻段落转换的位置。藉由锁定电视新闻主播常出现的 位置,即使图像画面包含有分割画面,检测电视新闻主播的方法仍然相当有 效,因为本方法仅锁定电视新闻主播的头部部分出现的位置。总之,本发明 提供一种简易的计算方法来将电视新闻节目分段。\n附图说明\n第1图为电视新闻分段系统的方块图。\n第2图显示利用第一水平扫描线以及第二水平扫描线来检测图像画面上 是否有电视新闻主播的脸部图像。\n第3图为本发明检测电视新闻主播脸部图像的流程图。\n第4图显示如何从两条扫描线来得到逻辑色彩图,用来检测电视新闻主 播。\n第5图显示检测镜头切换的示意图,藉由比较两个图像画面的图像带的 局部色谱曲线,来检测镜头切换。\n[主要元件标号说明]\n10系统 12非重迭位移窗口电路\n14快速傅立叶转换电路 20声音能量分析电路\n22、24声音样本的能量的计算电路 26声音样本的频率中心的计算 电路\n30图像处理电路 32镜头检测电路\n34脸部肤色检测电路 36后续处理电路\n40新闻图像的候选片段 42背景能阶电路\n50比例计算电路 52、54声音能阶比例计算电路\n56频率中心的变异数的计算电路 58无音讯比例计算电路\n100、210图像画面 102第一水平扫描线\n104第二水平扫描线 112、114取样像素颜色\n220肤色检测程序 222、224指针阵列\n226“或”逻辑运算 230色彩地图\n232结果阵列 240色彩区块\n245呈现肤色的稳定区域 310、320图像画面组\n312、322图像画面 315、325图像带\n具体实施方式\n请参阅第1图,第1图为电视新闻分段系统的方块图。该系统10系藉由 检测电视新闻主播而将电视新闻分段,系统10包含有图像处理电路30,图 像处理电路30会依据电视新闻主播的检测结果,来产生新闻图像的候选片段 40。一旦产生新闻图像的候选片段40之后,会进一步分析该候选片段40的 声音信息,以确保图像分析的正确性。\n图像处理电路30包含有镜头检测电路32、脸部肤色检测电路34以及后 续处理电路36。脸部肤色检测电路34用来检测落在预定范围的图像画面上 的像素,该预定范围即代表肤色范围。请参阅第2图及第3图,第2图显示 利用第一水平扫描线102以及第二水平扫描线104来检测图像画面100上是 否有电视新闻主播的脸部图像。第3图则为本发明检测电视新闻主播脸部图 像的流程图。\n研究显示,摄影师通常习惯将主播的脸部置于离图像画面顶端约三分之 一的地方,因此,脸部肤色检测电路34利用第一水平扫描线102或有时候连 同第二水平扫描线104来检测具有人类肤色的画素。虽然检测的时候只需要 第一水平扫描线102,但是额外利用第二水平扫描线104可以让脸部肤色检 测电路34产生更准确的结果。举例来说,水平扫描线可能通过电视新闻主播 的眼睛或嘴巴,虽然水平扫描线仍然通过电视新闻主播的脸部,但检测到的 颜色却不是肤色,这会导致不准确的检测结果。为了减少这种情况的发生机 会,以及为了提供更多能用来检测电视新闻主播脸部位置的数据,因此会用 到两条水平扫描线。\n不论第一水平扫描线102或是第二水平扫描线104皆会分析图像画面 100中至少一列的像素,并分别产生取样像素颜色112以及114。请注意,第 一水平扫描线102的位置以及第二水平扫描线104的位置会尽可能落于电视 画面三分之一的地方,以增加扫描到电视新闻主播的脸部的可能性。以下将 解释第3图中所显示的步骤。\n步骤150:开始。\n步骤152:将图像画面100的色彩空间(color space)从RGB色彩空间转 换至Lab色彩空间。Lab色彩空间较适合用来检测肤色,而且也更为普遍使 用。然而,本发明也可以使用其它种类的色彩空间,例如RGB、YCbCr以及 IRgBy。\n步骤154:判别第一水平扫描线102(或有时连同第二水平扫描线104)是 否在该图像画面100上扫描到任何落于肤色范围的像素。这个肤色范围可以 依据局部区域或是摄影棚的灯光状况而调整。\n步骤156:判别是否有一个够大且连续的肤色范围区域。也就是说,判 别是否有一群连续的像素,其个数比一预定值大,而且全数落于肤色范围。 如果有一个够大且连续的肤色范围区域,到步骤158,否则则到步骤160。\n步骤158:指示将目前的图像片段设定为候选的图像片段。因为之后会 对该图像片段做更多的图像以及声音分析,该图像片段可能不会再被设定为 候选的图像片段。\n步骤160:结束。\n请参阅第4图,第4图显示如何从两条扫描线来得到逻辑色彩图(logic color map),用来检测电视新闻主播。在新闻播报的期间,电视新闻主播的 位置一般而言都很固定,因此可以利用这个事实来判别在连续的图像画面中, 是否在大约相同的位置上都包含有具有肤色的像素。本案中所举的例子皆假 设图像区段中每秒钟包含有30个图像画面。这个播放速度只是方便于解释本 发明所提出的方法,然而不应将此播放速度作为本案的限制。\n第一水平扫描线102以及第二水平扫描线104是用来在多个图像画面 210中,例如30个连续的图像画面,产生取样像素颜色112以及114。一旦 取样像素颜色112以及114产生之后,就会启动肤色检测程序220来将每个 像素作分类:如果像素是落在肤色范围,则其代表逻辑值“1”,如果像素非 落在肤色范围,则其代表逻辑值“0”,取样像素颜色112以及114的结果则 如指针阵列222及224所示。之后对指针阵列222以及224执行“或(OR)” 逻辑运算226,来得到结果阵列232。分析完30个连续的图像画面中的每一 个之后,结果阵列232则储存于色彩地图230中。色彩区块(color block)240 为色彩地图230的一个图标范例,色彩区块240中的30列分别对应至已分析 的30个图像画面,其中白色区块代表肤色范围的像素,而黑色则不代表肤色 范围的像素。色彩区块240中在区域245附近的像素,也就是由左至右大约 从像素210至330之间的肤色像素,其呈现稳定状态时代表电视新闻主播可 能是图像画面的主题。为了得到更正确的结果,可以执行更多的分析来验证。\n一旦候选的图像区段经过识别之后,镜头检测电路32可以协助识别图像 区段何时改变。例如,镜头检测电路32可以藉由分析图像画面的色彩性质来 检测一个镜头何时由稳定地呈现电视新闻主播而切换至另一个镜头。请参阅 第5图,第5图显示检测镜头切换的示意图,藉由比较两个图像画面312和 322的图像带315和325的局部色谱曲线,来检测镜头切换。为了减少运算 的复杂度,镜头检测电路32首先检测大规模的镜头切换,一旦发现切换之后, 接着锁定较小的范围来检测切换确切的发生区域。\n第5图显示两组图像画面组310及320,在本例中,每一组图像画面310 或320皆包含30个图像画面,也就是代表一秒钟长度的图像。在每一个图像 画面组310以及320中各选出一个图像画面,为了简单起见,通常会选出第 30个图像画面来做比较。在连续选出的两个图像画面312和322中选出图像 带315及325,其中图像带315及325对应到色彩区块240中区域245的位 置,该位置即代表稳定的肤色像素。意即图像带315及325的位置也就是电 视新闻主播的头部所出现的位置。要执行第一次色谱曲线比较时,是比较连 续选出的两个图像画面312和322中的图像带315及325的色谱曲线,如果 第一次色谱曲线比较所得到的色谱曲线差系大于第一临界值,就会在30个插 入的彩色画面中,选取每一对彩色画面,对其相对应的图像带执行第二次色 谱曲线比较,以找出镜头切换发生时确切的图像画面。藉由锁定图像带315 以及325所代表的区域,本发明可以正确地处理包含分割画面的图像画面, 因为本发明仅会对该图像画面中的一部分利用色谱曲线比较法进行分析。\n在脸部肤色检测电路34以及镜头检测电路32产生候选图像片段之后, 后续处理电路36选择性地执行额外的步骤。例如可以移除影片时间少于预定 长度的片段,例如少于一秒或三秒,因为这些片段很可能没有电视新闻主播 的镜头。再者,为了统计上的目的,也可以计算包含有稳定的肤色区域的图 像画面的百分比。\n在图像处理电路30产生候选区段40之后,可以进行声音分析来提供更 多的信息,以确保更精确地检测新闻片段。某些影片镜头会显示很多脸孔, 例如群众的画面。如果这种影片数据被采用,代表检测电视新闻主播时产生 错误的结果。另一个例子,实时报导或是访问也会包含大且稳定的脸部特写。 这些时候如果不执行声音分析的话,这些画面也会被判断为电视新闻主播的 画面。\n声音数据也可以当作用来决定候选段落的主要信息,而不仅是当作图像 数据的辅助信息,如果使用可靠的声音处理技术,例如语音辨识技术,则使 用声音数据亦可获得很高的可靠度。\n请回头参阅第1图,当产生波形的统计数值之后,声音信号就变得极为 有用。基于上述的原因,非重迭位移窗口电路12将声音信号分隔成独立的 25亳秒声音区段,当然上述的时间长度可以较长或较短,25毫秒仅是本案的 一个例子。随后快速傅立叶转换(fast Fourier transform,FFT)电路14会 对声音窗口进行快速傅立叶转换,产生的结果会传递给声音能量分析电路20 来分析声音样本的能量。快速傅立叶转换电路14将声音样本转换至频域 (frequency domain),然后分析该声音样本的频率响应。声音能量分析电路 20包含有电路22、电路24以及电路26,电路22用来计算频率低于13kHz 的声音样本的能量,电路24用来计算频率介于8-13kHz的声音样本的能量, 而电路26则是用来计算声音样本的频率中心(frequency centroid)。频率中 心即为所有频谱的算数平均数,用来指示频率响应的中心点。声音能量分析 电路20中的电路22、24或26的输出随后会和图像处理电路30的输出相混 合,则可以同时处理图像分析以及声音分析。\n合适的背景能阶(background energy level)电路42是用来计算背景噪 声的能阶,背景能阶电路42是采用局部能量的最低十个的平均值,然而不一 定要取十个,可以取较多或者较少,但是利用这种平均方式可以得到较准确 的声音数据的背景噪声能阶。\n所有由声音能量分析电路20以及背景能阶电路42计算出的能阶信息接 着传递给比例计算电路50,比例计算电路50计算出各种能量比例,用来判 定接收到的声音数据的特征。电路52系用来计算背景声音能阶与全部声音能 阶之间的比例,电路54系用来计算频率落于8-13kHz之间的声音的平均声 音能阶与全部声音能阶之间的比例,电路56系用来计算目前候选区段的频率 中心的变异数。电路58系用来计算无音讯比例(silence ratio),无音讯比 例系指声音能阶低于背景声音能阶的声音段落的数目与全部声音段落之数目 比。比例计算电路50计算完电路52、54、56及58所输出的所有比例之后, 接着会将计算后的比例与多个预先确定的范围做比较。如果比例特征没有落 在上述范围中之一或更多,对应的图像段落则排除在候选的新闻段落中,其 余的段落则从比例计算电路50中输出,视为具有电视新闻主播的镜头。\n综上所述,本发明结合图像分析与声音分析来判断一个新闻片段中是否 包含有电视新闻主播。首先,执行图像分析来判断图像画面中是否有落于肤 色范围的像素,然后再判断落于肤色范围的像素的位置是否对应于电视新闻 主播的位置而呈现稳定状态。再者,利用比较色谱曲线的方法,本案可以很 快地判断出何时电视新闻主播已经没有继续出现在新闻画面上。然后再执行 声音分析来进一步缩限候选片段的数目。\n相较于其它分割新闻片段的方法,本发明具有许多优点,例如,即使图 像画面包含有两个或更多分割画面,检测电视新闻主播的方法仍然相当有效。 本发明可以利用一条水平扫描线来作分析,其运算复杂度较低,但结果较不 准确;抑或可以利用两条水平扫描线来作分析,其运算复杂度稍微较高,但 可得到较准确的结果。再者,本发明所提出的方法亦适用于同时出现一个或 一个以上的电视新闻主播的画面,而且也适用于多角度镜头。使用Lab色彩 空间来执行像素量测与比较可以更加确保本案可以有效地检测肤色范围,然 而使用Lab色彩空间不是本发明的必要手段。而且临界值也可以根据不同的 肤色或是不同的化妆应用而做调整。总之,本发明提供一种简易的计算方法 来将电视新闻节目分段。\n以上所述仅为本发明的较佳实施例,凡依本发明权利要求范围所做的均 等变化与修饰,皆应属本发明的涵盖范围。
法律信息
- 2020-07-31
未缴年费专利权终止
IPC(主分类): H04N 5/262
专利号: ZL 200510091769.X
申请日: 2005.08.17
授权公告日: 2008.09.03
- 2008-09-03
- 2007-04-18
- 2007-02-21
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
2003-12-05
| | |
2
| | 暂无 |
2003-10-15
| | |
3
| | 暂无 |
2004-02-13
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |