著录项信息
专利名称 | 一种重要新闻事件检测和摘要的方法 |
申请号 | CN200510084213.8 | 申请日期 | 2005-07-18 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2005-12-21 | 公开/公告号 | CN1710563 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 北大方正集团有限公司;北京北大方正技术研究院有限公司;北京大学计算机科学技术研究所 | 申请人地址 | 北京市海淀区成府路298号方正大厦;北京市海淀区成府路298号方正大厦;北京市海淀区成府路298号方正大厦
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北大方正集团有限公司,北京北大方正技术研究院有限公司,北京大学计算机科学技术研究所 | 当前权利人 | 北大方正集团有限公司,北京北大方正技术研究院有限公司,北京大学计算机科学技术研究所 |
发明人 | 彭宇新;吴於茜;陈晓欧 |
代理机构 | 北京英赛嘉华知识产权代理有限责任公司 | 代理人 | 田明;王达佐 |
摘要
本发明属于视频分析和检索技术领域,具体涉及一种重要新闻事件检测和摘要的方法。现有的视频摘要方法主要是针对一段视频进行摘要,但如何在多个电视台或电视频道的新闻视频数据库里,自动检测重要新闻,并按照重要度从高到低形成用户指定时间的新闻摘要,现有技术并没有涉及。本发明首先使用视频事件相似度的度量方法,计算出新闻视频库里所有新闻事件的相似度;然后,使用聚类算法,把同一新闻事件的不同报道分割为一个个聚类;最后,根据每个事件聚类中的成员数目及播报的频道和时间,自动检测重要新闻事件,并按照重要度高低,形成用户指定时间的新闻摘要。实践结果表明,本发明能够有效检测重要新闻并形成相应的新闻摘要。
1.一种重要新闻事件检测的方法,包括以下步骤:(1)计算出新闻视频库里所有新闻事件的相似度;(2)根据新闻事件的相似度,采用聚类算法,把所有新闻事件分割为一个个新闻事件聚类;(3)基于上述得到的事件聚类,根据聚类中的成员数目及播报的频道和时间信息,检测出新闻中的重要事件。
2.如权利要求1所述的一种重要新闻事件检测的方法,其特征在于:步骤(1)中,首先进行镜头边界检测,把新闻视频库中的每个新闻事件分割为镜头;然后把每对相似镜头的相似值作为权值赋给G=(X,Y,E}的每条边,这时的G就转化为一个带权的二分图,其中,X和Y表示两个新闻事件,E表示事件X和Y中每对镜头的相似值,使用图论的最优匹配算法,计算两个新闻事件X和Y的相似度为SimOM(X,Y)=ωOM(X,Y)min(p,q)--(1)]]>其中,ωOM(X,Y)是在最优匹配算法以后得到的总权值,p和q表示事件X和Y的镜头数目,min(p,q)表示取p和q中的最小值。
3.如权利要求2所述的一种重要新闻事件检测的方法,其特征在于:步骤(1)中,使用时空切片算法进行镜头边界检测。
4.如权利要求2所述的一种重要新闻事件检测的方法,其特征在于:步骤(1)中,计算两个新闻事件X和Y的相似度时,采用的图论的最优匹配算法是Kuhn-Munkres算法。
5.如权利要求1或4所述的一种重要新闻事件检测的方法,其特征在于:步骤(2)中,采用的聚类算法如下:给定新闻视频库中的所有事件,把所有事件之间的相似度建模为一个带权图G=(V,E),其中,V是新闻事件的集合,E是边的集合,表示新闻事件之间的相似度,本发明分解G为一个个子图,分解的原则是最小化聚类里的距离,同时最大化聚类间的距离,基于这个原则,本发明采用了标准化分割算法,循环地分解G为事件的聚类,标准化分割算法可以全局优化地分割G为两个不相邻的集合A和B,这是通过最小化下列公式实现的:Ncut(A,B)=cut(A,B)volume(A)+cut(A,B)volume(B)---(2)]]>其中cut(A,B)=ΣX∈A,Y∈BSimOM(X,Y)---(3)]]>volume(A)=ΣX∈A,Y∈VSimOM(X,Y)---(4)]]>volume(B)=ΣX∈B,Y∈VSimOM(X,Y)---(5)]]>cut(A,B)是集合A中的事件和集合B中事件相似度的总和,volume(A)是集合A和集合V中事件相似度的总和,volume(B)是集合B和集合V中事件相似度的总和,SimOM(X,Y)是指公式(1),表示事件X与事件Y的相似度,公式(2)可以表示为:D-12(D-W)D-12z=λz---(6)]]>其中,D和W是|V|×|V|的矩阵,D是一个对角阵,D(X,Y)=Σy∈VSimOM(X,Y),]]>W是一个对称阵,W(X,Y)=SimOM(X,Y),在公式(6),对应第二小特征值的特征向量被用于找到集合A和B,0被选择作为分割点,分割特征向量成为对应集合A和B的两个部分,上述算法被循环使用,直到某个聚类里所有事件相似度的平均值小于μ+ασ,μ和σ分别是图G中所有事件相似度的均值和方差,α是一个试验参数。
6.如权利要求5所述的一种重要新闻事件检测的方法,其特征在于:步骤(3)中,检测重要新闻事件使用下面两个规则:(A)聚类大小规则:即一个事件播报次数的多少决定它是否是重要事件,根据用户指定的摘要时间,按照事件聚类成员的数目,从高到低选择重要事件;(B)播报的频道和时间规则:即如果几个事件聚类中的成员数目一样,则不同电视频道播报的事件,比仅仅一个频道播报的事件重要;和在不同时间段播报的同一事件,比仅仅一天的某一个时间播报的事件重要。
7.如权利要求1所述的一种重要新闻事件检测的方法,其特征在于:步骤(3)中,检测重要新闻事件使用下面两个规则:(A)聚类大小规则:即一个事件播报次数的多少决定它是否是重要事件,根据用户指定的摘要时间,按照事件聚类成员的数目,从高到低选择重要事件形成新闻摘要;(B)播报的频道和时间规则:即如果几个事件聚类中的成员数目一样,则不同电视频道播报的事件,比仅仅一个频道播报的事件重要;和在不同时间段播报的同一事件,比仅仅一天的某一个时间播报的事件重要。
8.一种重要新闻事件摘要的方法,包括以下步骤:(1)计算出新闻视频库里所有新闻事件的相似度;(2)根据新闻事件的相似度,采用聚类算法,把所有新闻事件分割为一个个新闻事件聚类;(3)基于上述得到的事件聚类,根据聚类中的成员数目及播报的频道和时间信息,检测出新闻中的重要事件;(4)通过聚类中的代表事件来表示检测到的重要事件,并在选择的重要事件聚类C中,选择一个代表事件作为重要新闻摘要。
9.如权利要求8所述的一种重要新闻事件摘要的方法,其特征在于:步骤(4)在选择的重要事件聚类C中,选择一个代表事件作为新闻摘要的方法如下:选择在事件聚类中的中心点即中心事件作为该聚类的代表事件,所述的中心事件M。是在该聚类中和所有其它事件的相似度的和是最大的事件,如下列公式所示:Mc=maxx∈C{Σy∈CSimOM(x,y)}---(7)]]>其中,Mc表示选取的中心点即中心事件,max表示取最大值,C表示选择的重要事件聚类,SimOM(X,Y)表示两个事件X和Y的相似度。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2010-11-16 | 2010-11-16 | | |
2 | | 2013-06-05 | 2013-06-05 | | |
3 | | 2006-02-14 | 2006-02-14 | | |
4 | | 2015-02-06 | 2015-02-06 | | |
5 | | 2006-10-11 | 2006-10-11 | | |