著录项信息
专利名称 | 基于XML的视频控制方法及其系统 |
申请号 | CN200910095483.7 | 申请日期 | 2009-01-19 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2009-07-22 | 公开/公告号 | CN101489125 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N7/24 | IPC分类号 | H;0;4;N;7;/;2;4;;;G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 孟智平 | 申请人地址 | 四川省泸州市茜草坝长起厂一生活区26号楼1号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 孟智平 | 当前权利人 | 孟智平 |
发明人 | 孟智平 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
一种基于XML的视频控制方法及其系统,包括:1)扩展MPEG-7标准中对视频流、节目、帧、层、对象的描述方案;2)定义XML视频资源描述文件格式;3)处理视频文件,创建和视频内容对应的XML视频描述文件,并基于XML视频资源描述文件,实现对视频内部资源和/或视频外部资源的控制;4)响应网页中的视频,解析对应的XML视频描述文件;5)在视频播放过程中,实现与视频的交互。本发明提供了一种基于XML的视频资源描述文件格式,并提供了一种基于XML的视频控制方法及其系统,使用户可以在观看视频过程中与视频内部的相应对象进行互动,既增强了视频的娱乐性,同时也为广告业务以及其他增值应用提供了技术支撑,具有极大的商业价值。
1.一种基于XML的视频控制方法,其特征在于:包括以下步骤:
1)参照MPEG-7标准,扩展其对视频对象的描述方案;
2)定义XML视频资源描述文件格式;
3)处理视频文件,创建和视频内容对应的XML视频资源描述文件;
4)响应网页中的视频,解析对应的XML视频资源描述文件;
5)基于所述XML视频资源描述文件,控制视频内部资源和/或视频外部资源,实现与视频交互;其中,所述视频内部资源是指视频播放器播放窗口内的所有媒体资源;所述视频外部资源是指视频播放器播放窗口外的所有资源;
所述步骤5)控制视频内部资源和/或视频外部资源,实现与视频交互包括对视频播放器所播放的视频窗口内的视频对象进行控制、在视频窗口内部打开图片、视频、音频媒体文件,还包括对视频窗口以外的资源,即打开本地或网络上的图片、视频、音频、文本文档。
2.如权利要求1所述的一种基于XML的视频控制方法,其特征在于:在所述步骤3)中,创建基于XML的视频资源描述文件包含以下内容:
(1)扩展MPEG-7标准中对视频对象的描述方案,主要包括:视频流、节目、帧、层、对象;
所述对象还包括像素点、轮廓和块;
所述轮廓还包括属性信息和事件信息;
(2)XML声明字段,该XML声明字段将描述视频资源的数据结构定义为XML文件,包括字段的标识符;所述描述视频资源的数据结构包括用于描述视频原有资源信息的字段和描述视频添加资源信息的字段;所述描述视频原有资源信息的字段包括但不限于视频ID、视频资源地址、视频文件类型、视频下方滚动字幕、视频下方滚动字幕超链接、视频名称、视频简介、确定视频是否悬浮、视频等级分类、视频作者、主要演员、视频编辑者、视频导演、字幕信息、版权、上传时间、视频信息关键字集合、视频信息关键字;所述描述视频添加资源信息的字段包括但不限于视频内部对象、视频内部对象信息、视频内部对象ID、对象第一帧缩略图位置、广告资源组合、广告位具体位置、广告资源、广告资源URL、全屏广告URL、全屏广告超链接地址、打开全屏广告超链接地址的方式、视频中某一对象出现的时长、视频中某一对象出现的开始时间、视频中某一对象出现的结束时间、视频内部对象关键字集合、视频内部对象关键字、位置点集合、位置点、时间、左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标。
3.如权利要求1所述的一种基于XML的视频控制方法,其特征在于:在所述步骤5)中,基于XML视频资源描述文件,对视频内部资源的控制是指在视频播放器播放的视频窗口内添加、创建、删除媒体资源;
所述媒体资源包括文字、图片、Flash和视频;
所述视频播放器包括IPTV、车载设备、手机和PC机中的流媒体播放器。
4.如权利要求1所述的一种基于XML的视频控制方法,其特征在于:在所述步骤5)中,基于XML视频资源描述文件,对视频外部资源进行控制是指通过解析XML视频资源描述文件,控制本地资源和/或网络资源。
5.如权利要求4所述的一种基于XML的视频控制方法,其特征在于:在所述步骤5)中,所述控制本地资源包括打开本地存储设备中存储的图片、Flash、视频、音频和文本文档;
所述控制网络资源包括根据网络地址URL,打开网络中的图片、Flash、视频、音频和文本文档。
6.一种基于XML的视频控制系统,其特征在于,包括以下设备及子系统:
视频播放设备、视频服务器、视频处理子系统、XML文件子系统和网络资源子系统;
所述视频播放设备包括播放流媒体文件的IPTV电视机、车载设备、手机、手持PDA和PC机;
所述视频服务器是指提供视频资源的网站;
所述视频播放设备,用于访问视频服务器,下载播放视频,解析XML文件子系统发送的与当前视频对应的XML文件,并根据解析XML文件的内容,调用网络资源子系统中与该视频相关的广告信息或其他相应增值信息;
所述视频处理子系统,用于对视频服务器中的视频进行编辑处理,生成描述该视频内容的XML文件,并将该XML文件传给XML文件子系统,同时将编辑过的视频传回视频服务器;
所述XML文件子系统,与视频编辑子系统进行通信,用于存储编辑处理过的视频所对应的XML文件,并对XML文件进行加密;
所述网络资源子系统,指包含与编辑处理过的视频相关的广告信息和其他相应增值信息,视频播放设备在播放视频时调用网络资源子系统中的广告信息和其他相应增值信息,实现与观看视频的用户进行互动。
基于XML的视频控制方法及其系统\n技术领域\n[0001] 本发明涉及视频控制技术领域,尤其涉及一种基于XML的视频控制方法。\n背景技术\n[0002] 随着多媒体编码、计算机多媒体处理和网络传输技术的飞速发展,互联网正逐渐成为一个巨大的视频仓库,人们越来越多地青睐于通过互联网实时查询、欣赏丰富多彩的视频信息。此外,人们也经常通过其他能够存储和播放视频的设备,如电视机、车载设备、手机、MP4等欣赏相关视频。\n[0003] 人们在欣赏视频,获得信息的同时,也对视频提出了更多的需求。即,人们希望能够在海量的视频数据中快速地找到自己所需要的视频片段,而不是象目前这样,只能按照视频标题搜索,用户再从搜索出的视频列表中进行选择并观看,在观看过程中进一步寻找所关心的片段。\n[0004] 此外,即使同一段视频,不同的人在观看时,关注视频中的对象以及欲获得该对象相关信息的敏感程度也通常各不相同。如果用户能够在欣赏视频的过程中与视频进行交互,在欣赏视频的同时,可以进一步获得感兴趣的相关对象的信息,并可以满足不同用户的需求,则具有重大意义。\n[0005] 然而,现有技术中,视频信息是一个统一的整体。传统的视频控制技术,只能通过快进或快退等顺序的方法人工查找,因而非常繁琐耗时,显然已无法满足当前用户对视频搜索的需求。在与视频进行交互方面,现有技术尚无法做到让用户对视频中的相关对象进行控制,更不能获取该对象的进一步相关信息。用户在观看视频时处于一种被动接收的状态,由于不能与视频交互,因此抑制了用户的主观能动性,使用户对视频信息几乎是盲听盲看,获得有价值信息的效率较低、效果较差。\n[0006] 要实现基于内容的视频检索以及对播放的视频内容进行控制,则必须对视频内容进行处理,向原有视频内容中添加便于检索或可以与用户进行互动的相应增值信息。该增值信息可以是视频中某一对象的相关知识,也可以是该对象产品的广告信息或新闻信息等。专利号CN200710123453.3,提供了向流媒体中加入广告信息的方法,并提出了利用广告描述文件来控制视频中播放广告的方法,当然该方法也适用于控制播放其他内容,但是其并没有对具体的描述文件进行详细介绍。\n[0007] MPEG-7虽然提供了多媒体内容描述接口,但是MPEG-7本质上其特定的元数据面向特定应用,无法适应普遍应用背景。目前网络视频数量众多,终端用户访问网络、观看视频的平台各异,因此,考虑平台无关性,需要对增值了相关信息的视频文件,以统一的格式对视频中的原有资源以及可以进行控制的资源进行描述,并能够在网页加载视频文件时,对已描述的资源文件进行解析,进而打开相应增值信息。\n发明内容\n[0008] 为了克服现有技术缺乏对视频资源描述以及对视频内部对象进行控制的不足,本发明提供一种基于XML的视频控制方法及其系统,按照XML的语法格式,以统一的方式对增值了相关信息的视频资源进行描述,并能够在播放该视频时对相应描述资源进行解析。\n[0009] 本发明解决其技术问题所采用的技术方案是:\n[0010] 本发明提供了一种基于XML的视频控制方法,包括以下步骤:\n[0011] 1)参照MPEG-7标准,扩展其对视频对象的描述方案;\n[0012] 2)定义XML视频资源描述文件格式;\n[0013] 3)处理视频文件,创建和视频内容对应的XML视频描述文件;\n[0014] 4)响应网页中的视频,解析对应的XML视频描述文件;\n[0015] 5)控制视频内部资源和/或视频外部资源,实现与视频交互。\n[0016] 所述步骤1)中扩展的视频对象包括以下部分:\n[0017] (1)视频流,是指通过网络传输,下载到本地机器缓冲区中的视频数据流,本发明中描述的视频流与MPEG-7标准中描述的视频概念不同,视频流是对视频概念进一步的结构划分,即终端用户看到的视频可以看作是由一个或多个视频流构成的;\n[0018] (2)节目,是指视频流中有逻辑联系的帧的集合,本发明中描述的节目与MPEG-7中描述的场景不同,视频流中可能含有多个节目,每个节目都是由一组相互关联的帧组合而成。\n[0019] (3)帧,是视频中的基本单元,与MPEG-7中的帧概念等同;\n[0020] (4)层,是在帧之上添加的内容,用于描述帧的一些相关特性,引入层的概念后便能够增强对帧内对象进行控制和描述的能力。\n[0021] 步骤1)中所述视频流、节目、帧和层,其共同的属性为时间;\n[0022] 所述帧中还包含多个目标对象,这些对象可以是静止的也可以是运动的,与MPEG-7中描述的对象概念相同;\n[0023] 所述层中还包括本发明添加的一些对象,这些对象不是原视频中所有的,是本发明为更好地描述视频内容和更合理地控制视频内部对象而添加的;\n[0024] 所述对象还包括像素点、轮廓和块;\n[0025] 所述像素点是指视频帧里面的某一个点,用坐标描述该像素点的位置信息;\n[0026] 所述轮廓是指视频帧中某一对象的轮廓,该轮廓是指能将对象全部元素包括进去的最小区域,而非对象具体而细致的边界区域,本发明中的轮廓形状为矩形或椭圆形,当然也可以是其他形状;\n[0027] 所述块是指轮廓里面包含的某一个封闭区域;\n[0028] 所述像素点、轮廓和块还包括相应的属性信息和事件信息,本发明中仅对轮廓的属性信息和事件信息进行论述,像素点和块的属性信息及事件信息与轮廓的属性信息和事件信息几乎等同,在此不再赘述;\n[0029] 所述轮廓属性信息包括安全性、优先级、透明性、形态、对象位置、对象运动矢量;\n[0030] 所述轮廓事件信息是指对象触发的方法;\n[0031] 所述轮廓属性信息的安全性是指信息传输过程中的安全保护措施;\n[0032] 所述轮廓属性信息的优先级是指当层中添加对象重叠覆盖时,为了区分不同对象的重要程度,以便于描述和控制相应对象而为各对象赋予的优先等级;\n[0033] 所述轮廓属性信息的透明性是指设置层中重叠覆盖的对象透明;\n[0034] 所述轮廓属性信息的形态是指层中某一对象轮廓的形态,用户可通过鼠标点击该轮廓与对象进行互动;\n[0035] 所述轮廓属性信息的对象位置是指对象的中心点或某一特征点的位置;\n[0036] 所述轮廓属性信息的对象运动矢量是指用矢量的方式描述对象的运动过程;\n[0037] 所述轮廓属性信息的安全保护措施是指DRM或CA认证;\n[0038] 所述轮廓属性信息的形态是指椭圆形或矩形;\n[0039] 所述轮廓属性信息的对象位置可以通过坐标的形式来表示;\n[0040] 所述轮廓事件信息的对象触发方法还包括对象的触发方式和对象触发后执行的功能;\n[0041] 所述对象的触发方式还包括鼠标点击时触发事件、鼠标移至对象所在轮廓区域时触发事件和自动触发事件;\n[0042] 所述对象触发后执行的功能是指触发后链接到某一URL地址,以某一种形式打开或执行相应的链接资源以及对链接资源进行分类;\n[0043] 所述对象触发后打开或执行相应资源的形式包括图片、视频或音频等;\n[0044] 所述对象触发后对链接资源进行分类是指描述对象的关键字分类,包括艺术、体育、汽车、商场等。\n[0045] 所述步骤2)XML视频资源描述文件格式包括以下内容:\n[0046] (1)定义XML视频资源描述文件文档名称;\n[0047] (2)定义视频原有资源信息元素;\n[0048] (3)定义视频控制资源信息元素;\n[0049] 所述视频资源描述文件文档名称是指XML文档的类型,位于XML声明字段之后,标识该XML文档的功能是用于对视频资源进行描述;\n[0050] 所述视频原有资源信息元素包括视频ID、视频资源地址、视频文件类型、视频下方滚动字幕、视频下方滚动字幕超链接、视频名称、视频简介、确定视频是否悬浮、视频等级分类、视频作者、主要演员、视频编辑者、视频导演、字幕信息、版权、上传时间、视频信息关键字集合、视频信息关键字;\n[0051] 所述视频ID是指为便于对视频的处理以及在视频播放过程中对其内部对象进行控制,而为某一特定视频分配的唯一ID,一个视频资源描述文件XML文档中有且只有一个视频ID;\n[0052] 所述视频资源地址是指视频资源在网络或设备中的存储位置,每一个视频ID唯一对应一个视频资源地址,该地址可以是一个网络URL地址,也可以是设备中的一个物理存储地址;\n[0053] 所述视频类型是指播放观看的视频文件的格式类型,该格式可以有很多种,比如扩展名为.flv、.avi、.wmv、.mpg等视频文件,本发明专利所给的实施例是基于Flash文件,但本发明的适用范围不局限于Flash文件,可以支持其他格式的视频文件;\n[0054] 所述视频下方滚动字幕是指在原有视频下方添加的字幕信息,使其在视频播放过程中与视频内容在同一窗口中显示,并以滚动的形式循环出现,以引起观看视频者注意,便于对其感兴趣的观看者点击该滚动字幕,查看或链接相应广告信息或其他相关信息;\n[0055] 所述滚动字幕超链接是指滚动字幕信息所定向的资源在网络或设备中的存储位置,该地址可以是一个网络URL地址,也可以是设备中的一个物理存储地址;\n[0056] 所述视频名称是指描述当前播放的视频的名称;\n[0057] 所述视频简介是指对当前视频内容的简单介绍,即该段视频内容的一个摘要信息;\n[0058] 所述确定视频是否悬浮是指判断当前视频是悬浮于网页中,还是嵌入到当前网页中;\n[0059] 所述视频等级分类是指按照电影以及其他视频的审查条例,按照制定的标准,对视频的相关内容给予的等级划分,该等级划分方法通常与各国家和地区的政策及文化等不同而有所差异;\n[0060] 所述视频作者是指当前视频的相关作者,通常是指该视频的制作者或者上传者;\n[0061] 所述主要演员是指当前视频中的主要演员信息;\n[0062] 所述视频编辑者是指对上传的原始视频,根据需要,按照一定的要求而对其进行再次编辑的工作人员,此视频编辑者可以是原始视频制作者或上传者,也可以是其他人员;\n[0063] 所述视频导演是指当前视频的导演信息;\n[0064] 所述字幕是指当前视频内容在播放过程中,为了更方便地让观看者对其内容进行理解,而给出的相应字幕信息;\n[0065] 所述版权是指当前视频的版权信息;\n[0066] 所述上传时间是指当前视频的上传时间信息;\n[0067] 所述视频信息关键字集合是指用于描述视频信息的关键字集合,该关键字集合中的关键字通常包括对视频中主要演员、关键帧、视频内容等进行描述;\n[0068] 所述视频信息关键字是指用于描述视频信息的关键字,同一视频可以用多个关键字对其进行描述;\n[0069] 所述视频控制资源信息元素包括视频内部对象、视频内部对象信息、视频内部对象ID、对象第一帧缩略图位置、广告资源组合、广告位具体位置、广告资源、广告资源URL、全屏广告URL、全屏广告超链接地址、打开全屏广告超链接地址的方式、视频中某一对象出现的时长、视频中某一对象出现的开始时间、视频中某一对象出现的结束时间、视频内部对象关键字集合、视频内部对象关键字、位置点集合、位置点、时间、左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标;\n[0070] 所述视频内部对象是指视频中的对象,该对象可以是视频中活动的对象,也可以是静止的对象,可以存在于某一特定帧中,也可以存在于连续的或不连续的帧中;\n[0071] 所述视频内部对象信息是指描述视频对象的相关信息,该描述信息存在于添加的层中,而非原始视频中,需要对原始视频进行编辑,是额外添加的描述相关对象的信息;\n[0072] 所述视频内部对象ID是指用来唯一地标识视频中的具体对象,以便于通过该对象ID来辨识该对象,进而对其进行查询或相应控制;\n[0073] 所述对象第一帧缩略图位置是指描述某一对象在视频中出现的第一帧的缩略图的URL,该位置可以是一个网络地址,也可以是设备中的某个存储地址,通过访问该地址,调用帧的缩略图;\n[0074] 所述广告资源组合是指一个对象所对应的一个广告资源组合,通常一个对象对应的广告资源组合可以有一种或几种,在具体实施时可以根据需要进行选择,但最终一个对象只能对应一个广告资源组合;\n[0075] 所述广告位具体位置是指描述对象对应的广告位的具体出现位置属于哪一种,一个对象可以有一种或几种广告位形式,用户可以根据投放广告的需要来定制其中的一种或几种形式同时存在;\n[0076] 所述广告资源是指每一个广告位所对应的广告资源,即该广告位下投放的广告内容的来源,通常一个广告位对应一个广告资源;\n[0077] 所述广告资源URL是指描述广告位中广告资源的URL,该URL可以是一个网络地址,也可以是设备中的某个存储地址;\n[0078] 所述全屏广告URL是指视频全屏广告位对应的广告资源的URL,该URL可以是一个网络地址,也可以是设备中的某个存储地址;\n[0079] 所述全屏广告超链接地址是指描述视频中全屏广告对应的超链接地址,该地址可以是一个网络地址,也可以是设备中的某个存储地址;\n[0080] 所述打开全屏广告超链接地址的方式是指描述打开全屏广告超链接地址的方式,打开方式包括在视频外广告位打开超链接和在新窗口打开超链接等;\n[0081] 所述视频中某一对象的广告时长是指当视频中某一对象出现时,同时播放该对象相应的广告信息,广告的时长通常从该对象出现时起至下一对象出现时止;\n[0082] 所述视频中某一对象出现的开始时间是指某一对象所在的第一帧的播放时间;\n[0083] 所述视频中某一对象出现的结束时间是指某一对象所在帧的结束时间,该所在帧是指对象所在的最后一帧;\n[0084] 所述视频内部对象关键字集合是指描述视频对象的关键字集合,一个视频中一个对象对应一个关键字集合,该关键字集合是通过对原始视频进行编辑,在层中添加的信息;\n[0085] 所述视频内部对象关键字是指描述某一对象的关键字,该关键字可以有多个,便于通过关键字对视频中的对象进行查询和控制;\n[0086] 所述位置点集合是指对某一对象运动过程中关键位置点集合的描述,通常是指一个视频中对象运动的关键时间以及关键区域的集合;\n[0087] 所述位置点是指对象运动过程中某一关键位置点描述,通常是指一个视频中对象运动的关键时间以及关键区域;\n[0088] 所述时间是指对象运动过程中的某一关键时间点;\n[0089] 所述左上角横坐标是指描述对象所在区域左上角的关键点横坐标;\n[0090] 所述左上角纵坐标是指描述对象所在区域左上角的关键点纵坐标;\n[0091] 所述右下角横坐标是指描述对象所在区域右下角的关键点横坐标;\n[0092] 所述右下角纵坐标是指描述对象所在区域右下角的关键点纵坐标。\n[0093] 所述步骤3)处理视频文件,创建和视频内容对应的XML视频描述文件是指对某一Flash文件或其他视频文件进行编辑处理,按照步骤2)定义的XML视频描述文件格式的要求,通过提取数据库字段,生成XML文件,创建与Flash或其他视频内容相对应的XML视频描述文件,实现对视频内部资源和/或视频外部资源进行控制;\n[0094] 所述通过提取数据库字段,生成XML文件的方法,包括:检索数据库,查找相应记录信息,从检索到的记录中,提取相应字段信息,所述字段信息即为XML文件中的字段信息,生成XML文件;\n[0095] 所述视频内部资源是指视频播放器播放窗口内的所有媒体资源;\n[0096] 所述视频外部资源是指视频播放器播放窗口外的所有资源;\n[0097] 所述实现对视频内部资源的控制是指在视频播放器播放的视频窗口内添加、创建、删除媒体资源;\n[0098] 所述媒体资源包括文字、图片、Flash和视频;\n[0099] 所述视频播放器包括IPTV、车载设备、手机和PC机中的流媒体播放器;\n[0100] 所述实现对视频外部资源进行控制是指通过解析XML视频资源描述文件,控制本地资源和/或网络资源;\n[0101] 所述控制本地资源包括打开本地存储设备中存储的图片、Flash、视频、音频和文本文档;\n[0102] 所述控制网络资源包括根据网络地址URL,打开网络中的图片、Flash、视频、音频和文本文档。\n[0103] 所述步骤4)响应网页中的视频,解析对应的XML视频描述文件是指当网页中加载并播放经过处理的某一Flash文件或其他视频文件时,该视频在播放过程中可以对步骤3)中创建的与该视频内容息息相关的XML视频描述文件进行解析,网页中的播放器需要具有解析XML视频描述文件的功能,而非常规视频播放器。\n[0104] 所述步骤5)控制视频内部资源和/或视频外部资源,实现与视频交互包括对视频播放器所播放的视频窗口内的视频对象进行控制、在视频窗口内部打开图片、视频、音频等媒体文件,还包括对视频窗口以外的资源,即打开本地或网络上的图片、视频、音频、文本文档等。\n[0105] 一种基于XML的视频控制系统,其特征在于,包括以下设备及子系统:\n[0106] 视频播放设备、视频服务器、视频处理子系统、XML文件子系统和网络资源子系统;\n[0107] 所述视频播放设备包括播放流媒体文件的IPTV电视机、车载设备、手机、手持PDA和PC机;\n[0108] 所述视频服务器是指提供视频资源的网站;\n[0109] 所述视频播放设备可以访问视频服务器,下载播放视频,解析XML文件子系统发送的与当前视频对应的XML文件,并根据解析XML文件的内容,调用网络资源子系统中与该视频相关的广告信息或其他相应增值信息;\n[0110] 所述视频处理子系统可以对视频服务器中的视频进行编辑处理,生成描述该视频内容的XML文件,并将该XML文件传给XML文件子系统,同时将编辑过的视频传回视频服务器;\n[0111] 所述XML文件子系统与视频编辑子系统进行通信,存储编辑处理过的视频所对应的XML文件,并对XML文件进行加密;\n[0112] 所述网络资源子系统是指包含与编辑处理过的视频相关的广告信息和其他相应增值信息,视频播放设备在播放视频时可以调用网络资源子系统中的广告信息和其他相应增值信息,实现与观看视频的用户进行互动。\n[0113] 本发明的有益效果主要包括:\n[0114] (1)本发明参照MPEG-7标准,对视频对象描述进行了扩展,丰富了视频资源描述信息,使现有的视频资源信息得到了进一步的增值,并增强了现有视频文件在播放过程中与用户的互动功能;\n[0115] (2)本发明采用XML统一了视频资源描述文件的格式,规范了视频资源内容的描述,且使其具有与平台无关的特性,使基于XML的视频资源描述文件应用性更强、更广;\n[0116] (3)本发明提供了一种基于XML的视频控制方法及其系统,使用户可以在观看视频过程中与视频内部的相应对象进行互动,既增强了视频的娱乐性,又使用户获得了更多有价值的信息,同时也为广告业务以及其他增值应用提供了技术支撑,具有极大的商业价值。\n附图说明\n[0117] 图1是本发明中系统架构图;\n[0118] 图2是本发明中技术方案流程示意图;\n[0119] 图3是本发明中对MPEG-7视频描述方案扩展部分示意图。\n具体实施方式\n[0120] 请将申请文件中的“用户终端”、“终端用户”统一说法\n[0121] 下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。\n[0122] 本发明的基本构思为:根据对视频内容检索以及对视频内部对象进行控制的需求,首先对MPEG-7的标准进行分析,扩展视频对象描述方案,然后采用XML文档,对视频及其相应资源按照统一的格式进行描述,规范描述视频对象的格式,便于对编辑处理后的视频内容以XML文件格式进行描述存储,当网页中加载并播放处理过的视频文件时,可以对该XML视频描述文件进行解析,并利用相应脚本语言,如JavaScript、VBScript、Perl等,与视频间进行通信,以响应用户的相应操作,实现对视频中对象的控制。\n[0123] 图1是本发明的系统架构图,其中视频服务器是指互联网中提供视频的网站,如美国的YouToBe网,中国的土豆网、优酷网等,视频处理子系统是指能够对上述视频网站中的视频以及其他视频进行编辑处理并能够添加相应增值服务功能的视频处理系统。视频处理子系统与视频网站通过110进行互操作,视频处理子系统可以对视频网站中的视频进行编辑处理,添加相应广告信息或其他增值信息,同时为每一个处理过的视频分配唯一的ID,并通过160和170与XML文件子系统进行通信,将生成的XML视频描述文件传给XML文件子系统,当用户通过120访问视频网站,选中某一视频时,视频网站则通过130将该视频下载到用户的本地缓冲区中,终端用户浏览器中的视频播放器在播放该视频时,会根据视频ID通过140访问XML文件子系统,XML文件子系统经过审核验证后,通过150将该视频ID对应的XML视频描述文件传递给终端用户,终端用户的视频播放器解析XML视频描述文件,并通过180和190与网络资源子系统进行通信,调用网络资源子系统提供的广告信息或其他增值信息,实现在用户观看视频的过程中与用户进行互动的功能。\n[0124] 本发明的重点是基于XML的视频控制方法,图2是本发明的技术方案流程示意图。\n其中,扩展视频描述方案210是指对MPEG-7视频描述方案进行扩展,其扩展部分见图3所示。\n[0125] 对MPEG-7的视频描述方案扩展后,本发明采用XML对视频的相关资源进行描述,即步骤220,提供了一种以统一的格式描述视频资源且与平台无关的方法。本发明是可扩展的,提供了使任何接收计算机能够读取该通用、统一格式化的XML文件。该XML视频资源描述文件见表1所示。\n[0126] 图1中处理视频文件230对视频文件进行处理,即打开视频文件,记录下视频中具体对象的描述信息,该描述信息至少包括具体对象的关键字信息、对象的开始播放和结束信息、对象在帧中的位置信息、区域信息等等,并为每一个处理过的视频文件分配唯一的视频ID;\n[0127] 图1中创建XML视频描述文件240是指将编辑处理过的视频文件内容,按照XML视频描述文件的格式要求进行相应地描述,并为每一个视频创建唯一一个XML视频描述文件,即一个视频ID对应一个XML视频描述文件;\n[0128] 图1网页中加载并播放处理过的视频250是指编辑者将某一视频进行编辑处理后上传或交付给某一视频网站,当用户浏览某一视频网站,通过对视频内容进行搜索后,可找到与搜索内容相关的视频,当用户点击某视频,在一网页中打开该视频时,网页中便会加载并播放之前处理过的某一视频文件;\n[0129] 图1中检测到XML视频描述文件260是指当网页中加载并播放处理过的视频文件后,在播放该视频的过程中,嵌入有解析XML文件功能的视频播放器会根据该视频ID对相应资源信息进行检测,如果检测到有相关XML视频描述文件信息,则播放器将对该XML视频描述文件进行解析,如果没有检测到,则播放器继续播放当前视频流;\n[0130] 图1中解析XML视频描述文件270是指嵌入有解析XML文件功能的视频播放器在播放视频过程中,检测到XML视频描述文件后,对XML视频描述文件中的相关信息进行解析,实现XML视频描述文件中相应的视频描述功能,将此功能在播放视频的过程中实时地展现给用户,以便用户与视频进行交互;\n[0131] 图1中实现与用户交互功能280是指嵌入有解析XML文件功能的视频播放器对XML视频描述文件进行解析后,为了更加友好地与用户之间进行互操作,通常通过某一网页脚本语言,如JavaScript,VBScript,Perl等在网页和视频播放器之间进行通信,响应用户的鼠标或键盘激发的事件,实现与用户间的互动,以满足用户查看视频内部相关对象的广告信息或其他增值信息。\n[0132] 图3为本发明对MPEG-7视频描述方案的扩展部分,其中实线框表示MPEG-7原有描述,虚线框为本发明的扩展。为了能够对多媒体进行更好的描述,本发明首先将多媒体\n310抽象为流320,即将用户终端看到的视频看作是由多源的视频流构成的。例如,某一终端用户的有线电视可以收看56个频道,传统的多媒体描述方案是将这56个频道做为一个整体进行描述,本发明提出的视频流可以将56个频道看成是56个视频流在同一通信线路内传输,因此,引入视频流的概念则具有层次性,在后续的一些高级操作中便可以分层来处理。\n[0133] 图3中节目330则可以理解为某一视频流中有逻辑联系的帧的集合,该视频流中可能含有多个节目,每个节目都是由一组相互关联的帧组合而成。\n[0134] 图3中帧340即是视频中的帧,这一概念与MPEG-7中的帧的概念等同;\n[0135] 图3中层350是在帧之上添加的内容,用于描述帧的一些相关特性,引入层的概念后便能够增强对帧内对象进行控制和描述的能力;\n[0136] 图3中对象351既可以指原视频中的对象,这些对象可以是静止的,也可以是运动的,与MPEG-7中描述的对象概念相同;也可以指本发明添加的一些对象,这些对象不是原视频中所有的,是本发明为更好地描述视频内容和更合理地控制视频内部对象而添加的;\n[0137] 图3中对象351还包含一些属性信息和事件信息,本发明即是通过对对象的属性信息和事件信息进行操作,以实现对视频内部对象进行控制的功能。\n[0138] 表1为本发明提出的XMl视频资源描述文件,可以根据表1中的说明,对相应的视频资源进行描述。\n[0139] 表1XML视频资源描述文件\n[0140] \n 字段 语法/说明 注释\n <?xml version=″1.0″>\n 每个文件只有\n XML声明 用来将文件定义为XML文档。此XML声明位于文\n 一个\n 件的第一行,用来将文件标识为XML文件。\n 每个文件只有\n XML文档
一个,总是在\n 类型 用来定义VXPLO文档的开始 XML声明之\n 后。\n \n 每个VXPLO\n 视频信息 包含描述视频的相关资源信息\n 文件一个\n 每个VXPLO\n \n 视频ID 记录一个视频\n 视频ID被用来唯一地标识欲控制的视频\n ID\n 视频资源 每个视频ID\n 地址 描述视频资源在网络或设备中的存储位置 对应一个URL\n 该格式可以多\n \n 视频类型 种,如\n 描述视频文件的格式类型\n flv,avi,wmv等\n 该滚动字幕通\n 视频下方 常为视频相关\n 滚动字幕 外部加入的滚动字幕 内容的广告信\n 息\n 点击该链接则\n 滚动字幕 能够查看相关\n 超链接 链接\n 信息\n \n 视频名称 每个视频ID\n 描述该视频的名称\n 对应一个视频\n Title\n \n 视频简介 可选字段\n 用于对视频内容进行简单介绍\n 确定视频 其值为True或\n 是否悬浮 判断视频是否悬浮于网页中 False\n 各国家或地区\n 视频等级 政策不同,划\n 分类 描述视频的等级分类 分视频的等级\n 也不相同\n \n 视频作者 可选字段\n 作者信息,视频制作者或上传者\n \n 主要演员 可选字段\n 视频中主要演员信息\n 视频编辑 \n 可选字段\n 者 对上传视频进行再加工编辑者\n \n 视频导演 可选字段\n 导演信息\n 方便观看者理\n 字幕\n 视频对应的字幕信息 解视频内容\n \n 版权 可选字段\n 版权信息\n \n 上传时间 可选字段\n 视频上传时间信息\n 视频信息 每个视频ID\n \n 关键字集 对应一个关键\n 用于描述视频信息的关键字集合\n 字集合\n 合\n 每个视频ID\n 视频信息 可以有多个关\n 关键字 用于描述视频信息的关键字\n 键字\n 视频信息\n 关键字集 视频信息关键\n 合结尾定 用于定义视频信息关键字集合的结尾 字集合结尾\n 界符\n 视频信息\n 视频信息字段\n 结尾定界\n 用于定义视频信息字段的结尾 结尾\n 符\n 每个VXPLO\n 视频内部 \n 文档对应一个\n 对象集合 描述视频帧中连续对象的集合\n 集合\n 视频内部 - \n 可以有多个\n 对象 视频帧中的对象\n 视频内部 \n 对象信息 描述视频内部对象的相关信息\n 一个item对应\n 对象ID\n 对象ID被用来唯一地标识视频中的具体对象 一个ID\n 对象第一\n 一个item对应\n 帧缩略图\n 描述对象出现的第一帧的缩略图的URL 一个URL\n 位置\n 一个对象可以\n 广告资源 有一种或几种\n 组合 一个对象对应的一个广告资源组合\n 广告资源\n 一个对象可以\n 广告位具 有一种或几种\n 体位置 描述广告位的具体出现位置属于哪一种\n 广告位形式\n 一个广告位对\n 描述每一种广告位对应的广告资源\n 广告资源 应一种广告资\n 源\n 广告资源 一个广告位对\n URL 描述广告位中广告资源的URL 应一种广告资\n 源URL\n 一个广告位对\n 全屏广告 \n 应一种广告资\n URL 视频全屏广告位对应的广告资源的URL\n 源的URL\n 全屏广告 一个广告位对\n \n 超链接地 应一个超链接\n 描述视频中全屏广告对应的超链接地址\n 址 地址\n 打开方式包括\n 打开全屏\n 在视频外广告\n 广告超链 \n 接地址的 描述打开全屏广告超链接地址的方式 位打开超链接\n 和在新窗口打\n 方式\n 开超链接\n 默认为0表示\n 对象的广 广告时长为从\n 告时长 描述某一对象的广告时长 前一对象至下\n 一对象\n 所在帧为对象\n 开始时间\n 某一对象所在帧的播放时间 的第一帧\n 所在帧为对象\n 结束时间\n 某一对象所在帧的结束时间 的最后一帧\n 位置结尾 \n 定界符 描述位置结尾 位置结尾\n 视频内部 一个视频中一\n \n 对象关键 个对象对应一\n 描述视频对象的关键字集合\n 字集合 个关键字集合\n 视频内部\n \n 对象关键 可以多个\n 对象关键字\n 字\n 视频内部\n 视频内部对象\n 对象关键 关键字集合结\n 字集合结 描述视频内部对象关键字集合结尾\n 尾\n 尾定界符\n 描述一个视频\n 位置点集 中对象运动的\n 对象运动过程中关键位置点集合的描述 关键时间以及\n 合\n 关键区域集合\n 描述一个视频\n 中对象运动的\n 位置点\n 对象运动过程中某一关键位置点描述 关键时间以及\n 关键区域\n 通过多个关键\n 时间点来记录\n 时间\n 对象运动过程中的某一关键时间点 对象一段时间\n 内的运动\n 左上角横 一个关键时间\n 坐标 描述对象所在区域左上角的关键点横坐标 点对应一个\n 左上角纵 一个关键时间\n 点对应一个\n 坐标 描述对象所在区域左上角的关键点纵坐标\n 右下角横 一个关键时间\n 点对应一个\n 坐标 描述对象所在区域右下角的关键点横坐标\n 右下角纵 一个关键时间\n 点对应一个\n 坐标 描述对象所在区域右下角的关键点纵坐标\n 位置点结 一个关键时间\n 尾定界符 描述位置点的结尾 点对应一个\n 位置点集\n 一个item对应\n 合结尾定\n 描述位置点集合的结尾 一个\n 界符\n 视频对象\n 内部信息 一个item对应\n 结尾定界 描述视频对象内部信息的结尾 一个\n 符\n 视频内部\n
每个items中\n 对象结尾\n 描述视频内部对象的结尾 可以有多个\n 定界符\n 视频内部\n 对象集合 每个vxplo文\n 结尾定界 描述视频内部对象集合的结尾 档一个\n 符\n 每个文件只有\n XML文档 一个,总是在\n 类型结尾 用来定义VXPLO文档的结尾\n 文件的结尾。\n[0141] 本发明以控制某一视频中的小猫为例,说明基于XML的视频控制方法。按照本发明的技术方案操作步骤,首先对该Flash视频文件进行编辑处理,为其分配一个ID,该ID号为60,同时记下该视频文件的URL地址http://demo.tvtran.com/movies/新闻/一只会跳恰恰的猫.flv,视频文件格式flv,视频标题,关键字等信息;然后对处理的视频内部不同对象分配相应的ID,该对象对应的广告信息或其他增值信息的来源,对象的开始时间、结束时间,对象的位置信息等等;最后,根据处理后的视频信息,创建以下XML视频资源描述文件,用户在观看视频过程中,视频播放器可以通过解析以下XML视频资源描述文件,实现相应视频的增值功能,进而能与用户进行互动,即用户可以对视频的内部对象进行控制。\n[0142] 视频一只会跳恰恰的猫XML视频资源描述文件代码:\n[0143] <?xml version=″1.0″encoding=″UTF-8″?><!--XML版本号-->[0144]
<!--定义该XML文档类型为vxplo-->\n[0145] <!--描述视频基本信息-->\n[0146] 60<!--为当前视频分配唯一ID号-->\n[0147] http://demo.tvtran.com/movies/新闻/一只会跳恰[0148] 恰的猫.flv\n[0149] flv<!--描述当前视频文件格式为Flash[0150] 文件-->\n[0151] 一只会跳恰恰的猫<!--描述滚[0152] 动字幕-->\n[0153] \n[0154] 一只会跳恰恰的猫<!--描述视频标题-->[0155] 视频:一只会跳恰恰的猫\n[0156] false<!--描述视频是否悬浮[0157] 于网页中-->\n[0158] 1<!--描述视频等级-->\n[0159] 张强\n[0160] 猫咪\n[0161] 视加\n[0162] 视加\n[0163] \n[0164] 上海视加信息科技有限公司\n[0165] 2008.11.2\n[0166] \n[0167] 会跳恰恰的猫\n[0168] \n[0169] <!--描述视频基本信息结束-->\n[0170] <!--视频内部控制对象集合-->\n[0171] - <!--视频内部某一控制对象-->\n[0172] <!--描述视频内部某一控制对象相关信息-->[0173] 208<!--视频内部控制对象ID号-->[0174] http://demo.tvtran.com/upload/60/kht 094453.jpg[0175] 2<!--视频内部控制对象对应广告资[0176] 源组合方案-->\n[0177] 1<!--广告位位置类型-->[0178] \n[0179] http://www.tvtran.com/cat.htm[0180] 0\n[0181] 13.453<!--对象出现的开始时间[0182] -->\n[0183] 23<!--对象的结束时间-->\n[0184] \n[0185] \n[0186] 跳舞<!--描述对象信息的关键词-->[0187] \n[0188] <!--描述视频内部某一控制对象相关信息结束[0189] -->\n[0190]
<!--描述视频内部某一控制对象结束-->\n[0191] - \n[0192] \n[0193] 209\n[0194] http://demo.tvtran.com/upload/60/kht_094453.jpg[0195] 1\n[0196] 3\n[0197] \n[0198] http://www.tudou.com/programs/view/XWv0CDyivVs/<[0199] /video_url>\n[0200] \n[0201] NewWindow[0202] 0\n[0203] 13.453\n[0204] 23\n[0205] \n[0206] \n[0207] 跳舞\n[0208] \n[0209] \n[0210]
\n[0211] - \n[0212] \n[0213] 207\n[0214] http://demo.tvtran.com/upload/60/csz_094453.jpg[0215] 2\n[0216] 3\n[0217] \n[0218] http://www.tudou.com/programs/view/Lp-mrJI4nso/\n[0220] \n[0221] NewWindow[0222] 0\n[0223] 5.407\n[0224] 15\n[0225] \n[0226] \n[0227] 恰恰\n[0228] \n[0229] <!--对象运动过程中关键位置点集合-->\n[0230] <!--对象运动过程中关键位置点-->\n[0231] <!--对象运动过程中某一关键时间点\n[0232] -->\n[0233] 10<!--对象所在区域左上角关键点横坐标-->\n[0234] 10<!--对象所在区域左上角关键点纵坐标-->\n[0235] 20<!--对象所在区域右下角关键点横坐标-->\n[0236] 20<!--对象所在区域右下角关键点纵坐标-->\n[0237] \n[0238] \n[0239] \n[0240] 20\n[0241] 20\n[0242] 30\n[0243] 30\n[0244] \n[0245] \n[0246] \n[0247] 100\n[0248] 100\n[0249] 110\n[0250] 110\n[0251] \n[0252] \n[0253] \n[0254]
\n[0255] <!--视频内部控制对象集合结束-->\n[0256] <!--类型为vxploXML文档结束-->。
法律信息
- 2012-02-15
- 2010-06-02
实质审查的生效
IPC(主分类): H04N 7/24
专利申请号: 200910095483.7
申请日: 2009.01.19
- 2009-07-22
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-06-25
|
2007-12-18
| | |
2
| |
2008-08-20
|
2008-03-11
| | |
3
| |
2005-08-31
|
2003-04-25
| | |
4
| |
2008-04-09
|
2007-11-12
| | |
5
| | 暂无 |
2006-08-31
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2013-02-27 | 2013-02-27 | | |