1.一种用于在本地视频会议端点(20)和一个或多个远程视频会议端点(12)之间的视频会议期间控制在远程视频会议端点(12)处的一个或多个远程摄像机(21)的操作的触摸屏遥控器(40),其中,所述本地视频会议端点(20)包括具有用于与所述触摸屏遥控器(40)通信的装置的本地编解码器(23),所述触摸屏遥控器(40)包括触摸屏显示器(41)和计算机(43),该触摸屏遥控器(40)的特征在于所述计算机(43)被配置为:
从所述本地编解码器(23)接收标识所述视频会议中的一个或多个远程视频会议端点(12)的一个或多个端点ID;
生成包括用于每个端点ID的作为视频会议场景的部分的至少一个图形对象的图形用户界面GUI,所述图形对象用于控制在相应的远程视频会议端点(12)处的至少一个远程摄像机的至少一个设置;
在所述触摸屏显示器(41)上显示所述GUI;
响应于应用于显示所述至少一个图形对象的所述触摸屏显示器的一部分的输入而接收来自所述触摸屏显示器(41)的触摸数据,并且标识对应于应用所述输入的显示在所述触摸屏显示器的一部分的图形对象的所选择端点ID;
将所接收的触摸数据与多个摄像机控制指令中的至少一个相关联,所述摄像机控制指令用于控制由所选择端点ID标识的远程视频会议端点处的至少一个远程摄像机的至少一个设置;以及
将至少一个摄像机控制指令和所选择端点ID发送到所述本地编解码器(23),其中基于所选择端点ID来发送摄像机控制指令。
2.根据权利要求1所述的触摸屏遥控器,其中,所述图形对象包括来自各个远程视频会议端点(12)的视频流。
3.根据权利要求1所述的触摸屏遥控器,其中
所述本地编解码器(23)包括视频转换器单元(49),该视频转换器单元被配置为从两个或更多远程视频会议端点(12)接收会议视频流,处理所述流,并输出降低了分辨率和/或帧率的相应一组视频流;并且
所述计算机(43)被配置为接收所述一组视频流并且在所述GUI中显示所述一组视频流中的一个或多个。
4.根据权利要求1所述的触摸屏遥控器,其中,所述计算机(43)还被配置为生成所述GUI的单独控制区域,所述控制区域包括操纵杆图标,
基于图像对象相对于所述触摸屏显示器(41)上的初始默认位置的位置和距离来指定摄像机控制指令。
5.根据权利要求1所述的触摸屏遥控器,其中,所述计算机(43)还被配置为基于在所述图形对象之一上应用的手势来指定摄像机控制指令。
6.根据权利要求1所述的触摸屏遥控器,对于捏紧或松放手势指定放大或缩小摄像机控制指令。
7.根据权利要求1所述的触摸屏遥控器,对于所述触摸屏上相应方向的触摸和拖拽手势指定定向移动摄像机控制指令。
8.根据权利要求3所述的触摸屏遥控器,其中
所述计算机(43)或本地编解码器包括用于在所述会议视频流或所述一组视频流中的视频流中定位面部的面部检测单元;并且
其中,所述计算机(43)还被配置为基于用户触摸数据和所述定位的面部,生成对于由用户经由所述GUI和触摸屏显示器(41)标识的参加者进行放大的摄像机控制指令。
9.一种用于在包括本地编解码器(23)的本地视频会议端点(20)和若干远程视频会议端点(12)之间的视频会议期间控制在远程视频会议端点(12)处的一个或多个远程摄像机(21)的操作的方法,其中所述远程视频会议端点(12)包括监视器(24)和能够进行摇动、倾斜或缩放中至少一者的至少一个远程摄像机(21),所述方法包括以下步骤:
提供触摸屏遥控器(40)以及所述遥控器(40)和本地编解码器(23)之间的通信链路,其特征在于在所述遥控器(40)处:
从所述本地编解码器(23)接收标识所述视频会议中的一个或多个远程视频会议端点(12)的一个或多个端点ID;
生成包括用于每个端点ID的作为视频会议场景的部分的至少一个图形对象的图形用户界面GUI,所述图形对象用于控制在相应的远程视频会议端点(12)处的至少一个远程摄像机的至少一个设置;
在触摸屏显示器(41)上显示所述GUI;
响应于应用于显示所述至少一个图形对象的所述触摸屏显示器的一部分的输入而接收来自所述触摸屏显示器(41)的触摸数据,并且标识对应于应用所述输入的显示在所述触摸屏显示器的一部分的图形对象的所选择端点ID;
将所接收触摸数据与多个摄像机控制指令中的至少一个相关联,所述摄像机控制指令用于控制由所选择端点ID标识的远程视频会议端点处的至少一个远程摄像机的至少一个设置;以及;
将至少一个摄像机控制指令和所选择端点ID发送到所述本地编解码器,其中基于所选择端点ID来发送摄像机控制指令。
10.根据权利要求9所述的方法,其中,所述图形对象包括来自各个远程视频会议端点(12)的视频流。
11.根据权利要求9所述的方法,还包括:
在所述本地编解码器(23)中从所述远程视频会议端点(12)中的一个或多个接收会议视频流,处理所述流,并输出降低了分辨率和/或帧率的相应一组视频流组;以及向所述触摸屏遥控器(40)发送所述一组视频流,并在所述GUI中显示所述一组视频流中的视频流。
12.根据权利要求9所述的方法,其中,生成GUI的步骤还包括:
生成单独控制区域,所述控制区域包括操纵杆图标,
基于图像对象相对于所述触摸屏显示器(41)上的初始默认位置的位置和距离来指定摄像机控制指令。
13.根据权利要求9所述的方法,其中,所述指定的步骤包括
基于在所述触摸屏显示器(41)上的所述图形对象之一上应用的手势来指定摄像机控制指令。
14.根据权利要求9所述的方法,其中,所述指定的步骤包括对于捏紧或松放手势指定放大或缩小摄像机控制指令。
15.根据权利要求9所述的方法,其中,所述指定的步骤包括对于所述触摸屏上相应方向的触摸和拖拽手势指定定向移动摄像机控制指令。
16.根据权利要求11所述的方法,还包括
在所述会议视频流和/或所述一组视频流中的视频流中定位面部;和
基于所述用户输入和所述定位的面部,生成对于由用户经由所述GUI和触摸屏显示器标识的参加者进行放大的摄像机控制指令。
用于摄像机控制的设备和方法\n技术领域\n[0001] 本发明涉及用于视频会议系统的触摸屏控制系统,并且更具体地涉及用于控制视频会议系统的摄像机的方法和设备。\n背景技术\n[0002] 常规的视频会议系统包括经由各种网络(例如WAN、LAN和电路交换网络)和在其之间传送实时视频、音频和/或数据(通常称作为双路视频)流的若干端点。\n[0003] 在大多数高端视频会议系统中,具有摇动、倾斜和缩放能力的高质量摄像机被用于捕获会议室的视图和会议中的参加者。摄像机通常具有宽视场(FOV)和高机械缩放能力。这既允许很好地综览会议室,还可能捕获参加者的特写图像。来自摄像机的视频流被压缩并且发送到视频会议中的一个或多个接收位置。会议中的全部位置从会议中的其它位置接收实况视频和音频,因此使得能够实时传送视觉和听觉信息。\n[0004] 视频会议当考虑到目的、参加者数量、会议室布局等时变化很大。每个会议配置通常需要对摄像机的单独调节以便呈现最优视图。可需要在视频会议之前或期间对摄像机调节。例如,在最多坐16个人的视频会议室中,视频摄像机被预置为捕获全部16个可用的座位位置是自然的。然而,如果仅存在2或3个参加者,预置的摄像机宽视场将对接收端给予非常差的视觉表现。\n[0005] 对摄像机的调节通常使用标准输入设备来完成,例如遥控器上的键区或鼠标,通过手工控制摄像机摇动、倾斜和缩放,或者通过在一组预定义摄像机位置间进行选择。通常,具有标准按钮的传统IR遥控器被用于调节摄像机。标准的设置是控制摇动和倾斜以及控制缩放的放大和缩小按钮的一组四个箭头键。\n[0006] 在已知系统上查找最优摄像机调节常常需要遥控器上的按钮或屏幕上菜单系统的多次迭代,这使得它麻烦、扰乱和不是非常直观。\n[0007] 即使摄像机的摇动倾斜机构包括小的步进电机(允许“高分辨率”移动),但是视频会议系统常常被规划为逐步移动摄像机以便免得用户额外的按键。当摄像机处于宽FOV中时这按预期工作,然而当摄像机缩放时这可造成麻烦,因为步子那时变得非常大。\n[0008] 另外,如果用户想要控制远端端点的摄像机,那么用户需要通过许多屏幕上菜单导航以便访问远端摄像机控制设置,并且然后如果在会议中连接了多个远端端点,那么从所连接端点列表中选择正确的远端端点。该处理是麻烦的,并且对于缺乏经验的用户来说它可能难于成功地完成。\n[0009] 因此,用于控制视频会议中摄像机的当前已知方法是麻烦和令人糊涂的,因此在视频会议中摄像机往往被次优化地调节,导致降低的视频体验。\n[0010] 今天,技术安装的用户习惯于容易使用并且以定制图形环境和设备之间的协作的方式提供灵活性的需求系统。传统的视频会议系统不是非常灵活。此外,传统的视频会议系统使用IR遥控设备上的键区控制的屏幕上菜单系统来操作,造成受限的灵活性和麻烦的用户体验。\n发明内容\n[0011] 本发明的一个目的是提供消除上述缺点的设备和方法。设备是具有如独立设备权利要求中所定义的发明性特征的触摸屏遥控器。发明性方法定义在独立方法权利要求中。\n[0012] 本发明公开了用于通过在所述触摸屏上提供在会议通话中连接的摄像机的图形概览来控制与一个或多个视频会议端点相关的一个或多个摄像机的设备和方法,并且其中控制包括使用所述触摸屏修改摄像机摇动、倾斜和/或缩放。\n附图说明\n[0013] 根据本发明优选实施例的以下更特定的描述,本发明的前述和其它目的、特征和优点将是明显的(如附图中所示),在附图中遍及不同的视图,相同的标号指代相同的部分。附图不一定按比例绘制。重点在于示出本发明的原理。\n[0014] 图1是其中可应用本发明的示例通信网络的示意概观图,\n[0015] 图2是现有技术遥控器的示意概观图,\n[0016] 图3是本发明的触摸屏控制系统的示意概观图,\n[0017] 图4是本发明的框图,\n[0018] 图5是本发明一个示例实施例的示意概观图,\n[0019] 图6是本发明另一个示例实施例的示意概观图,\n[0020] 图7是本发明另一个示例实施例的示意概观图,\n[0021] 图8是本发明另一个示例实施例的示意概观图,\n[0022] 图9是本发明另一个示例实施例的示意概观图,\n[0023] 图10是示出根据本发明的方法的流程图,\n[0024] 图11示出了其上可实现本发明实施例的计算机系统。\n具体实施方式\n[0025] 以下,将通过描述各个实施例,并且通过引用附图来论述本发明。然而,本领域技术人员将会在如所包含的独立权利要求中所定义的本发明范围内实现其它应用和修改。\n[0026] 本发明涉及用于控制与视频会议通话中的视频会议端点相关的一个或多个摄像机的操作的系统和方法。根据本发明的摄像机控制单元(遥控器)是支持触摸的终端用户组件,其向用户呈现表示会议通话中当前连接的视频会议端点和/或视频会议端点的摄像机当前捕获的一个或多个实况视频馈送的图形对象,并且允许用户使用所述摄像机控制单元中嵌入的触摸屏显示器来操纵摄像机的摇动、倾斜和缩放。\n[0027] 网络概览\n[0028] 图1中所示的是其中可应用本发明的通信网络10的示例。每个用户通过端点装置12连接到通信网络。端点装置在下面更详细地描述。优选地,通信网络是网际协议(IP)网络14。然而,用户也可连接到不同的通信网络,例如综合服务数字网(ISDN)16。MCU(多点控制单元)18也可连接到其上可提供视频会议通话的通信网络14、16。或者,所述端点装置12之一包括用于提供多点服务的嵌入MCU。驻留在不同位置的若干端点装置12可通过一个或多个MCU参加相同的会议,例如执行切换和混合功能以便允许视听终端正确地互相联系。每个端点并且因此每个视听流配备有它自己唯一的端点标识符(ID)。\n[0029] 如果来自多种类型的通信网络的用户希望参加视频会议通话,那么两个通信网络可使用网关20连接。网关允许使用不同的协议将所发送数据转换为适合于跨越每种类型的网络发送的数据。\n[0030] 端点装置\n[0031] 端点装置12是可连接到通信网络用于视频和/或音频会议的设备,其使得用户能够跨越通信网络发送信息和从其接收信息。对于视频会议,如果用户仅连接来接收音频数据,那么端点装置可以是传统的电话送受话器。然而,更通常地,端点装置将支持从通信网络接收和跨越其发送视频数据以及向用户显示视频数据,并且在以下称作为视频会议端点。\n[0032] 现在参考图3和图4。具体参考图3,本领域中已知的典型视频会议端点通常由标号20来指示。端点20包括向编解码器(CODEC)23提供视频和音频信号的摄像机21和麦克风26,编解码器23向一个或多个监视器24提供音视频信号。也可向编解码器23提供来自外部多媒体源25(例如VCR、DVD播放器、文档摄像机、个人计算机等)的信号。如通过编解码器23和外部源25之间的双头箭头理解的,编解码器23可从外部源接收要显示在监视器24上的数据信号(例如视频、音频、静像等),并且/或者来自外部源的信号可经由网络\n14、16被发送到连接到视频端点20的其它视频端点。\n[0033] 视频会议端点优选地为H.323或SIP端点(如果它连接到IP网络),或者优选地为H.320端点(如果它连接到ISDN网络)。H.323和H.320是国际电信联盟所定义的标准。\n[0034] 视频端点也可配备有远端摄像机控制(FECC)能力。传统地,FECC能力通过选择用户输入设备22(例如图2中和图3所示的IR遥控器)上的按钮24-36来访问。FECC命令传导到相同的通信链路作为音频和视频数据并且用于控制另一个视频端点。例如,它们允许用户使得另一个摄像机(除了他们自己的之外的)摇动、缩放、倾斜或聚焦。可使用信令协议消息(例如ITU-T.H.281或H.323附录Q)将命令从控制的视频会议端点发送到另一个视频会议端点。\n[0035] 编解码器23具有允许用户使用摄像机控制单元40在规划上改变端点摄像机的摇动、倾斜和/或缩放的API。“API”是“应用编程接口”的缩写。进一步参考图3,摄像机控制单元40(或遥控器)和编解码器23之间的API通信经由编解码器23中的端口28和摄像机控制单元40中的端口47交换。经由端口28访问的该接口允许本发明与编解码器23通信,以使得根据本发明的摄像机控制单元40可向编解码器23提供期望的命令序列并且从编解码器23接收响应。\n[0036] 参考图4,本发明的组件由标号40一般地指示并且被看到包括触摸屏显示单元\n41、个人计算机43和图形生成器45。如所见的,个人计算机43具有连接到通信链路56的端口47,通信链路56连接到编解码器23的API通信端口28。\n[0037] 触摸屏显示器41包括LCD屏幕或可变化大小的其它视频显示技术(CRT、OLED、等离子等)。除了显示屏,触摸屏41包含用x’和y’坐标检测器覆盖显示器/屏幕的硬件。\n当对象(手指、铁笔等)向触摸屏显示器施加压力(触摸)时,它向计算机43发送命令,所述命令至少包括压力所施加点的x’和y’坐标。\n[0038] 摄像机控制单元40使用先前提及的API与编解码器23通信。编解码器23和摄像机控制单元40之间的通信包括来自编解码器23的信息和给编解码器23的命令。当视频会议通话开始时,编解码器23向摄像机控制单元发送至少标识参加者数量的信息和用于每个参加者的端点标识符。\n[0039] 根据本发明的一个示例实施例,编解码器26包括视频转换器49。视频转换器49从近端摄像机/端点接收视频流/视频会议流和/或从远端视频会议端点接收一个或多个视频会议流,处理视频流/视频会议流,并且输出降低了分辨率和/或比特率的对应的一组视频流。根据本发明的一个示例实施例,视频转换器49通过根据用于为实时应用编码视频的许多标准(例如ITU-I H.261、H.262、H.263、H.264或类似视频编码标准)之一编码所接收视频流来生成一个或多个视频流。根据本发明的另一个示例实施例,视频转换器以预定义间隔抓取所接收视频流的快照,并且然后在它将一系列快照输出为视频流之前调整快照大小。视频流被调整大小,因为触摸屏显示器的大小通常比所接收视频流所针对的视频会议端点监视器24的大小要小。该实施例的典型间隔可以是在每秒30个快照到每5秒1个快照的范围内。\n[0040] 响应于从编解码器26接收信息,计算机生成要在触摸屏显示器41上显示的图形用户界面(GUI)。GUI用于控制一个或多个摄像机的操作,例如近端摄像机或远端摄像机。\n图形用户界面也可包括可显示在触摸屏显示器41上用于用户操作和控制端点X的许多触摸控制、菜单和对话框。例如,GUI可允许用户发起或应答视频呼叫;断开一个或多个视频通话;控制近段摄像机;控制远端摄像机;和其它典型视频会议动作。\n[0041] 根据本发明的一个实施例,当视频会议通话开始时,编解码器26向摄像机控制单元发送表示会议开始并且至少标识参加会议通话的视频会议端点的唯一会议ID的信号。\n响应于从编解码器26接收信号,在个人计算机43的控制下,图形生成器45生成并且经由端口42向触摸屏41提供图形用户界面以用于允许与视频会议通话中连接的一个或多个视频会议端点相关的一个或多个摄像机的操作。或者,仅在来自用户的请求时生成并且向触摸屏41提供用于允许一个或多个摄像机的操作的图形用户界面。如图5中所示,图形用户界面由场景51构成,其中场景51是包括图形对象52的所定义区域。场景51可用或不用明显的边界来标出,并且如果场景未标出,那么场景将呈现为背景的一部分。每个图形对象\n52表示正在进行的会议通话中连接的一个视频会议端点。根据另一个示例实施例,除了场景之外,图形用户界面还包括菜单区域53。\n[0042] 场景51是会议通话的图形表示,并且向用户显现通话中的不同参加者。场景51可包括或不包括表示摄像机控制单元40连接到的本地视频会议端点的图形对象52。\n[0043] 根据本发明的一个实施例,图形对象52是标识图形对象分别表示的视频会议端点的图像。所述图像可以是一个或多个人员(化身)、计算机生成的图像、照片、描述视频会议端点的文本(例如参加者的姓名、视频会议系统的名称(例如端点ID)、视频会议系统所位于的位置名称等)、或上述两个或更多个的组合的轮廓。\n[0044] 根据本发明的另一个实施例,图形对象是从连接的视频会议端点馈送的实况视频。实况视频馈送由上述的视频转换器提供。如图6中所示,当用户用对象(例如手指或铁笔)触摸(符号62表示触摸屏系统41所登记的触摸)触摸屏系统41的屏幕时,对应于所触摸点62位置的x和y坐标经由端口53、导体55和计算机43上的端口57被发送到计算机43。如果用户触摸显示图像对象52之一的屏幕区域内的坐标(如图6中),那么计算机比较所触摸的x和y坐标与GUI的内容,并且将用户动作解释为选择所触摸图形对象61,并且因此选择了与该图像对象相关的视频会议系统。用户然后可操作与所选择图像表示的视频会议端点相关的摄像机。所选择图像对象61可被高亮以便向用户示出摄像机控制单元(遥控器)已登记了用户的选择。或者,放大所选择的图形对象。根据一个实施例,所选择图形对象在其它图形对象的大小减小时被放大。根据另一个实施例,所选择图形对象被放大以便覆盖整个场景。\n[0045] 使用所述触摸屏来执行所述(一个或多个)摄像机的操作。当用户操作摄像机控制时摄像机控制单元将向用户提供视觉、听觉和/或触觉反馈。反馈向用户确保摄像机控制单元已登记了用户命令。视觉反馈的示例是在按下时箭头键改变形状、大小或颜色。触觉反馈的一个示例是摄像机控制单元40包括振动设备,并且当按下摄像机控制(例如箭头键)启动振动设备。听觉反馈的示例是摄像机控制单元40包括扬声器,并且当摄像机控制被按下或者执行摄像机控制手势时摄像机控制单元经由所述扬声器发出声音。\n[0046] 根据本发明的一个实施例,摄像机的操作涉及在触摸屏显示器上显示摄像机控制并且从用户接收相关于那些摄像机控制的触摸数据以便控制摄像机的操作。当生成GUI时计算机为每个触摸控制(上、下、左、右、放大、缩小等)在GUI的一个区域进行指定。当计算机从触摸屏显示器41接收触摸数据(坐标)事,计算机比较坐标和所指定区域并且将所接收触摸数据和为所触摸区域指定的摄像机控制指令相关联。\n[0047] 根据本发明的一个示例实施例,所显示的摄像机控制包括一组箭头键,或表示方向的类似按钮,用于控制摄像机的上、下、左和右的移动。用于操作摄像机缩放功能的摄像机控制包括滑动条,或者或者为分别表示放大和缩小的两个按钮。用户可通过重复地按下期望的箭头键(或缩放键),或通过按下并且保持,直到摄像机移动到期望位置,来操作摄像机。图5中示出了如上所述的一个示例摄像机控制。\n[0048] 根据本发明的一个实施例,摄像机的操作涉及一般地或者在GUI的某些区域上应用手指姿势。计算机接收手指姿势作为一系列连续的触摸坐标。计算机将用于每个触摸控制(上、下、左、右、放大、缩小等)的手指姿势指定为在屏幕上任何地方执行的手势或者与某些区域相关而执行的手势。当计算机从触摸屏显示器41接收触摸数据(坐标)时,并且如果一系列连续的坐标暗指手势,那么计算机将坐标与所指定手势比较并且将所接收触摸数据与为所执行手势指定的摄像机控制指令相关联。\n[0049] 根据本发明的一个示例实施例,所显示的摄像机控制包括虚拟操纵杆、如图6和图7中所示。虚拟操纵杆63例如可包括一组箭头键631和中心体632(或操纵杆图标)。\n通过将中心体632在期望的方向上拖拽,用户能够更自由和直观地控制摇动-倾斜摄像机,而不会限于4个方向的逐步移动。在该实施例中,摄像机可用一个移动或触摸在任何方向上移动。另外,摄像机摇动/倾斜的速度可通过主体的当前位置702和初始位置701之间的距离来确定。当用户释放中心体631时,摄像机停止移动。\n[0050] 根据本发明的另一个实施例,当图形对象为实况视频馈送时,摄像机可通过直接与图形对象交互来操作。因为用户现在可在触摸屏显示器上(在GUI中)看到摄像机捕获的实际图像,所以用户可通过在GUI中对实况视频流执行手指手势来操作摄像机摇动、倾斜和缩放移动,如图8中所示。用户可通过在视频流上执行拖放手指手势来控制摄像机摇动/倾斜,如图8a中所示。在该实施例中,来自当前受控摄像机的视频流在拖放过程期间被连续地更新。以该方式,GUI允许用户在触摸屏显示器上到处拖拽图像,直到找到期望的视图,就像物理对象可在书桌或桌子表面上移动一样。此外,用户可通过在所显示视频流上执行某些预定义的手势来进行缩放,例如通过在连续向触摸屏应用手势时执行两个或多个手指的收缩移动以用于放大和缩小,如图8b中所示。或者,缩放功能可通过按下和保持预定的时间周期(例如0.5到2秒)来启动。在预定时间周期之后,缩放图标和/或滑动条可呈现为示出启动了缩放功能。然后,可通过在水平或垂直方向上滑动手指来操作缩放,如图8c到8d中所示。\n[0051] 根据本发明另一个实施例,当图像对象正显示实况视频流时,用户可通过轻击或两次轻击(或任何其它适当手势)实况视频馈送中的参加者来放大选择的参加者,如图9a中所示。当两次轻击参加者时,摄像机控制单元将指示与相关视频流关联的摄像机(经由本地编解码器26)放大该人员。对于固定的安装,例如座位固定并且摄像机和参加者之间的距离不变的会议室,这可通过摇动、倾斜和放大到预定义的摄像机位置(预置)来容易地执行。如果相关联的会议室不是固定的安装,那么可应用面部检测算法以便确定最靠近所触摸的x’和y’坐标的面部的位置和大小。如果检测到面部,并且获得了面部的位置和大小,那么摄像机控制单元计算适当的摇动、倾斜和缩放位置以便构造选择的参加者,并且向编解码器发送摄像机控制指令,编解码器转而使用远端摄像机控制(FECC)协议来指示有关的视频端点和摄像机。\n[0052] 根据本发明的另一个实施例,当图形对象是实况视频馈送时,用户可通过使用计算机43识别的手势构造感兴趣的区域来放大一个或多个参加者或者实况视频馈送的任何其它区域。如图9b中所示,可通过在触摸屏上围绕感兴趣的区域导航手指或对象,或者通过由在触摸屏上轻击或两次轻击两个或多个手指定义感兴趣区域的至少两个角落(如图\n9c中所示),来定义感兴趣区域。\n[0053] 接下来,当用户在触摸屏上显示的图形用户界面中触摸期望的摄像机控制按钮或者应用与摄像机控制相关的手指手势时,根据上面的一个或多个实施例,计算机43从触摸屏显示器接收触摸数据并且将它们与编解码器所理解的摄像机控制指令相关联。\n[0054] 然后,计算机发送包括所选择视频会议端点的端点ID和摄像机控制指令的命令(或信号)。有关的端点ID标识所选择视频流从哪个连接的视频会议系统发起,以及因此标识FECC指令应当被发送到哪个视频会议系统,或者摄像机控制指令是否应当被发送到它自己的摄像机。命令经由端口47、通信链路56和编解码器26上的端口28发送到编解码器26。如果所接收的端点ID是接收编解码器26的ID,那么编解码器向连接到编解码器26的摄像机发送控制指令。如果所接收的端点ID是连接到编解码器的远程视频会议系统之一的ID,那么编解码器基于所接收命令生成FECC指令并且向所标识的视频会议系统发送,所标识的视频会议系统转而向它的摄像机发送控制指令。\n[0055] 根据本发明的一个实施例,摄像机控制单元是专用设备。专用设备可以是视频会议系统的默认部分,或者可以是单独获得的附加设备。\n[0056] 根据本发明的另一个实施例,便携式计算设备,例如个人数字助理、移动电话、膝上型计算机或具有触摸屏接口和视频构造服务器26所支持的通信接口(例如TCP/IP)的类似便携式计算设备,可用作为摄像机控制单元。客户端软件(摄像机控制客户端)可被下载和/或安装在该便携式计算设备上以使得便携式计算设备能够作为根据本发明的摄像机控制单元。\n[0057] 除了处理器,摄像机控制单元40中的计算机43可包括其上可存储有根据本发明一个实施例的一个或多个计算机程序或软件组件的存储介质。例如,要被部署的图形生成器可被存储在计算机43的存储介质上。此外,存储介质可存储用于创建图形生成器的图形程序开发应用,以及能够转换和/或将图形生成器部署在便携式计算设备上的软件。存储介质也可存储操作系统软件,以及用于操作计算机系统的其它软件。\n[0058] 图4类似于图3,但是专注于如上所述的本发明的组件。图4中的相同标号指代图3中的相同组件。发明性系统40允许通过使用由个人计算机43控制的易用的触摸屏\n41(确保逻辑操作的智能设备)来控制编解码器26,可通过请求的显示向用户给予第二次机会以便验证已做出正确的选择,并且避免错误的操作。\n[0059] 更详细地,计算机43能够执行以计算机编程语言编写的逻辑指令。计算机43经由PCI或计算机43中物理安装的其它适当总线来控制编解码器的操作;经由通信链路56的编解码器26示意性地在图4中表示。根据本发明的一个示例实施例,计算机43和编解码器26之间的通信经由通信链路56使用TCP/IP来交换。通信链路56可以是有线或无线链路,例如PAN、CAN、MAN、LAN、WLAN、WAN等。编解码器26和计算机之间的通信是在计算机\n43的端口47和编解码器26的端口28之间来回的命令。如应当理解的,这些通信符合视频构成服务器26的厂商应用编程接口(API)。\n[0060] 还使用触摸屏41经由图4中所示的通信链路以及标号55指示的导体和标号53和57指示的端口来发生通信。来自计算机/图形生成器的图像经由端口42、导体51和端口44传送到并且显示在触摸屏显示器上。\n[0061] 参考图10,编解码器26和计算机43之间的全部通信遵循类似的过程。参考图10,当预定义事件在步骤1000出现时,编解码器26在步骤1010向计算机43发送命令/信号,命令/信号至少包括标识会议通话中当前连接到编解码器26(直接或经由MCU)的视频会话端点的一组端点ID。所述预定义事件可包括:当视频会议开始时,当新的视频会议端点加入正在进行的会议时,当在会议期间摄像机控制单元连接到编解码器26时,在来自摄像机控制单元的请求时,等等。例如,使用如图2中所示的视频会议端点C’,用户C呼叫视频会议端点A’上的参加者A和视频会议端点B’上的参加者B。视频会议端点C’已经连接到根据本发明的摄像机控制单元,并且当会议开始时(全部端点被连接)视频会议端点C’的编解码器26向摄像机控制单元的计算机43发送命令,以表示会议正在进行并且至少标识当前通话中每个视频会议端点的端点ID(在该情况下为视频会议系统A’、B’和C’的端点ID)。\n[0062] 接下来在步骤1020,计算机(图形生成器)创建至少包括场景51的图形用户界面(GUI)。场景51是专用于示出正在进行的视频会议的当前连接端点的专用GUI区域。基于所接收的端点ID,计算机生成一组图形对象,每一个用于每个所接收的端点ID。图形对象占据场景的部分或全部专用区域。即使为每个视频会议端点生成一个图形对象,用户可以控制场景的设置,例如可省略表示本地视频会议端点的图形对象。以它最简单的形式,图形对象包括一个或多个化身和包含与有关视频会议系统相关的信息的文本域。文本域中的文本可以是端点ID本身,或者与存储器或计算机可访问的网络设备中存储的端点ID相关的信息,例如参加者的姓名、视频会议系统的名称或地址、端点ID等。在另一个示例实施例中,图形对象包括从各个视频会议系统馈送的实况视频。计算机经由端口42、通信链路51和触摸屏显示器41上的端口44向触摸屏显示器41发送GUI(图像)。\n[0063] 用户现在具有视频会议通话的全部参加者的可非常容易理解的图形表示。接下来,在步骤1030,为了控制摄像机,用户必须通过触摸场景51中的所述图形对象52之一来选择要控制的摄像机(或视频会议端点)。响应于用户的选择(触摸),触摸屏41经由端口53、通信链路55和端口57向计算机43发送所触摸区域的x和y坐标。计算机43登记对要控制的摄像机(视频会议端点)的用户选择,并且计算机和图形生成器处理来自触摸屏的信息并且例如通过标出或放大所选择的图形对象来更新GUI(场景),并且因此触摸屏上显示的图像留存。\n[0064] 在步骤1040,用户通过触摸触摸屏41和/或在触摸屏41上执行手指手势操纵GUI(例如图像对象、控制菜单、按钮、手势)来控制所选择的视频会议端点的摄像机,如上更详细所述。用户的触摸数据以x和y坐标的形式经由链路55发送到计算机43。\n[0065] 接下来,在步骤1050,当接收到触摸坐标或成组连续的触摸坐标(手势)时,计算机43比较触摸坐标和指定为摄像机控制指令的一组GUI区域和/或手指手势。作为计算机43可访问的存储器中存储的预配置指示或当生成GUI时做出指示并且将其临时存储在计算机43可访问的存储器中,这样来执行将至少一个GUI区域和/或至少一个手指手势指定为至少一个摄像机控制指令。如果发现了明确的匹配,那么计算机将所接收触摸坐标与摄像机控制命令相关联。\n[0066] 接下来,在步骤1060,如果计算机将所接收触摸坐标与触摸命令相关联,那么计算机43向编解码器26发送命令,至少包括端点ID和相关联的控制命令。编解码器26分析端点ID和相关联的控制命令,并且生成FECC命令并且将其发送到有关的视频会议端点,或者如果端点ID标识所述本地视频会议端点20那么向它的本地摄像机发送摄像机控制命令。\n[0067] 在最后的步骤1070,然后编解码器26经由端口28、通信链路56和端口47向计算机43发送动作完成的信号。一旦以上述方式完成了动作,计算机43等待用户下一次触摸屏幕41的表示,以新摄像机控制指令或新摄像机选择的形式或者会议通话中所连接视频会议端点数量的变化。\n[0068] 图11示出了其上可实现本发明实施例的计算机1201。计算机系统1201包括总线1202或者用于传送信息的其它通信机制,和用于处理信息的与总线1202连接的处理器1203。计算机系统1201还包括用于存储信息和要由处理器1203执行的指令的连接到总线1202的主存储器1204,例如随机访问存储器(RAM)或其它动态存储设备(例如动态RAM(DRAM)、静态RAM(SRAM)和同步DRAM(SDRAM))。另外,主存储器1204可用于存储在处理器1203执行指令期间的临时变量或其它中间信息。计算机系统1201还包括用于存储用于处理器1203的静态信息和指令的连接到总线1202的只读存储器(ROM)1205或其它静态存储设备(例如可编程ROM(PROM)、可擦除PROM(EPROM)和电可擦除PROM(EEPROM))。\n[0069] 计算机系统1201还包括连接到总线1202的盘控制器1206,以便控制用于存储信息和指令的一个或多个存储设备,例如磁硬盘1207和可移除媒体设备1208(例如软盘驱动器、只读光盘驱动器、读/写光盘驱动器、自动光盘机、磁带驱动器和可移除磁光驱动器)。\n存储设备可使用适当的设备接口(例如小型计算机系统接口(SCSI)、集成设备电路(IDE)、增强IDE(E-IDE)、直接内存存取(DMA)或超级DMA)添加到计算机设备1201。\n[0070] 计算机系统1201还可包括专用逻辑设备(例如专用集成电路(ASIC))或可配置逻辑设备(例如简单可编程逻辑设备(SPLD)、复杂可编程逻辑设备(CPLD)和场可编程门阵列(FPGA))。\n[0071] 计算机系统1201还可包括连接到总线1202的显示控制器1209以便控制显示器\n1210,例如阴极射线管(CRT)或LCD显示器,以用于向计算机用户显示信息。计算机系统包括输入设备,例如键盘1211和指点设备1212,以用于与计算机用户交互并且向处理器1203提供信息。指点设备1212例如可以是用于向处理器1203传送指示信息和命令选择并且用于控制显示器1210上的光标移动的鼠标、跟踪球、或定点杆。另外,打印机可提供计算机系统1201存储和/或生成的打印的数据列表。\n[0072] 响应于处理器1203执行存储器(例如主存储器1204)中包含的一个或多个指令的一个或多个序列,计算机系统1201执行本发明实施例中的部分或全部处理步骤。这些指令可被从另一个计算机可读介质(例如硬盘1207或可移除介质驱动器1208)读入主存储器1204。多处理布置中的一个或多个处理器也可被用来执行主存储器1204中包含的指令序列。在候选实施例中,硬连线的电路可用来代替软件指令或者与其组合。因此,实施例不限于硬件电路和软件的任何特定组合。\n[0073] 如上所述,计算机系统1201包括用于保存根据本发明技术编程的指令和用于包含其中描述的数据结构、表格、记录或其它数据的至少一个计算机可读介质或存储器。计算机可读存储媒体的示例是光盘、硬盘、软盘、磁带、磁光盘、PROM(EPROM、EEPROM、快速EPROM)、DRAM、SRAM、SDRAM或任何其它磁介质、光盘(例如CD-ROM)或任何其它光介质、穿孔卡片、纸带或具有孔模式的其它物理介质。此外,指令可存储在载波(或信号)中并且从其读取。\n[0074] 在计算机可读存储媒体中的任何一个或其组合上存储,本发明的实施例包括用于控制计算机系统1201,用于驱动用于实现本发明的设备和用于使得计算机系统1201能够与人类用户交互的软件。该软件可包括但不限于设备驱动、操作系统、开发工具和应用软件。\n[0075] 本发明的计算机代码设备可以是任何可解释或可执行的代码机制,包括但不限于脚本、可解释程序、动态链接库(DLL)、Java类和完整的可执行程序。此外,本发明的部分处理可被分布以便为了更好的性能、可靠性和/或成本。\n[0076] 如这里使用的术语“计算机可读存储介质”指代参加向处理器1203提供指令用于执行的任何物理介质。计算机可读存储介质可采用许多形式,包括但不限于非易失性媒体和易失性媒体。非易失性媒体例如包括光、磁盘和磁光盘,例如硬盘1207或可移除介质驱动器1208。易失性媒体包括动态存储器,例如主存储器1204。\n[0077] 在向处理器1203传送一个或多个指令的一个或多个序列用于执行中可涉及各种形式的计算机可读存储媒体。例如,指令可初始地在远程计算机的磁盘上携带。远程计算机可将用于实现本发明全部或部分的指令远程载入到动态存储器并且使用调制解调器经由电话线发送指令。计算机系统1201本地的调制解调器可接收电话线上的数据并且使用红外发送器将数据转换为红外信号。连接到总线1202的红外检测器可接收红外信号中携带的数据并且将数据放置在总线1202上。总线1202向主存储器1204传送数据,处理器1203从主存储器1204检索和执行指令。在由处理器1203执行之前或之后,主存储器1204接收的指令可选地存储在存储设备1207或1208上。\n[0078] 计算机系统1201还包括连接到总线1202的通信接口1213。通信接口1213向例如连接到局域网(LAN)1215或另一个通信网络1216(例如因特网)的网络链路1214提供双向数据通信连接。例如,通信接口1213可以是连接到任何分组交换LAN的网络接口卡。\n作为另一个示例,通信接口1213可以是向对应类型的通信线路提供数据通信连接的非对称数字用户线路(ADSL)卡、综合服务数字网(ISDN)卡或调制解调器。也可实现无线链路。\n在任何这种实现中,通信接口1213发送和接收传送表示各种类型信息的数字数据流的电、电磁或光信号。\n[0079] 网络链路1214通常通过一个或多个网络向其它数据设备提供数据通信。例如,网络链路1214可通过本地网络1215(例如LAN)或通过服务提供者(其通过通信网络1216提供通信服务)操作的装置来提供到另一个计算机的连接。本地网络1214和通信网络1216例如使用传送数字数据流的电、电磁或光信号和相关联的物理层(例如5类CAT电缆、同轴电缆、光纤等)。向计算机系统1201和从其传送数字数据的通过各种网络的信号和在网络链路1214上并且通过通信接口1213的信号可以通过基带信号或基于载波的信号实现。\n基带信号传送数据作为未调制的电脉冲,其描述了数字数据位流,其中术语“位”应被广义地解释为意指符号,其中每个符号传送至少一个或多个信息位。数字数据也可被用于调制载波,例如用经由传导媒体传播或通过传播介质作为电磁波发送的幅移键控信号、相移键控信号和/或频移键控信号。因此,数字数据可通过“有线”通信信道作为未调制基带数据发送和/或通过调制载波在不同于基带的预定频带内发送。计算机系统1201可通过网络\n1215和1216、网络链路1214以及通信接口1213发送和接收数据,包括程序代码。此外,网络链路1214可通过LAN 1215向移动设备1217(例如个人数字助理(PDA)、膝上型计算机或移动电话)提供连接。\n[0080] 根据上面的教导,本发明的许多修改和变化是可能的。因此要理解,在所附权利要求的范围内,可在除了这里特定描述的之外来实践本发明。
法律信息
- 2016-01-13
- 2012-10-10
实质审查的生效
IPC(主分类): H04N 7/15
专利申请号: 201080046857.7
申请日: 2010.10.14
- 2012-08-22
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-08-01
|
2007-01-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |