著录项信息
专利名称 | 使用可扩展字幕文件提供附加信息的设备和方法 |
申请号 | CN200610080236.6 | 申请日期 | 2006-05-12 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2007-01-31 | 公开/公告号 | CN1905645 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N21/434 | IPC分类号 | H;0;4;N;2;1;/;4;3;4;;;H;0;4;N;2;1;/;8;5;4;3查看分类表>
|
申请人 | 三星电子株式会社 | 申请人地址 | 韩国京畿道
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 三星电子株式会社 | 当前权利人 | 三星电子株式会社 |
发明人 | 郭起源;朱彰南;姜春云;郑敏宇;朴宰成;李大铉 |
代理机构 | 北京铭硕知识产权代理有限公司 | 代理人 | 韩明星;安宇宏 |
摘要
公开了一种通过使用可扩展字幕文件来提供附加信息的设备,该设备包括:逆多路复用单元,从通过数据输入单元输入的多媒体文件中分离视频和音频数据;XML解析器,解析通过数据输入单元输入的字幕数据文件和附加信息数据文件;视频和音频数据处理单元,对通过逆多路复用单元输入的视频和音频数据进行解码,并将解码的视频和音频数据转换为预定的视频和音频信号;字幕处理单元,处理通过XML解析器解析和输入的字幕数据;附加信息数据处理单元,处理通过XML解析器解析和输入的附加信息数据文件,并基于处理的附加信息产生用户接口信息;和数据输出单元,显示处理的视频、音频、字幕和用户接口信息。
1.一种使用可扩展字幕文件来提供附加信息的设备,该设备包括:
逆多路复用单元,从通过数据输入单元输入的多媒体文件中分离视频和音频数据;
XML解析器,解析通过数据输入单元输入的字幕数据文件和附加信息数据文件;
视频和音频数据处理单元,对从逆多路复用单元输入的视频和音频数据进行解码,并将解码的视频和音频数据转换为预定的视频和音频信号;
字幕处理单元,处理通过XML解析器解析和输入的字幕数据以产生处理的字幕信息;
附加信息数据处理单元,处理通过XML解析器解析和输入的附加信息数据文件,并基于处理的附加信息产生用户接口信息;和
数据输出单元,显示处理的视频、音频和用户接口信息,
其中,所述用户接口信息是具有预定形状的表示关于字幕和音频的附加信息的角色,所述角色以字幕和/或预定音频的形式提供关于视频和字幕的附加信息。
2.如权利要求1所述的设备,其中,所述数据输出单元为附加信息数据设置较高的优先级值,以使当附加信息数据被显示时,附加信息位于屏幕的较上层。
3.如权利要求1所述的设备,其中,所述附加信息数据包括视频、音频和字幕信息。
4.一种使用可扩展字幕文件来提供附加信息的方法,该方法包括:
解析从已输入多媒体数据、字幕数据和附加信息数据的设备输入的字幕数据和附加信息数据;
通过处理解析的附加信息数据来产生用户接口信息;和
同步地显示多媒体数据、字幕数据和用户接口信息,
其中,所述用户接口信息是具有预定形状的角色,所述角色以字幕和/或音频的形式提供关于视频和字幕的附加信息。
5.如权利要求4所述的方法,还包括:
设置多媒体数据、字幕数据和用户接口信息的优先级;和
基于设置的优先级显示多媒体数据、字幕数据和用户接口信息。
6.如权利要求5所述的方法,其中,通过为用户接口信息设置较高的优先级值,所述用户接口信息位于屏幕的较上层。
7.如权利要求4所述的方法,其中,所述用户接口信息包括视频、音频和字幕信息。
8.一种设备,包括:
字幕处理单元,被构造为处理与多媒体数据相关的字幕信息;
附加数据处理单元,被构造为处理附加数据,并基于该附加数据产生用户接口信息;和
数据输出单元,被构造为组合多媒体数据的多媒体信息、与多媒体信息相关的字幕信息和用户接口信息以用于显示,
其中,所述用户接口信息是具有预定形状的角色,所述角色以字幕和/或音频的形式提供关于视频和字幕的附加信息。
9.如权利要求8所述的设备,还包括:XML解析器,被构造为解析字幕数据文件以提供字幕信息,并解析附加信息文件以提供附加数据。
10.如权利要求9所述的设备,还包括:
逆多路复用单元,被构造为从多媒体数据中分离视频和音频数据;和视频和音频处理单元,被构造为分别对从多媒体数据分离的视频和音频数据进行解码,并产生视频和音频信息,其中,所述视频和音频信息是多媒体数据的多媒体信息。
使用可扩展字幕文件提供附加信息的设备和方法\n[0001] 本申请基于于2005年5月26日在韩国知识产权局提交的第10-2005-0044595号韩国专利申请,并要求该申请的优先权,该申请完全公开于此以资参考。\n技术领域\n[0002] 本发明涉及一种使用可扩展字幕文件来提供附加信息的设备和方法,更具体地讲,涉及这样一种使用可扩展字幕文件来提供附加信息的设备和方法,该设备和方法可通过将关于图像和字幕的附加信息添加到同步的字幕文件中来向用户提供附加信息。\n背景技术\n[0003] 微软公司的同步可访问媒体交换技术(SAMI)和RealNetworks Inc.的real-text技术是传统的基于文本的字幕技术。 传统的基于文本的字幕技术具有这样一种结构,该结构基于在其中记录有视频流数据的文件或通过网络提供的视频流数据的同步时间信息来显示字幕。\n[0004] 图1示出使用SAMI格式的一般的字幕文件和解析的字幕信息。 由于SAMI容易生成并且便于处理,所以SAMI具有优势。\n[0005] 如所示,所述方法包括:SAMI文件,由以可扩展标记语言(XML)格式的字幕语言构成;和解析器,用于解释所述语言。 所述字幕语言包括时间同步和根据语言的字幕内容,并且当必要时,还包括关于字体大小或颜色的信息。\n[0006] 将考虑播放基于文本的字幕的操作。内部的XML解析器从由字幕处理单元读出的字幕文件提取时间同步(帧位置)和文本(语音),并将其存储在存储器中。检查相关帧位置处的字幕文本,使其与图像数据同步,并且当基于帧显示图像时,显示该字幕文本。\n[0007] 例如,XML解析器从所述字幕文件提取关于位于时间同步“1000”处的英语单词“One”或法语单词“Un”以及关于位于时间同步“2000”处的英语单词“Two”或法语单元“Deux”的信息。 接下来,XML解析器使解析的数据与相关时间同步处的图像数据同步,并显示该解析的数据。\n[0008] 图2示出显示通过处理传统字幕语言而同步的图像数据和字幕文本的屏幕。\n[0009] 参考图2,当在读取视频流数据和字幕数据之后播放视频时,用于播放基于文本的字幕的装置在屏幕的预定位置上显示字幕数据预定时间。\n[0010] 然而,由于传统的字幕语言仅包括HTML标签的极小部分,所以传统的字幕语言难以表示除字幕之外的信息(例如,关于字幕的附加信息)。此外,由于在向用户提供信息时仅显示脚本格式,所以传统的字幕语言可提供的各种附加信息是有限的。\n[0011] 第2004-033766号未审查的韩国专利公布(Servicing Method of Summariesand Value Added Information on Videos Using Video Metadata on Internet)公开了这样一种方法,该方法包括:将关于包括在视频中的地点、音乐、角色或物品的各种附加信息,连同概括视频内容的关键帧(代表图像)存储在视频元数据中;当播放视频时,自动地使存储在视频元数据中的各种附加信息与视频播放时间同步,从而显示与视频播放时间对应的附加信息。然而,该方法旨在在通过互联网提供视频点播(VOD)服务的同时播放视频和包括在该视频中的各种附加信息,而没有公开用于显示包括在一般的SAMI文件中的预定附加信息的技术。\n发明内容\n[0012] 本发明的一方面通过将关于图像和字幕的附加信息添加同步字幕文件并在使其与图像数据和字幕数据同步之后显示添加的附加信息来向用户提供更多的附加信息。\n[0013] 本发明的另一方面在于通过用于处理包括在可扩展字幕文件中的附加信息数据的附加信息处理单元来提供同步字幕语言的灵活扩展。\n[0014] 从下面的公开,本发明的所述和其它方面、特征和优点将对本领域的技术人员变得清楚。\n[0015] 根据本发明的一方面,提供一种通过使用可扩展字幕文件来提供附加信息的设备,该设备包括:逆多路复用单元,从通过数据输入单元输入的多媒体文件中分离视频和音频数据;XML解析器,解析通过数据输入单元输入的字幕数据文件和附加信息数据文件;视频和音频数据处理单元,对通过逆多路复用单元输入的视频和音频数据进行解码,并将解码的视频和音频数据转换为预定的视频和音频信号;字幕处理单元,处理通过XML解析器解析和输入的字幕数据;附加信息数据处理单元,处理通过XML解析器解析和输入的附加信息数据文件,并基于处理的附加信息产生用户接口信息;和数据输出单元,显示处理的视频、音频和用户接口信息。\n[0016] 根据本发明的另一方面,提供一种通过使用可扩展字幕文件来提供附加信息的方法,该方法包括:解析从已输入多媒体数据、字幕数据和附加信息数据的设备输入的字幕数据和附加信息数据;通过处理解析的附加信息数据来产生用户接口信息;和同步地显示多媒体数据、字幕数据和用户接口信息。\n附图说明\n[0017] 通过参考附图详细描述本发明的优选实施例,本发明的以上和其它特征及优点将变得更加清楚,其中:\n[0018] 图1示出使用SAMI格式的一般的字幕文件和解析的字幕信息;\n[0019] 图2示出显示通过处理传统的字幕语言而同步的图像数据和字幕文本的屏幕;\n[0020] 图3是示出根据本发明示例性实施例的通过使用可扩展字幕文件来提供附加信息的设备的框图;\n[0021] 图4示出根据本发明的另一示例性实施例的可扩展字幕文件、解析的字幕信息和附加信息;\n[0022] 图5示出通过根据本发明的另一示例性实施例的使用可扩展字幕文件来提供附加信息的设备而显示的屏幕;和\n[0023] 图6是示出根据本发明的另一示例性实施例的通过使用可扩展字幕文件来提供附加信息的方法的流程图。\n具体实施方式\n[0024] 现在将参考附图来更全面地描述本发明,在附图中示出了本发明的示例性实施例。\n[0025] 通过参考下面对优选实施例和附图的详细描述,可更容易地理解本发明的优点和特征以及实现其的方法。 然而,本发明可以以许多不同的形式来实施,而不应该被解释为仅限于这里所阐述的实施例。 相反,提供这些实施例是为了使本公开充分和完整,并将本发明的构思全面地传达给本领域的技术人员,并且本发明仅由权利要求所限定。\n贯穿本说明书,相同的标号表示相同的部件。\n[0026] 图3是示出根据本发明示例性实施例的通过使用可扩展字幕文件来提供附加信息的设备的框图,所述设备可以是媒体播放器。\n[0027] 参考图3,所述设备包括数据输入单元100、数据处理单元200和数据输出单元\n300。 这里,所述可扩展字幕文件包括指示帧位置的时间同步、根据语言的字幕内容,当必要时还包括关于字幕字体大小或颜色的信息,并且还包括关于图像和字幕的附加信息。\n[0028] 数据输入单元100输入多媒体文件(视频和音频数据)、字幕数据文件和附加信息数据文件。数据处理单元200包括逆多路复用单元210、视频数据处理单元220、音频数据处理单元230、字幕处理单元240、XML解析器250和附加信息数据处理单元260。\n数据显示单元300包括视频显示单元310和音频输出单元320。\n[0029] 逆多路复用单元210从通过数据输入单元100输入的多媒体文件中分离视频和音频数据,并将分离的视频和音频数据发送到视频数据处理单元220和音频数据处理单元\n230。\n[0030] 视频数据处理单元220包括:视频解码器221,用于对从逆多路复用单元210输入的视频数据进行解码;和视频翻译器(renderer)222,用于处理输入到视频解码器221的解码的视频数据并将其转换为预定的视频信号。\n[0031] 音频数据处理单元230包括:音频解码器231,用于对从逆多路复用单元210输入的音频数据进行解码;和音频翻译器232,用于处理解码的音频数据并将其转换为预定的音频信号。\n[0032] XML解析器250解析从数据输入单元100输入的XML文档(即,字幕数据和附加信息数据),并将解析的字幕数据和附加信息数据发送到字幕处理单元240和附加信息数据处理单元260。\n[0033] 字幕处理单元240处理解析的字幕数据。 当基于帧显示视频时,字幕处理单元\n240检查与相关帧位置对应的字幕数据,并将其与同步的音频数据一起显示。\n[0034] 附加信息数据处理单元260处理由XML解析器250解析的附加信息数据,然后基于处理的附加信息产生将通过屏幕提供的用户接口信息。 这里,所述附加信息数据是指关于视频和字幕的信息,包括根据时间同步的诸如类型、词汇和角色表达的信息、显示时间、音频源以及链接URL。 应该注意到,所述用户接口信息是指具有预定形状的表示关于字幕和音频的附加信息的角色。 即,同步的角色显示在显示视频和字幕的预定帧位置处,并且以字幕和音频形式提供关于相关视频和字幕的附加解释。\n[0035] 视频显示单元310根据关于帧位置的信息(即,时间同步信息)来显示由视频处理单元220、字幕处理单元240和附加信息数据处理单元260发送的视频、字幕和用户接口信息。\n[0036] 视频显示单元310设置视频数据、字幕文本和用户接口信息的优先级值,然后根据设置的优先级值将它们(即,视频数据、字幕文本和用户接口信息)定位于屏幕的各层中。\n[0037] 例如,视频显示单元310按顺序设置用户接口信息、字幕和视频的优先级。 因此,视频显示单元310在屏幕的最下层中显示优先级最低的视频数据,跟在视频数据之后在下一层显示字幕文本,在屏幕的最高层显示用户接口信息,从而显示的附加信息(如,角色)可不被视频数据和字幕文本覆盖。\n[0038] 在使由音频数据处理单元230和附加信息数据处理单元260发送的音频信息与视频同步之后,音频输出单元320输出该音频信息。\n[0039] 所述附加信息提供设备提供详述以微秒(μsec)为单位的时间字段的时间戳,以使由视频数据处理单元220、音频数据处理单元230、字幕处理单元240和附加信息数据处理单元260处理的数据(即,用户接口信息、字幕、视频和音频)同步(即,使所述数据根据设置的时间同步来显示)。 所述时间戳可设置在数据显示单元300中。\n[0040] 图4示出根据本发明的示例性实施例的可扩展字幕文件、解析的字幕信息和关于解析的字幕的附加信息。\n[0041] 参考图4,可扩展字幕文件10包括用于指示帧位置的时间同步11、根据语言的字幕内容12以及关于视频和字幕的附加信息13。\n[0042] 当时间同步是“1000”时,显示在屏幕上的字幕信息12(即,英语单词“One”或法语单词“Un”)被记录在可扩展字幕文件10中。\n[0043] 当时间同步是“2000”时,字幕信息12(如,英语单词“Two” 或法语单词“Deux”)和附加信息13(比如,诸如男孩的角色信息、关于角色“There isa new arrival”的字幕信息、关于角色的表达信息、当角色从屏幕消失(5秒)时的时间信息、角色的音频信息“hello”、以及与角色链接的信息http://www.samsung.com)被记录在可扩展字幕文件10中。\n[0044] 将描述解析可扩展字幕文件的过程。 当通过数据输入单元100输入可扩展字幕文件10时,XML解析器250解析输入的可扩展字幕文件10。 即,XML解析器250从可扩展字幕文件10中分离字幕数据和附加信息数据,并对它们进行解释,然后将解释的信息20发送到字幕处理单元240和附加信息数据处理单元260。\n[0045] 附加信息数据处理单元260通过处理通过XML解析器250输入的附加信息来产生用户接口信息,然后将产生的用户接口信息(比如,角色)发送到视频显示单元310以将其显示在屏幕上。\n[0046] 用于解释附加信息的角色与相关帧位置处的视频和字幕一起显示,从而向用户提供更多的信息。\n[0047] 图5示出通过根据本发明的另一示例性实施例的使用可扩展字幕文件的附加信息提供设备而显示的屏幕。\n[0048] XML解析器250解析从数据输入单元100输入的字幕文件,提取时间同步(即,帧位置)、文本数据和附加信息数据,然后将它们发送到字幕处理单元240和附加信息数据处理单元260。 附加信息数据处理单元260基于解析的附加信息来产生用户接口信息(即,角色)。 基于附加信息而产生的角色包括角色信息(比如,性别和表达)、字幕信息、角色的音频信息和链接信息。\n[0049] 当基于帧显示视频时,字幕处理单元240检查相关帧位置上的字幕文本,然后使其与视频数据同步来显示它。 附加信息数据处理单元260检查相关帧位置上的用户接口信息,然后使其与视频和字幕文本同步来显示它。\n[0050] 参考图5,基本图像(比如,角色1、2和3)显示在屏幕上,并且与视频同步地显示分配给基本图像(即,角色1)的字幕(即,“Two(or Deux)”)和与其对应的音频。\n[0051] 同时,解释附加信息的角色5覆盖在基本视频和字幕文本上。 分配给角色5的字幕( “There is a new arrival”)和音频( “Hello”)与角色5同步地显示。 这里,根据记录在可扩展字幕文件10中的信息,角色5具有微笑的脸,并还被设置为在5秒之后该脸自动地消失。 由于角色5具有与预定站点连接的链接信息,所以当用户选择角色5时,用户可直接进入到相关站点。\n[0052] 图6是示出根据本发明的另一示例性实施例的使用可扩展字幕文件的附加信息提供方法的流程图。\n[0053] 当通过数据输入单元100输入多媒体文件和可扩展字幕文件(S200)时,逆多路复用单元210将输入的多媒体文件分离为视频和音频数据,XML解析器250提取字幕数据和附加信息数据(S210)。 这里,所述可扩展字幕文件包括指示帧位置的时间同步、根据语言的字幕内容、如果必要的话还包括将被显示的字幕的字体大小或颜色,并且还包括关于视频和字幕的附加信息。\n[0054] 视频分离数据被输入到视频处理单元220,并被视频解码器221解码(S211)。视频翻译器222将解码的视频数据转换为预定的视频信号(S212)。 音频数据被输入到音频处理单元230中,并被音频解码器231解码(S211)。 音频翻译器232将解码的音频数据转换为预定的音频信号(S212)。\n[0055] 由XML解析器250提取的字幕数据被输入到字幕处理单元240中并被解析(S213),和被处理(S214),解析的附加信息数据被输入到附加信息数据处理单元260中并被处理(S215)。\n[0056] 附加信息数据处理单元260通过处理解析的附加信息数据来产生用户接口信息。 应该注意到,所述用户接口信息是指用于基于输入的附加信息数据另外解释视频和字幕的角色。 所述角色可以是,例如,词汇、表达、时间、音频或URL链接。\n[0057] 当处理的数据(用户接口信息、字幕数据以及视频和音频数据)被发送到数据显示单元300(S220)时,数据输出单元300的视频显示单元310设置用户接口信息、字幕数据和视频数据的优先级(S230)。 所述优先级是指用于在屏幕上显示用户接口信息、字幕视频和视频数据的顺序。 这里,较高优先级数据置于屏幕的较上层。\n[0058] 例如,视频显示单元310设置用户接口信息的优先级较高,从而当用户接口信息被显示时,用户接口信息位于屏幕的较上层。\n[0059] 通过时间戳在屏幕上显示与同一时间同步对应的视频、字幕和用户接口信息(即,角色)(S240)。 根据设置的优先级在屏幕上显示这些数据。 例如,用户接口信息具有第一优先级,字幕和视频优先级次之,从而用户接口信息(即,角色)位于屏幕的最上层中。\n[0060] 因此,提供视频、字幕和附加信息的角色同步地显示在屏幕上。 此外,通过预定的音频输出装置同步地输出相关音频。 所述角色可以以字幕和/或预定音频形式提供关于视频和字幕的附加信息。 由于所述角色具有与预定站点连接的链接信息,所以当用户选择角色时,他/她可直接进入相关站点。\n[0061] 因此,当用户观看预定视频时,由于附加信息可被同步提供,所以可将附加信息提供给用户。\n[0062] 如上所述,根据本发明的使用可扩展字幕文件来提供附加信息的设备和方法产生以下所述的一个或多个效果。\n[0063] 关于视频和字幕的附加信息被添加到一般的同步字幕文件,并且所述信息被同步地提供给用户。\n[0064] 关于视频和字幕的附加信息被添加到一般的同步字幕文件,从而提供字幕语言的灵活扩展和各种用户接口。\n[0065] 虽然已结合本发明的示例性实施例描述了根据本发明的用于管理文件系统的设备和方法,但是本领域的技术人员应该理解,在不脱离本发明的范围和精神的情况下,可对其进行各种修改和改变。 因此,应该理解,以上实施例在所有方面不是限制性的,而是说明性的。
法律信息
- 2022-04-26
未缴年费专利权终止
IPC(主分类): H04N 21/434
专利号: ZL 200610080236.6
申请日: 2006.05.12
授权公告日: 2011.04.20
- 2011-04-20
- 2007-03-28
- 2007-01-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2000-08-30
|
1999-12-25
| | |
2
| | 暂无 |
2000-06-08
| | |
3
| |
2003-01-29
|
2001-09-20
| | |
4
| |
2003-10-08
|
2003-03-17
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |