著录项信息
专利名称 | 用于产生多媒体内容的推荐关键字的系统及其方法 |
申请号 | CN200880023803.1 | 申请日期 | 2008-08-29 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2010-03-31 | 公开/公告号 | CN101690179 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N21/466 | IPC分类号 | H;0;4;N;2;1;/;4;6;6查看分类表>
|
申请人 | NHN株式会社 | 申请人地址 | 韩国京畿道
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | NHN株式会社 | 当前权利人 | NHN株式会社 |
发明人 | 宋仁宰;金猷元;金东旭 |
代理机构 | 北京铭硕知识产权代理有限公司 | 代理人 | 韩明星;王青芝 |
摘要
提供了一种用于提供与内容具有高相关性并反映观众兴趣的推荐关键字的系统和方法。通过广播时间和特定广播内容的关键字来产生内容的预期观众组,通过从搜索词中选择与内容的相关性比阈值高的关键字来产生关键字集合,其中,预期观众在包括内容的播放时间之前/之后的时间的预定时间段发送了所述搜索词。通过使用用于每个播放时间段的每个关键字的搜索次数来从关键字集合中提取用于每个播放时间段的关键字,并存储与内容的播放时间同步的每个播放时间段的推荐关键字。
1.一种用于产生推荐关键字的系统,所述系统包括:
种子关键字数据库,存储与内容和内容的广播时间相关的预定种子关键字;
预期观众数据库,存储用于每个内容的预期观众的用户ID;
预期观众分类单元,通过使用广播时间和种子关键字来从将搜索词发送到搜索引擎的用户中分类内容的预期观众;
推荐关键字产生单元,基于预期观众的用户ID和广播时间通过从预期观众发送的搜索词中选择与内容的相关性比阈值高的关键字来产生关键字集合,
其中,当用户在包括广播时间的预设时间段输入种子关键字预定次数或更多次时,预期观众分类单元将用户分类为预期观众。
2.如权利要求1所述的系统,还包括:
内容关键字时间同步单元,基于包括在用于每个广播时间段的关键字集合中的关键字的搜索次数来产生用于内容的每个播放时间段的推荐关键字。
3.如权利要求2所述的系统,其中,内容关键字时间同步单元从包括在关键字集合的关键字中去除不适当的预设关键字。
4.如权利要求2所述的系统,其中,内容关键字时间同步单元同步用于内容的每个播放时间段的推荐关键字和内容的播放时间,并存储同步的推荐关键字。
5.如权利要求1所述的系统,其中,推荐关键字产生单元通过使用预期观众对特定关键字的搜索次数与预期观众对所有关键字的搜索总次数的比率来产生关键字集合。
6.如权利要求5所述的系统,其中,推荐关键字产生单元还通过使用搜索了特定关键字的预期观众的数量来产生关键字集合。
7.如权利要求5所述的系统,其中,推荐关键字产生单元还通过使用在广播时间期间对关键字的搜索次数与一天内关键字的搜索次数的比率来产生关键字集合。
8.一种用于产生关键字的方法,所述方法包括:
a)通过使用预先存储的与内容和内容的播放时间相关的种子关键字来分类内容的预期观众;
b)通过从预期观众发送的用于包括内容的广播时间的预定时间段的搜索词中选择与内容的相关性比阈值高的关键字来产生推荐关键字集合,
其中,在步骤a)中,将对包括特定内容的广播时间的预设时间段输入了包括种子关键字的搜索词预定次数或更多次的用户分类为预期观众。
9.如权利要求8所述的方法,还包括:
c)通过使用用于每个播放时间段的每个关键字的搜索次数来从所述推荐关键字集合提取用于每个播放时间段的关键字;
d)存储与内容的播放时间同步的每个播放时间段的推荐关键字。
10.如权利要求8所述的方法,其中,将种子关键字分类为具有不同权值的类型,并且如果搜索的应用了相应权值的种子关键字的总和不小于预设值,则将搜索了搜索词的用户分类为预期观众。
11.如权利要求8所述的方法,其中,在步骤b)中,还通过使用搜索特定关键字的预期观众的数量与非预期观众的数量的比率来产生所述推荐关键字集合。
12.如权利要求11所述的方法,其中,在步骤b)中,还通过使用搜索了特定关键字的预期观众的数量来产生所述推荐关键字集合。
13.如权利要求12所述的方法,其中,搜索了特定关键字的预期观众是搜索预定数量的种子关键字或更多个种子关键字的预期观众。
14.如权利要求11所述的方法,其中,在步骤b)中,还通过使用在包括广播时间的预定时间段对关键字的次数搜索的比率来产生所述推荐关键字集合。
15.如权利要求9所述的方法,其中,在步骤c)中,通过将广播时间划分为预定播放时间段以及使用用于每个播放时间段的特定关键字的搜索次数的比率或等级来产生用于每个播放时间段的推荐关键字。
用于产生多媒体内容的推荐关键字的系统及其方法\n技术领域\n[0001] 本发明涉及一种用于产生和提供与多媒体内容相关的推荐关键词的系统和方法。\n更具体地讲,本发明涉及一种用于将从内容的预期观众收集的充分可靠的关键字作为推荐关键字提供的系统和方法,其中,在特定时间段期间播放所述内容。\n背景技术\n[0002] 最近,随着广播技术与数据通信技术的融合,已积极地开发各种交互式广播服务(例如,视频点播(VOD)服务、数据广播、电视商务、IP TV等)。\n[0003] 这些交互广播内容不仅向用户提供广播内容,还通过使用返回频道来反映观众的需求,从而可以向观众提供观众直接选择的内容。\n[0004] 同时,随着各种互联网服务与广播的融合,广播接收装置可提供作为最重要的互联网服务之一的搜索服务。例如,IP TV通过使用互联网基于IP的网络来不仅广播内容还提供与广播融合的各种现有基于IP的服务。\n[0005] 具体地,现存在对内容相关关键字搜索服务的大量需求,其中,所述内容相关关键字搜索服务可立即满足观众对广播内容的的好奇心。\n[0006] 图1是用于搜索与内容相关的补充信息的传统系统的示意图。\n[0007] 第2003-96362号韩国专利公开公开了一种用于向广播听众或电视观众提供与实时接收的广播节目相关的补充信息的配置。\n[0008] 图1中示出的传统系统包括广播接收装置10、用户装置11、广播站21、信道信息服务器22和网络服务器23。\n[0009] 广播接收装置10接收从广播站21发送的广播内容。\n[0010] 信道信息服务器22根据从广播站22广播的每个广播内容提供用于补充信息的URL。如果观众希望搜索关于当前广播的内容的补充信息下,则他/她使用用户装置11来向信道信息服务器22请求用于补充信息的URL。\n[0011] 信道信息服务器22向用户装置11发送根据信道主题或广播节目的主题分类的URL,用户装置11通过使用根据主题分类的URL来从网络服务器23搜索补充信息。\n[0012] 同时,第2002-81767号韩国专利公开公开了一种通过使用DB基于电子节目指南(EPG)来提供关于演艺人员和事物的信息的技术,其中,关于当前广播的节目的所述信息被预先存储在所述DB中。\n[0013] 此外,第2004-101235号韩国专利公开公开了一种用于通过使用包括关于将在电视上广播的节目的信息的网址来显示广播节目和所述信息的技术。\n[0014] 然而,在这些传统技术中,尽管前提是已预先存储了与节目相关的信息,但还没有提供如何收集关于与节目相关的信息的关键字或主题的方法。\n[0015] 因此,在传统技术中,没有其它选择,只能由管理员手动地收集和提供关于广播节目内容的补充信息或相关信息。然而,在这种情况下,实际上不可能提供与各种广播内容高度相关的信息。另外,即使可能存在用于特定内容的各种搜索关键字,但是手动地设置各种搜索关键字存在局限。此外,由管理员选择的相关信息与观众希望搜索的信息相同的可能性非常小,提供给观众的信息量也受到预先准备数据的极大限制。\n[0016] 如上所述,存在这种问题,即,用于通过预先手动地准备与内容相关的关键字或信息来与广播节目同步和与广播节目一起提供所述关键字或信息的技术无法满足观众的兴趣。\n[0017] 因此,如上所述的传统技术具有这种问题,即,没有公开用于提供与内容高具有高相关性并反映观众兴趣的内容相关关键字的方法。\n[0018] 发明公开\n[0019] 技术问题\n[0020] 为了解决上述问题,本公开提供了一种用于提供反映观众兴趣的内容相关关键字的系统和方法。\n[0021] 此外,本公开提供一种能够推荐与内容具有高相关性的各种关键字的系统和方法。\n[0022] 另外,本公开提供一种用于提供与内容具有高相关性并反映对内容的每个播放时间周期的观众兴趣的系统和方法。\n[0023] 此外,本公开提供一种用于将与内容的各种应用兼容的每个内容的推荐关键字存储到数据库的系统和方法。\n[0024] 技术方案\n[0025] 为了解决上述技术问题,根据本发明的第一方面,提供了一种用于产生推荐关键字的系统,所述系统包括:种子关键字DB,存储与内容和内容的广播时间相关的预定种子关键字;预期观众分类单元,通过使用广播时间和种子关键字来从将搜索词发送到搜索引擎的用户中分类内容预期观众;推荐关键字产生单元,基于预期观众的用户ID和广播时间通过从预期观众发送的搜索词中选择与内容的相关性比阈值高的关键字来产生关键字集合。\n[0026] 此外,推荐关键字提供系统还可包括:内容关键字时间同步单元,基于包括在用于每个广播时间段的关键字集合中的关键字的搜索次数来产生用于内容的每个播放时间段的推荐关键字。\n[0027] 此外,当用户在包括广播时间的预设时间段输入种子关键字预定次数或更多次时,预期观众分类单元可将该用户分类为预期观众。\n[0028] 此外,推荐关键字产生单元可通过使用由预期观众对特定关键字的搜索次数与预期观众对所有关键字的搜索总次数的比率来产生关键字集合。\n[0029] 此外,根据本发明的第二方面,提供了一种用于产生推荐关键字的方法,所述方法包括:a)通过使用预先存储的与内容相关的种子关键字和内容的播放时间来分类内容的预期观众;b)通过从预期观众发送的用于包括内容的广播时间的预定时间段的搜索词中选择与内容的相关性比阈值高的关键字来产生推荐关键字集合。\n[0030] 此外,在步骤b)中,通过使用预期观众对特定关键字的搜索次数与非预期观众对特定关键字的搜索次数的比率来产生关键字集合。\n[0031] 此外,在步骤b)中,还可通过使用搜索了特定关键字的预期观众的数量来产生关键字集合,或在步骤b)中,还可使用在包括广播时间的预定时间段对关键字的搜索次数的比率来产生关键字集合。\n[0032] 此外,根据本发明的第三方面,提供了一种存储有数据结构的存储介质,所述数据结构包括:用于识别内容的内容识别数据;用于每个播放时间段的识别数据,其中,所述每个播放时间段是按预定值划分的内容的全部播放时间;与用于每个播放时间段的识别数据相应的用于每个播放时间段的至少一个关键字数据;其中,通过与内容的播放时间同步来提供用于每个播放时间段的关键字数据。\n[0033] 有益效果\n[0034] 根据上述技术方案,可以提供与内容具有高相关性并反映观众兴趣的推荐关键字。\n[0035] 此外,根据本发明可以将每个内容的推荐关键字存储到数据库或以文件格式提供每个内容的推荐关键字,从而通过提供与内容具有高相关性并反映对内容的每个播放时间段的观众兴趣的推荐关键字来与各种内容的应用服务兼容。\n附图说明\n[0036] 图1是用于搜索与内容相关的补充信息的传统系统的示意图;\n[0037] 图2是根据本发明实施例的用于提供推荐关键字的系统的框图;\n[0038] 图3提供根据本发明实施例的存储在搜索关键字DB 121中的数据结构的示图;\n[0039] 图4是根据本发明的存储在预期观众DB 122中的数据结构的示图;\n[0040] 图5是根据本发明实施例的内容推荐关键字DB 123的数据结构以及产生所述数据结构的处理的示图;\n[0041] 图6提供示出根据本发明实施例的用于产生推荐关键字的方法的流程图;\n[0042] 图7提供示出根据本发明实施例的用于分类和存储预期观众组的更详细流程图;\n[0043] 图8提供示出根据本发明实施例的用于产生关键字集合的方法的详细流程图;\n[0044] 图9提供示出根据本发明实施例的用于产生内容的每个播放时间段的推荐关键字的方法的详细流程图;\n[0045] 图10是根据本发明实施例的实际上使用推荐关键字的屏幕的示图。\n具体实施方式\n[0046] 以下,将参照附图对本发明的实施例进行详细描述,从而本领域技术人员可容易地实施本发明。然而,注意的是,本发明不限于实施例,而是可以以各种其它方式被实现。在附图中,为了简化解释,省略了与描述无关的部分,贯穿全文相同标号表示相同部分。\n[0047] 贯穿全文,用于表示一个元件与另一元件的连接或结合的术语“连接到”或“结合到”包括两个情况,即,一个元件“直接连接到或结合到”另一元件和一个元件通过元件“电连接或结合到”另一元件的情况。此外,用于文档的术语“包括或包含”表示除描述的部件、步骤、操作和/或元件之外,没有排除一个或多个其它部件、步骤、操作和/或存在或者其它元件。\n[0048] 在本文中使用的术语“搜索词”表示用户通过搜索引擎输入的词语或词组。\n[0049] 此外,本文中使用的术语“关键字”表示很可能与特定内容相关的词语或词组。\n[0050] 因此,可从已输入的“搜索词”选择“关键字”。\n[0051] 图2是根据本发明实施例的用于提供推荐关键字的系统的框图。\n[0052] 推荐关键字提供系统100概略地包括内容推荐关键字产生单元110和DB服务器\n120。\n[0053] 内容推荐关键字产生单元110包括预期观众分类单元111、推荐关键字产生单元\n112和内容关键字时间同步单元113。DB服务器120包括种子关键字(seed keyword)DB \n121、预期观众DB 122和内容推荐关键字DB 123。\n[0054] 推荐关键字提供系统100可以与常用搜索引擎200合作执行操作。根据本发明实施例的推荐关键字提供系统100能够实际使用搜索查询日志DB 210的信息,其中,所述搜索查询日志DB 210存储了发送到搜索引擎的搜索查询日志。\n[0055] 以下,将详细解释每个部件的详细操作和相互关系。\n[0056] 如果通过广播接收装置10播放了广播节目,则根据统计学从广播时间之前的时间到广播时间之后的时间在用户装置11中集中进行用于广播节目的关键字搜索。\n[0057] 由搜索引擎200接收这种搜索查询,并且常用搜索服务系统将搜索关键字、搜索时间和用户ID存储到搜索查询日志DB 210。\n[0058] 在这种情况下,用户ID可以是,例如Bcookie。Bcookie是一种分配给用户装置\n11的ID,并且还是例如与会员注册或会员登录无关基于当用户通过用户装置11访问搜索网页时的IP地址和浏览器的会话时间(session)值等分配的序列号。如果用户没有删除Bcookie,则当用户再次访问搜索页时可以再次使用该Bcookie。因此,Bcookie可作为分配给单个PC的序列号而用于识别用户装置11。\n[0059] 以下,将解释本发明的实施例,诸如Bcookie的用于识别用户的值将被称为“用户ID”。\n[0060] 预期观众分类单元111可以与搜索引擎200和种子关键字DB 121合作执行操作。\n[0061] 存储在种子关键字DB 121中的是与特定广播节目相关的基础关键字,即,与内容名称和广播时间相应的种子关键字。例如,可一起存储关于内容节目名称(次数、字幕)和广播日期的信息以及与其相应的种子关键字。在这种情况下,种子关键字可包括广播内容的名称或修改的名称。同时,可以按每个类型(category)分类种子关键字,并且可对每个类型分配不同的权值。例如,在戏剧类型中,第一类型可包括标题和角色(cast)姓名,第二类型可包括男演员/女演员姓名和制作人。在这种情况下,可以对具有较高搜索频率的第一类型分配比第二类型高的权值。\n[0062] 预期观众分类单元111检查搜索引擎200在预定时间段期间接收的搜索词语中的任何一个是否与存储在种子关键字DB 121中的种子关键字中的一个相应,并且例如从Bcookie等读取输入了种子关键字的用户的ID,其中,所述预定时间段为从广播时间之前的时间至广播时间之后的时间的时间段。读取的用户ID可被分类为预期观众。此时,为了将用户ID分类为预期观众,确定访问是否正常,然后输入了预设次数或更多次种子关键字的用户的ID可被分类为预期观众。在此,如果搜索引擎在搜索窗口上提供自动完成功能,则输入了通过使用自动完成功能获得的搜索词语的用户可被包括在预期观众中,并可从预期观众中排除输入了搜索引擎网页的屏幕上已经提供的词语(例如,流行的搜索词、推荐搜索词)的用户。\n[0063] 当分类预期观众时,将预期观众的用户ID存储在预期观众DB 122中。存储在预期观众DB 122中的是与特定广播内容或一系列或一组特定广播内容匹配的用户ID。\n[0064] 推荐关键字产生单元112参照预期观众DB在相关内容的广播时间段期间收集预期观众发送的搜索词。此外,如果收集的搜索词满足特定条件,则推荐关键字产生单元112将搜索词分类为关键字,并将该关键字添加到关键字集合。上述特定条件可要求,例如,与内容相关的关键字具有比阈值高的相关性。\n[0065] 例如,可将在广播时间期间预期观众的相关关键字的搜索次数的比率考虑为以下特定条件。即,可以是这种条件,用户搜索相关关键字的次数应不小于预设值,或者相关关键字的搜索次数应该集中在特定时间段(例如,相关内容的广播时间)。\n[0066] 推荐关键字产生单元112将满足上述条件的关键字分类为用于相关内容的推荐关键字,并产生用于相关内容的关键字集合。\n[0067] 内容关键字时间同步单元113执行将包括在关键字集合中的关键字匹配到内容的每个播放时间段的功能。例如,每60(六十)秒测量一次用于内容的每个播放时间段的关键字的搜索次数,并选择在每个时间段具有高的搜索次数比率的关键字。在这种情况下,不包括不适当的关键字。例如,诸如“直播”、“重播”、“回顾”“节目制作”、“广播时间”等的不适当的关键字被删除。搜索查询日志DB 210还包括关于关键字的搜索时间的信息,其中,该关键字被选择为推荐关键字。因此,如果将内容的广播开始时间与关键字的搜索时间组合,则可以同步内容的播放时间段和关键字的搜索时间。\n[0068] 最终,将与每个内容匹配的关键字存储到内容推荐关键字DB 123。内容推荐关键字DB 123存储与内容的每个播放时间段同步的推荐关键字。因此,如果通过各种服务提供了特定内容,则可以与独立文件一起提供存储在内容推荐关键字DB 123中的数据。在这种情况下,观众可以在使用文件观看内容的同时使用与内容的每个播放时间段同步的推荐关键字。\n[0069] 图3提供根据本发明实施例的存储在种子关键字DB 121中的数据结构的示图。\n[0070] 种子关键字DB 121存储与每个内容相应的广播时间和种子关键字。例如,种子关键字DB 121存储X-file的第一情节的广播时间和作为种子关键字的大部分基础关键字(例如,“X-file”、“外星人”等)。\n[0071] 如上所述,在从广播时间之前的时间至广播时间之后的时间的时间段期间越来越多地搜索与特定内容相关的关键字,从而在从广播时间之前的时间至X-file的第一情节的广播时间之后的时间的预定时间段期间搜索了种子关键字的用户被确定为观看X-file的第一情节的预期观众。\n[0072] 如上所述,如果对每个广播内容设置种子关键字,则可以根据本发明实施例收集每个内容的预期观众的候选。\n[0073] 图4是根据本发明的存储在预期观众DB 122中的数据结构的示图。\n[0074] 通过上述步骤,如果分类预期观众,则各个预期观众的用户ID(UID 1、UID 2、UID \n3)与相关内容匹配,并将各个预期观众的用户ID存储到预期观众DB 122。因此,在未来,可将在相同类型的内容的广播时间期间从预期观众发送的搜索词认为是与该内容相应的推荐关键字的候选。\n[0075] 图5是根据本发明实施例的内容推荐关键字DB 123的数据结构以及产生所述数据结构的处理的示图。\n[0076] 由于可以通过使用存储在预期观众DB 122中的用于各个内容的用户ID来预料内容的预期观众,所以可通过分析存储在搜索查询日志DB 210中的搜索查询日志来产生推荐关键字。\n[0077] 搜索查询日志DB 210存储关于搜索引擎接收的搜索查询的用户ID、搜索时间和包括搜索关键字的日志,从而可以读取预期观众的搜索时间和搜索关键字。\n[0078] 例如,预期观众UID 1在“X-file的第二情节”的播放时间期间对“病毒”、“FBI”和“Scully”执行关键字搜索,并且如果这些关键字包括在通过满足特定条件而设置的推荐关键字集合中,则可将所述关键字存储在内容推荐关键字DB 123中。\n[0079] 例如,“X-file的第二情节”在20时开始,如果在20时30分搜索到“病毒”、在20时40分搜索到“FBI”以及在20时45分搜索到“Scully”,则可将这些关键字选择为用于\n30至31分、40至41分和45至46分的各个再现时间段的推荐关键字中的一个。\n[0080] 考虑上述,如果内容推荐关键字DB 123存储用于相关内容的每个播放时间段的推荐关键字,则可以通过通信广播会聚服务(例如,IP TV、网络TV等)提供反映用户对每个内容的兴趣的各种推荐关键字。上述关键字可被用于使用户在输入字符不方便的环境中(例如,在将遥控器用作输入装置的情况下)选择期望的搜索词变得容易,或者可被用于当输入搜索词的一部分时执行的自动完成功能。\n[0081] 本领域的技术人员可以容易理解的是,上述推荐关键字提供系统的每个部件可以被单独地实施或者也可以集成到硬件中被实施。此外,本发明的实施例可被整体实现为能够提供推荐关键字的搜索引擎200的部件的一部分。\n[0082] 图6提供示出根据本发明实施例的用于产生推荐关键字的方法的流程图。\n[0083] 在根据本发明实施例的产生推荐关键字的方法中,首先应分类特定广播内容的预期观众组,然后,存储与其相关广播内容相应的预期观众组(步骤S100)。\n[0084] 一旦分类了预期观众组,基于从预期观众发送的搜索词产生关键字集合(步骤S200)。可以从满足特定条件的搜索词产生关键字集合,其中,所述满足特定条件的搜索词是在相同广播内容或一系列相同内容的播放时间期间从预期观众发送的搜索词中与相关内容的相关性被确定为高的搜索词。\n[0085] 在产生关键字集合之后,产生用于内容的每个播放时间段的关键字(步骤S300)。\n通过使用用于关键字集合中包括的搜索词的搜索时间,可以确定每个搜索词在广播内容播放时间中的哪些时间段期间被输入。因此,包括在关键字集合中的推荐关键字可以与内容的各个播放时间段匹配。\n[0086] 在步骤S400,将用于每个内容的时间同步推荐关键字存储在数据库中。可以以独立文件提供存储在数据库中的推荐关键字,或者存储在数据库中的推荐关键字与内容同步之后通过特定服务器被提供。\n[0087] 以下,将更详细地解释图6中示出的步骤S100、S200、S300和S400。\n[0088] 图7提供示出根据本发明实施例的用于分类和存储预期观众组的方法的更详细流程图。\n[0089] 为了分类预期观众,首先,输入与对应于广播时间的内容相关的种子关键字(步骤S110)。种子关键字可以是表示内容的最基础关键字。种子关键字可包括,例如,内容名称、演员、主题等。广播时间包括关于内容的广播时间的信息,并且还可包括日期信息。此外,广播时间可包括包含广播时间前和后特定时间(例如,30分钟)的预定时间段。\n[0090] 在步骤S120,确定在广播时间或预定时间段期间进行的搜索是否是正常。如果进行了任何非正常搜索(例如,在发送搜索结果之前关闭浏览器的情况等),则处理结束(步骤S170),并且不认为这种非正常搜索在分类预期观众的处理中。可参照变量值来进行确定搜索是否是正常的步骤,其中,使用所述变量值来确定浏览器是否正常地访问了搜索结果页。另外,如果通过使用由搜索引擎提供的页上的已完成的搜索词来进行搜索,则当分类预期观众时不考虑这种搜索。\n[0091] 在步骤S130,确定在预定时间段期间是否搜索了种子关键字,其中,所述预定时间段为从广播时间之前的时间至广播时间之后的时间的时间段。如果特定用户搜索种子关键字,则处理进行到下一步骤。\n[0092] 如果搜索了种子关键字,则确定由发送种子关键字的用户发送的搜索词的数量是否大于阈值n,并且如果搜索词的数量大于阈值n,则处理进行到下一步骤,从而将用户注册为预期观众(步骤S140)。\n[0093] 最终,确定是否可以识别将被注册为预期观众的用户的ID(步骤S150)。例如,如果Bcookie的值是“-”,则确定没有Bcookie并且无法识别用户。\n[0094] 同时,虽未在图7中示出,但如果一个用户在广播时间期间输入一个搜索词多次或者过于频繁,则期望从预期观众排除该用户。\n[0095] 此外,如上所述,在将权值分配给每个类型的情况中,其中,按类型分类搜索的关键字,如果分配给各个类型的权值之和不小于预设值,则可以将用户分类为预期观众。根据实施例,可以通过将低权值分配给种子关键字来从预期观众中排除执行与内容无关的搜索的用户,其中,所述关键字与在不同内容中重复扮演或成为与内容无关的事件的男演员/女演员相应。例如,如果在多个内容中扮演或者成为与社会事件有关的事件的男演员/女演员与内容的表演者相同,其中,所述社会事件与内容无关,则为了防止将不观看当前广播的内容的用户分类为预期观众,将低权值分配给用于这种男演员/女演员的种子关键字。\n[0096] 如果满足上述确定处理,则将在观看广播内容的同时输入了与内容相关的关键字的用户分类为预期观众,并将分类用户的ID注册到预期观众组中(步骤S160)。稍后使用预期观众组的用户ID来识别相同内容或者一系列内容的观众。\n[0097] 图8提供示出根据本发明实施例的用于产生关键字集合的方法的详细流程图。\n[0098] 一旦产生与内容相应的预期观众组,通过使用预期观众的搜索结果来收集用于各个内容的推荐关键字。\n[0099] 在步骤S210,收集预期观众在预定时间段期间进行的搜索的结果。例如,预定时间段可包括特定内容的广播时间之前和之后的30分钟。在该步骤中,确定从预期观众发送的每个搜索词是否是可用于相关内容的推荐关键字。\n[0100] 在步骤S220,确定由预期观众输入的相关关键字的搜索次数的比率是否高于阈值K。在此,可以通过以下式1确定预期观众的搜索次数的比率。\n[0101] [式1]\n[0102] (QC A/QC A-total)/(QC B/QC B-TOTAL)>K(在此,K>0)\n[0103] 在该式中,每个参数具有其自身的含义,如下。\n[0104] QC A:预期观众的相关关键字的搜索次数\n[0105] QC A-total:预期观众的搜索词的搜索总次数\n[0106] QC B:非预期观众的相关关键字的搜索次数\n[0107] QC B-total:非预期观众的搜索词的搜索总次数\n[0108] 即,如果由预期观众输入的特定关键字的搜索次数的比率高于由非预期观众输入的特定关键字的搜索次数的比率,则可以认为相关关键字与内容具有高相关性。\n[0109] 在步骤S230,确定输入相关关键字的预期观众的数量是否大于阈值m。即,仅当数量不小于阈值m的预期观众搜索了相关关键字时才进行下一步骤。\n[0110] 同时,仅当通过搜索预定数量或更多个种子关键字来分类预期观众时,从预期观众发送的搜索词才可被包括在关键字集合中,其原因在于,从通过仅搜索一个种子关键字被分类的预期观众发送的搜索词可以与这种搜索词不同,即,仅包含与种子关键字的拼写相同的拼写的搜索词。\n[0111] 例如,在种子关键字是“file”的情况下,可将搜索“profile”的用户分类为预期观众。因此,期望从关键字集合中排除这种搜索词,即,从通过仅搜索一个种子关键字(例如,“file”)被分类的预期观众发送的搜索词。\n[0112] 在步骤S240,确定在包括相关关键字的广播时间的预定时间段进行的搜索的次数(即,在特定时间段期间进行的搜索的次数/一天内进行的搜索的次数)的比率是否大于阈值P(在此,0<P<1)。如果在预定时间段期间搜索相关关键字的次数的比率高于阈值P,则可以认为在广播时间期间集中搜索了相关关键字。\n[0113] 如果满足上述条件,则将相关关键字添加到关键字集合作为用于内容的推荐关键字(步骤S250)。\n[0114] 如已描述的,可通过使用存储在种子关键字DB 120、预期观众DB 122和搜索查询日志DB 210中的信息来充分地执行上述步骤S220、S230和S240。\n[0115] 此外,由于在步骤S220、S230和S240中提及的式或条件仅是示例,因此可以使用其它条件,从而通过使用搜索次数、搜索者的数量、搜索时间等来获得关键字与内容之间的相关性。\n[0116] 图9提供示出根据本发明实施例的用于产生用于内容的每个播放时间段的推荐关键字的方法的详细流程图。\n[0117] 如上所述,如果产生了用于特定内容的推荐关键字集合,则关键字本身充分地有用,但是如果关键在内容的每个播放时间段被同步,则可最大化用户的便利性。\n[0118] 在步骤S310,计算每个时间段的搜索次数。即通过将搜索关键字的时间划分为特定时间段(例如,60秒)来获得相关关键字的搜索次数。\n[0119] 通过计算对每个时间段的关键字的搜索次数(即,每个时间段进行的搜索次数/在广播时间期间进行的搜索次数)的比率,确定这种比率是否高于阈值Q(步骤S320)。在这种情况下,可以将在广播时间期间进行的搜索次数替换为在广播时间期间进行的搜索次数+A(A>0)。如果所述比率不高于阈值Q,则从用于相关时间段的关键字中排除推荐关键字(步骤S360),并且如果所述比率高于阈值Q,则进行下一步骤。\n[0120] 在该步骤中,还可以按对每个时间段搜索次数的比率的递减顺序(而不使用阈值Q)将预定数量的关键字选择为每个时间段的推荐关键字。\n[0121] 在步骤S330,确定相关关键字是否不适当。在此,不适当关键字表示与内容无关的预设关键字,例如“直播”、“重播”、“回顾”等。\n[0122] 在步骤S340,每个时间段的搜索次数的比率为了但不是不适当的关键字被注册为每个时间段的推荐关键字。\n[0123] 当注册了用于所有时间段的推荐关键字时,将内容的广播时间与内容的播放时间同步(步骤S350)。将为从广播开始时间的每个时间段而选择的推荐关键字与作为为从播放开始时间的每个时间段的推荐关键字的内容匹配。\n[0124] 图10示出播放特定内容(例如,X-file)的开始时间之后的10分钟的屏幕的示图。在屏幕上,显示了与主角相应的人、主角乘坐的汽车、UFO等。\n[0125] 与显示的内容相应的推荐关键字可以是,例如“X-file”、“X-file的主角”、“X-file的结束”、“外星人”、“UFO”、“David Duchonvy(X-file主角的实际姓名)”、“在X-file中的汽车”、“法拉利(主角的汽车)”等。可根据用户的请求,在屏幕或其它装置上提供这些推荐关键字。\n[0126] 上述关键字可被用作用于与诸如IP TV的互联网搜索一起提供的服务中的搜索的关键字。在这种情况下,即使在不便于输入字符的环境中,也可以通过选择他/她期望的关键字来容易地执行搜索。\n[0127] 另外,可以对在网络TV的环境中的搜索使用上述推荐关键字,其中,在所述网络TV中可以立即使用互联网通信。此外,如果推荐关键字文件与内容的多媒体文件同步,则可以向各种多媒体服务提供推荐关键字。\n[0128] 此外,可以通过将关于特定信息或广告的数据分配给推荐关键字来在商业上使用所述推荐关键字。此外,可以通过响应于单个关键字经多个搜索引擎提供搜索结果来最大化请求各种类型的信息的用户的便利性。\n[0129] 如上所述,根据本发明的实施例的用于提供推荐关键字的系统和方法可以被不同地提供给推荐关键字与内容的具有高相关性的任何服务,并可反映观众的兴趣。\n[0130] 本发明实施例可以实施在包括计算机可执行的指令代码(计算机执行的程序模块)的存储介质中。\n[0131] 此外,根据本发明实施例的数据结构可被存储在计算机可执行的存储介质中。\n[0132] 计算机可读介质可以是可被计算机访问的任何可使用介质,并且包括所有易失性/非易失性和可移除/不可移除介质。此外,计算机可读介质可包括所有计算机存储器和通信介质。计算机存储介质包括用于存储信息(例如,计算机可读指令代码、数据结构、程序模块或其它数据)的特定方法或技术实施的所有易失性/非易失性和可移除/不可移除介质。通信介质一般包括计算机可读指令代码、数据结构、程序模块或调制的数据信号(例如,载波或其它传输机制)的其它数据,并包括特定信息传输介质。\n[0133] 已关于特定实施例解释了本发明的系统和方法,但是可通过使用具有通用硬件结构的计算机系统来实施其部件或另一部分或所有其操作。\n[0134] 用于示例的目的提供了本发明的上述描述,但是本领域技术人员理解的是,在不改变本发明的技术构思和基本特征的情况下可进行各种变换和修改。因此,清楚的是,上述实施例在所有方面为示例性的,并且不限制本发明。\n[0135] 由权利要求,而不是实施例的详细描述定义本发明的范围。应该理解的是,权利要求及其等同物的含义和范围所包含的所有修改和实施例包括在本发明的范围内。
法律信息
- 2012-01-11
- 2010-05-12
实质审查的生效
IPC(主分类): H04N 5/44
专利申请号: 200880023803.1
申请日: 2008.08.29
- 2010-03-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-07-04
|
2006-12-13
| | |
2
| |
2001-06-06
|
2000-09-22
| | |
3
| |
2007-10-03
|
2007-02-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |