著录项信息
专利名称 | 直达号关键词的推荐方法和装置 |
申请号 | CN201410705960.8 | 申请日期 | 2014-11-27 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-03-25 | 公开/公告号 | CN104462289A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 百度在线网络技术(北京)有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦三层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 百度在线网络技术(北京)有限公司 | 当前权利人 | 百度在线网络技术(北京)有限公司 |
发明人 | 朱建庭;侯震宇;王继平 |
代理机构 | 北京清亦华知识产权代理事务所(普通合伙) | 代理人 | 宋合成 |
摘要
本发明提出一种直达号关键词的推荐方法和装置,其中,该直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断待查验直达号关键词是否已被直达号占用;如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果;以及如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。本发明的直达号关键词的推荐方法,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。
1.一种直达号关键词的推荐方法,其特征在于,包括以下步骤:
建立候选关键词资源库;
提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;
判断所述待查验直达号关键词是否已被直达号占用;
如果判断所述待查验直达号关键词未被直达号占用,则向所述用户反馈查验通过结果;以及
如果判断所述待查验直达号关键词被直达号占用,则根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户;
所述建立候选关键词资源库具体包括:
获取多个搜索日志;
提取所述多个搜索日志中的多个候选关键词;
根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;
根据筛选之后的所述候选关键词和所述候选关键词对应的计数值建立所述候选关键词资源库;
所述根据已有的直达号对所述多个候选关键词进行筛选具体包括:
判断提取的所述候选关键词是否属于直达号资源库;
如果属于所述直达号资源库,则将所述候选关键词丢弃;
所述的方法,还包括:
根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分;所述模型为针对所述候选关键词对应的计数值以及商业价值评分、服务评分的综合评价模型;
所述根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表具体包括:
根据所述待查验直达号关键词查询所述候选关键词资源库以生成第一候选关键词列表;
根据所述第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将所述第二候选关键词列表作为所述候选关键词列表。
2.如权利要求1所述的直达号关键词的推荐方法,其特征在于,所述提取所述多个搜索日志中的多个候选关键词具体包括:
提取每个所述搜索日志中的搜索关键词;
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
3.如权利要求2所述的直达号关键词的推荐方法,其特征在于,在所述进一步获取所述搜索关键词的词性之前,还包括:
根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
4.如权利要求1所述的直达号关键词的推荐方法,其特征在于,还包括:
接收所述用户在所述候选关键词列表中选择的候选关键词;以及
根据所述用户选择的所述候选关键词更新所述候选关键词资源库。
5.一种直达号关键词的推荐装置,其特征在于,包括:
建立模块,用于建立候选关键词资源库;
第一接收模块,用于提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;
判断模块,用于判断所述待查验直达号关键词是否已被直达号占用;
反馈模块,用于在所述判断模块判断所述待查验直达号关键词未被直达号占用时,向所述用户反馈查验通过结果;以及
提供模块,用于在所述判断模块判断所述待查验直达号关键词被直达号占用时,根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户;
所述建立模块具体包括:
第一获取单元,用于获取多个搜索日志;
提取单元,用于提取所述多个搜索日志中的多个候选关键词;
第二获取单元,用于根据已有的直达号对所述多个候选关键词进行筛选,并获取筛选之后的每个所述候选关键词对应的计数值;
建立单元,用于根据筛选之后的所述候选关键词和所述候选关键词对应的计数值建立所述候选关键词资源库;
所述第二获取单元具体用于:
判断提取的所述候选关键词是否属于直达号资源库;
如果属于所述直达号资源库,则将所述候选关键词丢弃;
所述建立模块还包括:
生成单元,用于根据所述候选关键词对应的计数值和预设的模型生成所述候选关键词对应的评分;所述模型为针对所述候选关键词对应的计数值以及商业价值评分、服务评分的综合评价模型;
所述提供模块具体用于:
根据所述待查验直达号关键词查询所述候选关键词资源库以生成第一候选关键词列表;
根据所述第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将所述第二候选关键词列表作为所述候选关键词列表。
6.如权利要求5所述的直达号关键词的推荐装置,其特征在于,所述提取单元具体用于:
提取每个所述搜索日志中的搜索关键词;
如果所述搜索关键词符合直达号定义的语法规则,则将所述搜索关键词作为所述候选关键词;
如果所述搜索关键词不符合直达号定义的语法规则,则进一步获取所述搜索关键词的词性;以及
如果所述搜索关键词的词性为名词,则将所述搜索关键词作为所述候选关键词。
7.如权利要求6所述的直达号关键词的推荐装置,其特征在于,所述提取单元还用于:
在所述进一步获取所述搜索关键词的词性之前,根据所述搜索关键词查询缓存数据,以从所述缓存数据中查询所述搜索关键词对应的词性。
8.如权利要求5所述的直达号关键词的推荐装置,其特征在于,还包括:
第二接收模块,用于接收所述用户在所述候选关键词列表中选择的候选关键词;以及更新模块,用于根据所述用户选择的所述候选关键词更新所述候选关键词资源库。
直达号关键词的推荐方法和装置\n技术领域\n[0001] 本发明涉及互联网技术领域,特别涉及一种直达号关键词的推荐方法和装置。\n背景技术\n[0002] 直达号是一些组织、机构、商户等团体或个人在直达服务平台上唯一的官方账号,通过搜索直达号可直接得到直达号对应的结果,例如,可直接进入直达号对应的商户或机构的页面,并使用页面中的功能和服务。\n[0003] 随着直达号的不断发展壮大,越来越多的用户会通过服务平台申请注册直达号。\n由于每个直达号唯一对应一个团体或个人,因此随着注册的直达号越来越多,可用的直达号关键词资源会越来越少。后续用户在申请注册直达号时,就会出现其希望申请的直达号关键词已经被其他用户注册的情况,此时,用户需要更换直达号关键词,直到找到一个与希望申请的直达号相近且未被其他用户注册的直达号关键词进行注册,才能完成直达号的申请。\n[0004] 随着已注册的直达号越来越多,后续用户在申请注册直达号时,遇到已经被注册的直达号的可能也会越来越大,并日益严重,这会造成用户在申请注册直达号时,需要多次查找更换直达号关键词,耗费用户大量的时间和精力,用户体验差。\n发明内容\n[0005] 本发明旨在至少在一定程度上解决上述技术问题。\n[0006] 为此,本发明的第一个目的在于提出一种直达号关键词的推荐方法,显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。\n[0007] 本发明的第二个目的在于提出一种直达号关键词的推荐装置。\n[0008] 为达上述目的,根据本发明第一方面实施例提出了一种直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;判断所述待查验直达号关键词是否已被直达号占用;如果判断所述待查验直达号关键词未被直达号占用,则向所述用户反馈查验通过结果;以及如果判断所述待查验直达号关键词被直达号占用,则根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。\n[0009] 本发明实施例的直达号关键词的推荐方法,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。\n[0010] 本发明第二方面实施例提供了一种直达号关键词的推荐装置,包括:建立模块,用于建立候选关键词资源库;第一接收模块,用于提供直达号注册界面,并接收用户在所述直达号注册界面中输入的待查验直达号关键词;判断模块,用于判断所述待查验直达号关键词是否已被直达号占用;反馈模块,用于在所述判断模块判断所述待查验直达号关键词未被直达号占用时,向所述用户反馈查验通过结果;以及提供模块,用于在所述判断模块判断所述待查验直达号关键词被直达号占用时,根据所述待查验直达号关键词和所述候选关键词资源库生成候选关键词列表,并将所述候选关键词列表提供至所述用户。\n[0011] 本发明实施例的直达号关键词的推荐装置,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。\n[0012] 本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。\n附图说明\n[0013] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:\n[0014] 图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图;\n[0015] 图2为根据本发明一个实施例的建立候选关键词资源库的流程图;\n[0016] 图3为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图;\n[0017] 图4为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图;\n[0018] 图5为根据本发明一个具体实施例的直达号关键词的推荐装置的结构示意图;\n[0019] 图6为根据本发明另一个实施例的直达号关键词的推荐装置的结构示意图。\n具体实施方式\n[0020] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。\n[0021] 在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。\n[0022] 下面参考附图描述根据本发明实施例的直达号关键词的推荐方法和装置。\n[0023] 为了降低用户在申请注册直达号时的时间成本,本发明提出了一种直达号关键词的推荐方法,包括以下步骤:建立候选关键词资源库;提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断待查验直达号关键词是否已被直达号占用;如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果;以及如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。\n[0024] 图1为根据本发明一个实施例的直达号关键词的推荐方法的流程图。如图1所示,根据本发明实施例的直达号关键词的推荐方法,包括:\n[0025] S101,建立候选关键词资源库。\n[0026] 具体地,图2为根据本发明一个实施例的建立候选关键词资源库的流程图。如图2所示,建立候选关键词资源库具体包括:\n[0027] S201,获取多个搜索日志。\n[0028] 在本发明的示例中,可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。具体地,可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。\n[0029] S202,提取多个搜索日志中的多个候选关键词。\n[0030] 在本发明的一个实施例中,图3为根据本发明一个实施例的提取多个搜索日志中的多个候选关键词的具体流程图。如图3所示,提取多个搜索日志中的多个候选关键词具体包括:提取多个搜索日志中的多个候选关键词具体包括:\n[0031] S301,提取每个搜索日志中的搜索关键词。\n[0032] 具体地,可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。\n[0033] S302,如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词。\n[0034] 其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。\n举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。\n[0035] 举例来说,特殊标识可以是特殊符号,例如,“@”、“#!”等。\n[0036] 如果搜索关键词符合直达号定义的语法规则,例如,搜索关键词为“@海底捞”,则可将该搜索关键词作为候选关键词。\n[0037] S303,如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性。\n[0038] 具体地,在本发明的一个实施例中,如果搜索关键词不符合直达号定义的语法规则,则可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。\n[0039] 由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。\n[0040] 因此,在本发明的另一个实施例中,在进一步获取搜索关键词的词性之前,还可包括:根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。\n[0041] S304,如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。\n[0042] S203,根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值。\n[0043] 在本发明的一个实施例中,根据已有的直达号对多个候选关键词进行筛选具体包括:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。\n[0044] 其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。\n[0045] 可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。\n[0046] 如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。\n[0047] 在对候选关键词进行筛选后,可获取每个候选关键词的计数值。其中,候选关键词的计数值是在对每个搜索日志进行候选关键词提取和筛选的过程中动态更新的。具体地,当从一个搜索日志中提取的搜索关键词被确定为候选关键词,且该候选关键词不属于直达号资源库时,如果该候选关键词尚未有对应的计数值,则表明这个搜索词第一次被作为搜索关键词,将该候选关键词的计数值记录为预设的初始分值(例如,可为1);如果该候选关键词已经有对应的计数值,则将该候选关键词的计数值增加预设分值(例如,预设分值可为\n1、2等)。由此,在对候选关键词筛选之后可直接获取每个筛选后的候选关键词的计数值。\n[0048] S204,根据筛选之后的候选关键词和候选关键词对应的计数值建立候选关键词资源库。\n[0049] 其中,候选关键词资源库是用于存储候选关键词及其对应的计数值或者其他相关信息的数据库。\n[0050] 具体地,在本发明的一个实施例中,首先可建立一个空的候选资源库,然后在对每个搜索日志进行分析以提取出其中的候选关键词并进行筛选的过程中,可在筛选出候选关键词时,查询候选关键词资源库,如果候选关键词资源库中已经存在该候选关键词对应的记录,则更新候选关键词资源库中该候选关键词对应的计数值;如果候选关键词资源库中尚未有该候选关键词对应的记录,则将该候选关键词的计数值记录为预设的初始分值,并作为一条新的记录插入到候选关键词资源库中。由此,通过对多个搜索日志进行分析,就可实现候选关键词资源库的建立。\n[0051] 应当理解,候选关键词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。\n[0052] 在本发明的一个实施例中,在获取筛选之后的每个候选关键词对应的计数值之后,该推荐方法还可包括根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分的步骤。进一步地,可将每个候选关键词的评分也分别存储在候选关键词资源库中。\n[0053] 其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;\n[0054] 另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。\n[0055] S102,提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词。\n[0056] 在本发明的一个实施例中,直达号服务平台可在网页或者客户端界面中提供直达号注册入口,当用户触发直达号注册入口时,可为用户提供直达号注册界面。注册界面中具有多个输入框,以供注册用户输入用户的注册信息以及待查验直达号关键词等。\n[0057] 在本发明的一个实施例中,在注册用户输入待查验直达号关键词的过程中,直达号注册界面中的JS(JavaScript)代码以异步传输的方式实时将注册用户输入的内容发送给直达号服务平台。\n[0058] S103,判断待查验直达号关键词是否已被直达号占用。\n[0059] 在本发明的实施例中,可根据待查验直达号关键词查询直达号资源库,如果待查验直达号关键词输入直达号资源库,则判断待查验直达号关键词已被直达号占用,否则判断待查验直达号关键词未被直达号占用。\n[0060] S104,如果判断待查验直达号关键词未被直达号占用,则向用户反馈查验通过结果。\n[0061] 具体地,如果判断待查验直达号关键词未被直达号占用,可向用户反馈查验通过结果,并提示用户可用该待查验直达号关键词作为直达号名称进行申请注册。\n[0062] S105,如果判断待查验直达号关键词被直达号占用,则根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。\n[0063] 在本发明的一个实施例中,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表可具体包括:\n[0064] 首先,根据待查验直达号关键词查询候选关键词资源库以生成第一候选关键词列表。具体地,可遍历候选关键词资源库中的所有候选关键词,并按照预设的匹配策略从候选关键词资源库中选出与待查验直达号关键词相匹配的候选关键词,生成第一候选关键词列表。举例来说,匹配策略可以是:以待查验直达号关键词为前缀,或以待查验直达号关键词为后缀,或包含待查验直达号关键词,或以与待查验直达号关键词存在超过预设长度的公共子串等。\n[0065] 然后,根据第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将第二候选关键词列表作为候选关键词列表。由于候选关键词对应的评分是候选关键词的商业价值、服务价值、用户关注度、以及用户需求度等多方面的综合反映,因此,可根据候选关键词对应的评分从第一候选关键词列表中进一步筛选出评分较大的预设数量的候选关键词,生成第二候选关键词列表。\n[0066] 在生产第二候选关键词列表后,可将第二候选关键词列表提供给用户。\n[0067] 在本发明的一个可选的实施例中,在向用户提供第二候选关键词列表时,还可以根据每个候选关键词所对应的评分给每个候选关键词确定一种展现样式,以向用户传递每个候选关键词的不同商业价值、关注度、服务价值等。例如,评分越高的候选关键词,其展现的字体就越大,和/或其字体加粗程度也越大,或者根据评分由高到低,将展现的颜色分别设定为红、橙、黄、蓝等。不但能够更直观的明了地为用户提供候选关键词,并且增强了展示的多样性和趣味性。\n[0068] 在本发明的一个可选实施例中,在向用户提供第二候选关键词列表时,还可将第二候选关键词列表中每个候选关键词对应的评分也提供给用户,以使用户对推荐的候选关键词有一个更加直观的认知,便于用户根据需要进行选择。\n[0069] 本发明实施例的直达号关键词的推荐方法,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。\n[0070] 在本发明的一个实施例中,该直达号关键词的推荐方法,还可包括:接收用户在候选关键词列表中选择的候选关键词;以及根据用户选择的候选关键词更新候选关键词资源库。具体地,当用户从候选关键词列表中选择候选关键词进行注册后,可在候选关键词资源库中将用户选择的候选关键词对应的记录删除。从而保证该候选关键词不会再次推荐给其他用户。\n[0071] 同理,保证用户已申请注册或准备申请注册的关键词不会推荐给其他用户在本发明的实施例中,在待查验直达号关键词查验通过后,如果用户根据该待查验直达号关键词进行了申请注册,则根据待查验直达号关键词查询候选关键词资源库,如果候选关键词资源库中有该待查验直达号关键词对应的记录,则删除该记录。从而,保证候选关键词资源库中的候选关键词是未被直达号占用的关键词,并且避免出现一个直达号被多个用户注册的情况。\n[0072] 为了实现上述实施例,本发明还提出一种直达号关键词的推荐装置。\n[0073] 一种直达号关键词的推荐装置,包括:建立模块,用于建立候选关键词资源库;第一接收模块,用于提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词;判断模块,用于判断待查验直达号关键词是否已被直达号占用;反馈模块,用于在判断模块判断待查验直达号关键词未被直达号占用时,向用户反馈查验通过结果;以及提供模块,用于在判断模块判断待查验直达号关键词被直达号占用时,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。\n[0074] 图4为根据本发明一个实施例的直达号关键词的推荐装置的结构示意图。\n[0075] 如图4所示,根据本发明实施例的直达号关键词的推荐装置,包括:建立模块10、第一接收模块20、判断模块30、反馈模块40和提供模块50。\n[0076] 具体地,建立模块10用于建立候选关键词资源库。\n[0077] 更具体地,如图5所示,建立模块10具体包括:获取单元11、提取单元12、获取单元\n13和建立单元14,获取单元11表示第一获取单元;获取单元13表示第二获取单元,其中:\n[0078] 获取单元11用于获取多个搜索日志。在本发明的示例中,可按照预设时间或预设周期(如每周、每天或每小时等)获取这段时间内的搜索日志。具体地,可在预设时间或者预设周期内,记录并收集大量用户在这段时间内的搜索日志,以获取多个搜索日志。\n[0079] 提取单元12用于提取多个搜索日志中的多个候选关键词。\n[0080] 在本发明的一个实施例中,提取单元12具体用于:提取每个搜索日志中的搜索关键词;如果搜索关键词符合直达号定义的语法规则,则将搜索关键词作为候选关键词;如果搜索关键词不符合直达号定义的语法规则,则进一步获取搜索关键词的词性;以及如果搜索关键词的词性为名词,则将搜索关键词作为候选关键词。\n[0081] 更具体地,提取单元12可对获取到的多个搜索日志分别进行句法分析、分词等,并提取出每个搜索日志中的搜索关键词。\n[0082] 其中,直达号定义的语法规则为用于标识搜索词是用于执行直达号功能的规则。\n举例来说,直达号定义的语法规则可以是特殊标识与词语的组合,本发明对特殊标识与词语之间的组合方式不做限定,例如,可以是词语以特殊标识为前缀或者后缀等。举例来说,特殊标识可以是特殊符号,例如,“@”、“#!”等。\n[0083] 如果搜索关键词符合直达号定义的语法规则,例如,搜索关键词为“@海底捞”,则提取单元12可将该搜索关键词作为候选关键词。如果搜索关键词不符合直达号定义的语法规则,则提取单元12可通过现有的一些词性分析算法对搜索关键词进行词性分析,以确定搜索关键词的词性。\n[0084] 由于词性分析算法的计算量比较大,占用CPU、内存等系统资源较多,且耗时较长,因此,为了减少对系统资源的消耗,节约时间,在每次确定了一个搜索关键词的词性后,可将搜索关键词与其确定的词性之间的对应关系作为缓存数据存储在本地内存或磁盘上。\n[0085] 因此,在本发明的另一个实施例中,提取单元12还用于:在进一步获取搜索关键词的词性之前,根据搜索关键词查询缓存数据,以从缓存数据中查询搜索关键词对应的词性。\n如果缓存数据中没有存储该搜索关键词对应的词性,在通过词性分析算法来分析搜索关键词的词性,从而实现了对提取候选关键词的过程的优化,大大降低了这个过程对系统资源的消耗,并显著地降低了提取候选关键词的时间。\n[0086] 获取单元13用于根据已有的直达号对多个候选关键词进行筛选,并获取筛选之后的每个候选关键词对应的计数值。\n[0087] 在本发明的一个实施例中,获取单元13具体用于:判断提取的候选关键词是否属于直达号资源库;如果属于直达号资源库,则将候选关键词丢弃。\n[0088] 其中,直达号资源库中记录了所有已开通的直达号的相关信息,包括已开通的直达号的关键词(即已注册的直达号关键词),已开通的直达号的关键词是这个直达号独占的,其他直达号不能再申请以该关键词作为直达号名称来开通另一个直达号。\n[0089] 获取单元13可通过将提取的候选关键词与直达号资源库中的直达号的关键词进行匹配,如果直达号资源库中存在与候选关键词相匹配的直达号的关键词,则该候选关键词属于直达号资源库,否则,该候选关键词不属于直达号资源库。\n[0090] 如果提取的候选关键词属于直达号资源库,则表明该候选关键词已经被已开通的直达号占用,不能再作为其他直达号的关键词,因此,需要将其丢弃。由此,可筛选出可作为其他直达号的关键词的候选关键词。\n[0091] 在对候选关键词进行筛选后,获取单元13可获取每个候选关键词的计数值。其中,候选关键词的计数值是在对每个搜索日志进行候选关键词提取和筛选的过程中动态更新的。更具体地,当从一个搜索日志中提取的搜索关键词被确定为候选关键词,且该候选关键词不属于直达号资源库时,如果该候选关键词尚未有对应的计数值,则表明这个搜索词第一次被作为搜索关键词,将该候选关键词的计数值记录为预设的初始分值(例如,可为1);\n如果该候选关键词已经有对应的计数值,则将该候选关键词的计数值增加预设分值(例如,预设分值可为1、2等)。由此,在对候选关键词筛选之后可直接获取每个筛选后的候选关键词的计数值。\n[0092] 建立单元14用于根据筛选之后的候选关键词和候选关键词对应的计数值建立候选关键词资源库。其中,候选关键词资源库是用于存储候选关键词及其对应的计数值或者其他相关信息的数据库。\n[0093] 更具体地,在本发明的一个实施例中,首先建立单元14可建立一个空的候选资源库,然后在对每个搜索日志进行分析以提取出其中的候选关键词并进行筛选的过程中,可在筛选出候选关键词时,查询候选关键词资源库,如果候选关键词资源库中已经存在该候选关键词对应的记录,则更新候选关键词资源库中该候选关键词对应的计数值;如果候选关键词资源库中尚未有该候选关键词对应的记录,则将该候选关键词的计数值记录为预设的初始分值,并作为一条新的记录插入到候选关键词资源库中。由此,通过对多个搜索日志进行分析,就可实现候选关键词资源库的建立。\n[0094] 应当理解,候选关键词资源库可以存储在内存中,也可以存储在磁盘中,可以存储在提取候选关键词的终端本地,也可以存储在其他独立的终端中或者服务器端,本发明对此不做限定。\n[0095] 在本发明的一个实施例中,可选地,建立模块10还可包括生成单元15,用于在获取筛选之后的每个候选关键词对应的计数值之后,根据候选关键词对应的计数值和预设的模型生成候选关键词对应的评分。进一步地,可将每个候选关键词的评分也分别存储在候选关键词资源库中。\n[0096] 其中,预设模型可以是将候选关键词对应的计数值转换为评分的数值转换模型;\n[0097] 另外,预设模型还可以是针对候选关键词对应的计数值以及商业价值评分、服务评分等其他方面的评分综合评价模型,例如,可以是对多个方面的加权模型。其中,商业价值评分、服务评分等其他方面的评分可通过一些商业系统(如百度的凤巢系统)、服务系统或者第三方评分系统等获取。从而,可综合多方面的评价标准对候选关键词进行更精准的评价。\n[0098] 第一接收模块20用于提供直达号注册界面,并接收用户在直达号注册界面中输入的待查验直达号关键词。\n[0099] 在本发明的一个实施例中,直达号服务平台可在网页或者客户端界面中提供直达号注册入口,当用户触发直达号注册入口时,可为用户提供直达号注册界面。注册界面中具有多个输入框,以供注册用户输入用户的注册信息以及待查验直达号关键词等。\n[0100] 在本发明的一个实施例中,在注册用户输入待查验直达号关键词的过程中,第一接收模块20通过直达号注册界面中的JS(JavaScript)代码以异步传输的方式实时接收注册用户输入的内容。\n[0101] 判断模块30用于判断待查验直达号关键词是否已被直达号占用。\n[0102] 在本发明的实施例中,判断模块30可根据待查验直达号关键词查询直达号资源库,如果待查验直达号关键词输入直达号资源库,则判断待查验直达号关键词已被直达号占用,否则判断待查验直达号关键词未被直达号占用。\n[0103] 反馈模块40用于在判断模块判断待查验直达号关键词未被直达号占用时,向用户反馈查验通过结果。\n[0104] 更具体地,如果判断待查验直达号关键词未被直达号占用,反馈模块40可向用户反馈查验通过结果,并提示用户可用该待查验直达号关键词作为直达号名称进行申请注册。\n[0105] 提供模块50用于在判断模块判断待查验直达号关键词被直达号占用时,根据待查验直达号关键词和候选关键词资源库生成候选关键词列表,并将候选关键词列表提供至用户。\n[0106] 在本发明的一个实施例中,提供模块50具体用于:\n[0107] 首先,根据待查验直达号关键词查询候选关键词资源库以生成第一候选关键词列表。更具体地,提供模块50可遍历候选关键词资源库中的所有候选关键词,并按照预设的匹配策略从候选关键词资源库中选出与待查验直达号关键词相匹配的候选关键词,生成第一候选关键词列表。举例来说,匹配策略可以是:以待查验直达号关键词为前缀,或以待查验直达号关键词为后缀,或包含待查验直达号关键词,或以与待查验直达号关键词存在超过预设长度的公共子串等。\n[0108] 然后,根据第一候选关键词列表中每个候选关键词对应的评分生成第二候选关键词列表,并将第二候选关键词列表作为候选关键词列表。由于候选关键词对应的评分是候选关键词的商业价值、服务价值、用户关注度、以及用户需求度等多方面的综合反映,因此,提供模块50可根据候选关键词对应的评分从第一候选关键词列表中进一步筛选出评分较大的预设数量的候选关键词,生成第二候选关键词列表。\n[0109] 在生产第二候选关键词列表后,提供模块50可将第二候选关键词列表提供给用户。\n[0110] 在本发明的一个可选的实施例中,在向用户提供第二候选关键词列表时,提供模块50还可以根据每个候选关键词所对应的评分给每个候选关键词确定一种展现样式,以向用户传递每个候选关键词的不同商业价值、关注度、服务价值等。例如,评分越高的候选关键词,其展现的字体就越大,和/或其字体加粗程度也越大,或者根据评分由高到低,将展现的颜色分别设定为红、橙、黄、蓝等。不但能够更直观的明了地为用户提供候选关键词,并且增强了展示的多样性和趣味性。\n[0111] 在本发明的一个可选实施例中,在向用户提供第二候选关键词列表时,提供模块\n50还可将第二候选关键词列表中每个候选关键词对应的评分也提供给用户,以使用户对推荐的候选关键词有一个更加直观的认知,便于用户根据需要进行选择。\n[0112] 本发明实施例的直达号关键词的推荐装置,通过建立候选关键词资源库,并在用户输入的待查验直达号关键词已经被直达号占用时,根据待查验直达号关键词和建立的候选关键词资源库为用户提供候选关键词列表,从而在待查验直达号关键词已经被直达号占用时,用户无需多次查找更换可用的、未被占用的直达号关键词,能够显著降低了用户在申请注册直达号时的时间成本,减少用户的时间和精力的消耗,提升了用户体验。\n[0113] 图6为根据本发明另一个实施例的直达号关键词的推荐装置的结构示意图。\n[0114] 如图6所示,该直达号关键词的推荐装置,包括:建立模块10、第一接收模块20、判断模块30、反馈模块40、提供模块50、第二接收模块60和更新模块70。\n[0115] 具体地,建立模块10、第一接收模块20、判断模块30、反馈模块40和提供模块50可参照图4所示实施例,在此不再赘述。\n[0116] 第二接收模块60用于接收用户在候选关键词列表中选择的候选关键词。\n[0117] 更新模块70用于根据用户选择的候选关键词更新候选关键词资源库。\n[0118] 更具体地,当用户从候选关键词列表中选择候选关键词进行注册后,可在候选关键词资源库中将用户选择的候选关键词对应的记录删除。从而保证该候选关键词不会再次推荐给其他用户。\n[0119] 同理,保证用户已申请注册或准备申请注册的关键词不会推荐给其他用户在本发明的实施例中,在待查验直达号关键词查验通过后,如果用户根据该待查验直达号关键词进行了申请注册,则根据待查验直达号关键词查询候选关键词资源库,如果候选关键词资源库中有该待查验直达号关键词对应的记录,则删除该记录。从而,保证候选关键词资源库中的候选关键词是未被直达号占用的关键词,并且避免出现一个直达号被多个用户注册的情况。\n[0120] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。\n[0121] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。\n[0122] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。\n[0123] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。\n[0124] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。\n[0125] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。\n[0126] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。\n[0127] 尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。
法律信息
- 2018-11-20
- 2015-04-22
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201410705960.8
申请日: 2014.11.27
- 2015-03-25
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2013-01-02
|
2011-04-18
| | |
2
| |
2014-11-12
|
2014-08-01
| | |
3
| |
2014-02-12
|
2012-07-30
| | |
4
| |
2007-10-03
|
2006-03-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |