著录项信息
专利名称 | 一种信息推送方法和装置 |
申请号 | CN201110138313.X | 申请日期 | 2011-05-25 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2012-11-28 | 公开/公告号 | CN102799589A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 阿里巴巴集团控股有限公司 | 申请人地址 | 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴集团控股有限公司 | 当前权利人 | 阿里巴巴集团控股有限公司 |
发明人 | 朱楼华;杨志雄;朱成永 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 逯长明;王宝筠 |
摘要
本申请实施例公开了一种信息推送方法和装置。其中,方法包括:从用户提交的问题中提取关键词;按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户;计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。根据本申请实施例,可以提高知识百科系统对答案的反馈速度,以及解答的准确性。
1.一种信息推送方法,其特征在于,包括:
从用户提交的问题中提取关键词;
按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;其中,按照所述关键词与发布信息的匹配程度对发布信息进行排序,按照匹配度从高到低的顺序,从匹配度最大的发布信息开始,根据不同系统中的需要,获取一定数目的发布信息;
按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户,所述与发布信息相关的相关用户包括发布、反馈、浏览或查询所述发布信息的用户;
计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。
2.根据权利要求1所述的方法,其特征在于,所述计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的相关用户包括:
按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第一匹配度;
按照从高到低的顺序对所述第一匹配度进行排序,将问题发送给从第一匹配度最高的用户开始的、预置数目的用户。
3.根据权利要求1所述的方法,其特征在于,所述计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的相关用户包括:
按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;
计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第二匹配度;
按照从高到低的顺序将对所述第二匹配度进行排序,将问题发送给从第二匹配度最高的用户开始的预置数目的用户。
4.根据权利要求1所述的方法,其特征在于,所述计算所述问题与所述用户之间的匹配度,将所述问题推送给匹配度最高的相关用户的预置数目的相关用户包括:
按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;
计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第一匹配度,以及,计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第二匹配度;
按照从高到低的顺序对所述第一匹配度和第二匹配度进行排序,将问题发送给从匹配度最高的用户开始的、预置数目的用户。
5.根据权利要求3或4所述的方法,其特征在于,所述按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度为:计算反馈所述发布信息的用户的反馈次数与反馈的时效性因子的乘积,其中,距离当前统计时间近的反馈比距离当前统计时间远的反馈的时效性因子大。
6.一种信息推送装置,其特征在于,包括:
提取单元,用于从用户提交的问题中提取关键词;
获取单元,用于按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;其中,按照所述关键词与发布信息的匹配程度对发布信息进行排序,按照匹配度从高到低的顺序,从匹配度最大的发布信息开始,根据不同系统中的需要,获取一定数目的发布信息;
统计单元,用于按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户,所述与发布信息相关的相关用户包括发布、反馈、浏览或查询所述发布信息的用户;
推送单元,用于计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。
7.根据权利要求6所述的装置,其特征在于,所述推送单元包括:
第一权重分配子单元,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
第二权重分配子单元,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
第一匹配度计算子单元,用于计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第一匹配度;
第一发送子单元,用于按照从高到低的顺序对所述第一匹配度进行排序,将问题发送给从第一匹配度最高的用户开始的、预置数目的用户。
8.根据权利要求6所述的装置,其特征在于,所述推送单元包括:
第一权重分配子单元,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
第二权重分配子单元,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
反馈度统计子单元,用于按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;
第二匹配度计算子单元,用于计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第二匹配度;
第二发送子单元,用于按照从高到低的顺序将对所述第二匹配度进行排序,将问题发送给从第二匹配度最高的用户开始的、预置数目的用户。
9.根据权利要求6所述的装置,其特征在于,所述推送单元包括:
第一权重分配子单元,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;
第二权重分配子单元,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;
反馈度统计子单元,用于按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;
综合计算子单元,用于计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第一匹配度,以及,计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第二匹配度;
第三发送子单元,用于按照从高到低的顺序对所述第一匹配度和第二匹配度进行排序,将问题发送给从匹配度最高的用户开始的预置数目的用户。
10.根据权利要求8或9所述的装置,其特征在于,所述反馈度统计子单元包括:
计算子单元,用于计算反馈所述发布信息的用户的反馈次数与反馈的时效性因子的乘积,其中,距离当前统计时间近的反馈比距离当前统计时间远的反馈的时效性因子大。
一种信息推送方法和装置\n技术领域\n[0001] 本申请涉及通信和计算机技术领域,特别是涉及一种信息推送方法和装置。\n背景技术\n[0002] 现有的知识百科系统可以解答用户提出的各种的问题,如果知识百科系统平台接收到一个客户端发送的一个最新问题消息,知识百科系统从客户端提交的最新问题消息中提取出若干个关键词,从数据库中查找包含至少一个提取出的关键词的历史问题消息,再进一步查找发布这些历史问题消息的客户端,默认这些客户端就是可能回答该最新问题消息的客户端,最后将该最新问题消息发送给查找到的所有客户端。\n[0003] 但是,发明人在研究中发现,现有的知识百科系统在查找能够回答最新问题的客户端时,需要查找包含提取出的关键词的所有历史问题消息,并进一步查找发布这些历史问题消息的所有客户端。往往,知识百科系统查找到的客户端的数量是庞大的,因此,在查找过程中,知识百科系统需要消耗服务器大量的资源,不仅增加了服务器的负担,而且对服务器的处理能力也有很高的要求。并且,如果知识百科系统将该最新问题消息发布给查找到的所有客户端,势必会使网络中传输的数据量增大,易造成网络堵塞,最终增加了网络的负担。\n发明内容\n[0004] 为了解决上述技术问题,本申请实施例提供了一种信息推送方法和装置,以降低知识百科系统在解答问题过程中的服务器和网络负担。\n[0005] 本申请实施例公开如下技术方案:\n[0006] 一种信息推送方法,包括:\n[0007] 从用户提交的问题中提取关键词;\n[0008] 按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;\n[0009] 按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户;\n[0010] 计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。\n[0011] 一种信息推送装置,包括:\n[0012] 提取单元,用于从用户提交的问题中提取关键词;\n[0013] 获取单元,用于按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;\n[0014] 统计单元,用于按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户;\n[0015] 推送单元,用于计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。\n[0016] 由上述实施例可以看出,新问题被提交后,系统能查找与问题的发布信息相关的相关用户,进而有针对性地把问题推送到这些相关用户面前。对于服务器而言,服务器只向特定用户推送“问题”,而不是向所有的用户都推送问题,因此,降低了服务器资源的消耗,减少了服务器的负担。另外,由于只向特定的用户推送问题,也就减少了网络中的数据传送量,提高了网络传输速度,减少了网络的负担。\n[0017] 并且,相比单一的被动文本匹配方法在问题解决效率,答案观点的广泛性和精准性都有很大的提高,对商业知识百科问题的解决和答案的推广更具指导性。\n附图说明\n[0018] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。\n[0019] 图1为本申请一种信息推送方法的一个实施例的流程图;\n[0020] 图2为本申请中根据匹配度将问题推送给用户的一个实施方式的流程图;\n[0021] 图3为本申请中根据匹配度将问题推送给用户的另一个实施方式的流程图;\n[0022] 图4为本申请中根据匹配度将问题推送给用户的另一个实施方式的流程图;\n[0023] 图5为本申请一种信息推送方法的另一个实施例的流程图;\n[0024] 图6为本申请一种信息推送装置的一个实施的结构图;\n[0025] 图7为本申请中推送单元的一个结构图;\n[0026] 图8为本申请中推送单元的另一个结构图;\n[0027] 图9为本申请中推送单元的另一个结构图。\n具体实施方式\n[0028] 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例进行详细描述。\n[0029] 实施例一\n[0030] 请参阅图1,其为本申请一种信息推送方法的一个实施例的流程图,该方法包括以下步骤:\n[0031] 步骤101:从用户提交的问题中提取关键词;\n[0032] 在用户提交问题页面,用户除了提交问题外,系统还会要求用户在输入问题内容的同时,指定问题所属的类目,建立问题和类目的对应关系。例如,可以在提交问题界面中设立有类目下拉列表,供用户在下拉列表中指定所提交的问题的所属类目。\n[0033] 另外,当用户提交问题成功后,为了保证用户提交的类目的准确性,还可以进一步进入审核流程,由运营人员人工审核问题与类目对应关系的正确顶,如果对应关系错误,可以由运营人员修改问题与类目的对应关系。\n[0034] 用户提交的问题提交给网络服务器之后,由网络服务器根据问题的语义,提取问题中的关键词。\n[0035] 需要说明的是,在本申请的技术方案中,对提取出的关键词的数量并不进行限定,可以根据不同系统中的需要,任意设定提取出的关键词的数量。另外,也可以采用任何一种实施在现有技术中的根据语义提取关键词的方法,本申请对提取方法也不做具体的限定。\n[0036] 步骤102:按照文本匹配方法从用户的历史行为数据中获取与所述关键词相关的发布信息;\n[0037] 发布信息是指用户在网站发布的商业产品的生产或求购信息,每个发布信息之间由发布信息标识(offer_ID)来区分。另外,从用户的历史行为数据中还可以获取到每个发布信息所属的类目。\n[0038] 为了减少信息处理量,除了可以获取与每个关键词相关的全部发布信息外,优选的,对于每一个关键词,可以按照关键词与发布信息的匹配程度对发布信息进行排序,按照匹配度从高到低的顺序,从匹配度最大的发布信息开始,根据不同系统中的需要,获取一定数目的发布信息。\n[0039] 需要说明的是,在申请的技术方案中,可以采用任何一种实施在现有的搜索技术中的文本匹配方法来获取与每个关键词相关的发布信息,本申请对发布信息的提取方法本身并不进行限定。\n[0040] 步骤103:按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户;\n[0041] 其中,与发布信息相关的相关用户可以是发布该发布信息的用户,也可以是反馈该发布信息的用户,还可以是浏览或者查询该发布信息的用户等。按照统计分析方法,从数据库中所记录的每个用户的历史行为数据中,统计出与每个获取的发布信息相关的相关用户。\n[0042] 需要说明的是,在本申请的技术方案中,可以采用任何一种实施在现有的搜索技术中的统计分析方法来获得与每个发布信息相关的相关用户,本申请对相关用户的获取方法本申请并不进行限定。\n[0043] 步骤104:计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。\n[0044] 在获得的与每个发布信息相关的所有相关用户中,计算用户提交的该问题与每个相关用户之间的匹配度,最后,将问题推送给从匹配度最高的相关用户开始的,预置数目的用户。例如,经过统计,与每个发布信息相关的相关用户共有100个,分别计算用户提交的问题与这100个相关用户的匹配度,对100个相关用户的匹配度按照从高到低的顺序进行排序,从匹配度最高的相关用户开始,提取预置数目的相关用户,如提取10个相关用户,最后,将用户提交的该问题推送给这10个用户。\n[0045] 需要说明的是,在申请的技术方案中,对提取的相关用户的数量并不进行限定,可以根据不同系统中的需要,任意设定提取出的相关用户的数量。\n[0046] 优选的,当与发布信息相关的相关用户为发布该发布信息的用户时,所述计算所述问题与所述相关用户之间的匹配度,将所述问题推送给匹配度最高的相关用户开始的、预置数目的相关用户包括以下步骤,如图2所示,\n[0047] S1041A:按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0048] 例如,以列表的形式列出重要性与权重之间的对应关系,其中,重要性高的关键词比重要性低的关键词的权重大。对于某一个关键词而言,当获得该关键词在语义表达上对问题的重要性后,通过对应关系列表查找与获得的重要性相对应的权重。\n[0049] S1042A:按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0050] 例如,以列表的形式列出匹配度权重之间的对应关系,其中,匹配度高的发布信息比匹配度低的发布信息的权重大。对于某一个发布信息而言,当获得该发布信息与关键词的匹配度后,通过对应关系列表查找与获得的匹配度相对应的权重。\n[0051] S1043A:计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,将所述结果作为问题与发布所述发布信息的用户之间的第一匹配度;\n[0052] S1044A:按照从高到低的顺序对所述第一匹配度进行排序,将问题发送给从第一匹配度最高的用户开始的预置数目的用户。\n[0053] 假设从用户提交的问题中提取出的关键词数量为n个,分别为Kw1、Kw2、Kw3......Kwn,按照n个关键词在语义表述上对问题的重要性分别为n个关键词分配权重,重要性高的关键词比重要性低的关键词的权重大,因此,重要性最高的关键词分配的权重最大,重要性最低的关键词分配的权重最小,重要性相等或者相近的关键词可以分配相同的权重值。\n[0054] 在此,需要强调的是,在本申请的技术方案中,并不对分配给每个关键词的权重的具体数值进行限定,只要满足重要性高的关键词比重要性低的关键词的权重大即可。\n[0055] 例如,如果已经按照重要性从高到低的顺序为关键词进行了排序,可以为第一位的关键词分配权重值0.5,为第二位的关键词分配权重值0.3,为第三位的关键词分配权重值0.2,当其余的关键词的重要性相差很小,认为相近似时,可以为其余的关键词分配权重值0.1,如下表所示,下表为权值的分配结果。\n[0056]\n Kw1 Kw2 Kw3 Kw4 ..... Kwn\n 0.5 0.3 0.2 0.1 0.1 0.1\n[0057] 假设对于关键词Kw1,获取的发布信息的数量为m个,分别为offer1、offer2、offer3......offerm,按照发布信息与关键词的匹配度为获取的发布信息分配权重,匹配度高的发布信息比匹配度低的发布信息的权重大,因此,匹配度最高的发布信息分配的权重最大,匹配度最低的发布信息分配的权重最小,匹配度相等或者相近的发布信息可以分配相同的权重值。\n[0058] 在此,也需要强调的是,在本申请的技术方案中,并不对分配给每个发布信息的权重的具体数值进行限定,只要满足匹配度高的发布信息比匹配度低的发布信息的权重大即可。\n[0059] 例如,如下表所示,下表为发布信息的分配结果。\n[0060]\n offer 1 offer 2 offer 3 offer 4 offer 5 ..... offer m\n 1.5 1.4 1.3 1.2 1.1 1.0 1.0\n[0061]\n \n[0062] 计算完权重后,按照公式Match_Offer_Owner=Weight_KW×Weight_Offer+Category_match计算用户提交的问题与发布发布信息的用户之间的第一匹配度,其中,Weight_KW为关键词的权重,Weight_Offer为发布信息的权重,Category_match为用户提交的问题的类目与发布信息的类目之间匹配度。如果用户提交的问题的类目与发布信息的类目相同,用户提交的问题的类目与发布信息的类目匹配,匹配度为1,如果用户提交的问题的类目与发布信息的类目不同,用户提交的问题的类目与发布信息的类目不匹配,匹配度为0。\n[0063] 在计算得到用户提交的问题与发布该问题的发布信息的用户之间的第一匹配度后,按照从高到低的顺序对第一匹配度进行排序,将问题发送给从第一匹配度最高的用户开始,预置数目的用户。\n[0064] 另一种优选的方式是,如果与发布信息相关的相关用户为反馈该发布信息的用户,所述计算所述问题与所述相关用户之间的匹配度,将所述问题推送给匹配度最高的相关用户开始的、预置数目的相关用户包括如下步骤,如图3所述,\n[0065] S1041B:按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0066] S1042B:按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0067] S1043B:按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;\n[0068] 例如,如果发布信息为某个商业产品的生产信息,则用户反馈发布信息就是指用户发布信息表示需要购买该商业产品,如果发布信息为某个商业产品的求购信息,则用户反馈发布信息就是指用户发布信息表示需要出售该商业产品。\n[0069] S1044B:计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,将所述结果作为所述问题与反馈所述发布信息的用户之间的第二匹配度;\n[0070] S1045B:按照从高到低的顺序将对所述第二匹配度进行排序,将问题发送给从第一匹配度最高的用户开始的、预置数目的用户。\n[0071] 其中,反馈发布信息的用户对发布信息的反馈度反映了该用户对发布信息的关注度,优选的,一种计算反馈度的方法是:计算反馈所述发布信息的用户的反馈次数与所述反馈的时效性因子的乘积,其中,距离当前统计时间近的反馈比距离当前统计时间远的反馈的时效性因子大。\n[0072] 例如,用户A在30天前对offer1进行了10次反馈,而用户B在最近3天对offer1进行了10次反馈,由于用户B的反馈距离当前统计时间比用户A的反馈距离当前统计时间近,因此,用户B的反馈的时效性因子比用户A的反馈的时效性因子大。如,设定用户B的反馈的时效性因子为0.5,用户A的反馈的时效性因子为0.3,则用于B对offer1的反馈度为0.5×10=\n5,用户A的反馈度为0.3×10=3。\n[0073] 需要强调的是,在本申请的技术方案中,并不对每个反馈用户的时效性因子的具体数值进行限定,只要满足距离当前统计时间近的反馈比距离当前统计时间远的时效性因子大即可。\n[0074] 在计算完权重和反馈度后,按照公式Match_Offer_Owner=Weight_KW×Weight_Offer×Feedback+Category_match计算用户提交的问题与反馈发布信息的用户之间的第二匹配度,其中,Weight_KW为关键词的权重,Weight_Offer为发布信息的权重,Feedback为反馈发布信息的用户对发布信息的反馈度,Category_match为用户提交的问题的类目与发布信息的类目之间匹配度。如果用户提交的问题的类目与发布信息的类目相同,用户提交的问题的类目与发布信息的类目匹配,匹配度为1,如果用户提交的问题的类目与发布信息的类目不同,用户提交的问题的类目与发布信息的类目不匹配,匹配度为0。\n[0075] 在计算得到用户提交的问题与反馈该问题的发布信息的用户之间的第二匹配度后,按照从高到低的顺序对第二匹配度进行排序,将问题发送给从第二匹配度最高的用户开始,预置数目的用户。\n[0076] 还有一种优选的方式是,如果与发布信息相关的相关用户既包括发布该发布信息的用户,也包括反馈该发布信息的用户,所述计算所述问题与所述相关用户之间的匹配度,将所述问题推送给匹配度最高的相关用户开始的、预置数目的相关用户包括以下步骤,如图4所示,\n[0077] S1041C:按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0078] S1042C:按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0079] S1043C:按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;\n[0080] S1044C:计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第一匹配度,以及,计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第二匹配度;\n[0081] S1045C:按照从高到低的顺序对所述第一匹配度和第二匹配度进行排序,将问题发送给从匹配度最高的用户开始的、预置数目的用户。\n[0082] 如果与发布信息相关的相关用户既包括发布该发布信息的用户,也包括反馈该发布信息的用户,在步骤S1045C中需要对第一匹配度和第二匹配度进行联合排序,最后,将问题发送给从匹配度最高的用户开始,预置数目的用户。\n[0083] 由上述实施例可以看出,新问题被提交后,系统能查找与问题的发布信息相关的相关用户,进而有针对性地把问题推送到这些相关用户面前。对于服务器而言,服务器只向特定用户推送“问题”,而不是向所有的用户都推送问题,因此,降低了服务器资源的消耗,减少了服务器的负担。另外,由于只向特定的用户推送问题,也就减少了网络中的数据传送量,提高了网络传输速度,减少了网络的负担。\n[0084] 发布信息并且,相比单一的被动文本匹配方法在问题解决效率,答案观点的广泛性和精准性都有很大的提高,对商业知识百科问题的解决和答案的推广更具指导性。\n[0085] 实施例二\n[0086] 下面以特定场景为例详细说明信息推送的整个过程。请参阅图5,其为本申请一种信息推送方法的另一个实施例的流程图,包括以下步骤:\n[0087] 步骤501:用户向网页服务器提交一个问题,并在问题类目的下拉列表中为该问题指定一个所属类目;\n[0088] 步骤502:网页服务器从提交的问题中提取关键词,按照关键词在语义表述上对该问题的重要性为提取的关键词分配权重;\n[0089] 例如,在提取出关键词后,网页服务器可以按照每个关键词在语义表述上对该问题的重要性程度,对关键词进行排序,重要性最高的关键词排在第一位,重要性最低的关键词排在最后一位。然后,网页服务器按照排序为每个关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大。\n[0090] 在从某个问题中提取出的众多关键词中,实际上,只有重要性比较高的关键词有使用的价值。为了避免在处理大量的关键词时所带来的处理效率问题,一种优选的实施方式是,在为每个关键词分配了权重后,可以从权重最大的关键词开始,只提取出一定数量的关键词进行后续的处理。提取数量可以根据系统的需要任意设定。这样,可以提高信息推送的处理效率。\n[0091] 步骤503:网页服务器依次调用文本匹配接口,文本匹配接口按照文本匹配方法从用户的历史行为数据中获取每个关键词的发布信息;\n[0092] 另外,在步骤502中,当网页服务器从所有的关键词中只提取了一定数量的关键词时,在本步骤中,文本匹配接口也仅获取该部分关键词的发布信息。\n[0093] 另外,文本匹配接口除了获取发布信息外,还从用户的历史行为数据中获取发布信息所属的类目。\n[0094] 上述文本匹配接口可以是现有的搜索技术中所提供的文本匹配接口。\n[0095] 步骤504:文本匹配接口按照关键词在语义表述上对问题的重要性为获取的发布信息分配权重;\n[0096] 例如,文本匹配接口可以根据关键词与发布信息的匹配程度对每个关键词的发布信息进行排序,按照排序结果为每个发布信息分配权重,匹配度高的发布信息比匹配度低的发布信息的权重大。\n[0097] 如,为了简单描述权重的分配过程,假设,对于关键词Kw1,文本匹配接口获取了6个发布信息:offer1-offer6。按照Kw1与6个发布信息的匹配度对offer1-offer6进行排序,匹配度最高的发布信息排在第一位,匹配度最低的发布信息排在最后一位。然后,文本匹配接口按照排序的结果依次为6个发布信息分配权重,匹配度高的发布信息比匹配度低的发布信息的权重大。\n[0098] 当然,在实际应用中,每个关键词的发布信息不仅仅只有6个,当某一个关键词有大量的发布信息时,可以从权重最大的发布信息开始,只提取一定数量的发布信息,只为提取的这部分发布信息分配权重以及进行后续的处理。提取数量可以根据系统的需要任意设定。这样,可以提高信息推送的处理效率。\n[0099] 步骤505:网页服务器调用查询用户模块,由查询用户模块模块按照统计分析方法从用户的历史行为数据中统计发布或者反馈每个发布信息的用户;\n[0100] 在步骤504中,当文本匹配模块只提取一定数量的发布信息时,查询用户模块模块只统计发布或者反馈这一部分发布信息的用户。\n[0101] 上述查询用户模块模块可以是现有的搜索技术中所提供的查询用户模块模块。\n[0102] 步骤506:查询用户模块模块按照统计分析方法从用户的历史行为数据中统计反馈发布信息的用户对发布信息的反馈度;\n[0103] 在步骤505中,当查询用户模块模块只统计反馈一部分发布信息的用户时,则统计反馈该部分发布信息的用户对发布信息的反馈度。\n[0104] 步骤507:网页服务器分别计算用户提交的问题与发布该问题发布信息的用户之间的第一匹配度,以及,用户提交的问题与反馈该问题发布信息的用户的之间的第二匹配度;\n[0105] 其中,计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第一匹配度。\n[0106] 计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第二匹配度。\n[0107] 步骤508:网页服务器按照从高到低的顺序对计算得到的第一匹配度和第二匹配度进行排序,将问题发送给从匹配度最高的用户开始的预置数目的用户。\n[0108] 推送用户的数量以根据系统的需要任意设定。\n[0109] 由上述实施例可以看出,新问题被提交后,系统能查找与问题的发布信息相关的相关用户,进而有针对性地把问题推送到这些相关用户面前。对于服务器而言,服务器只向特定用户推送“问题”,而不是向所有的用户都推送问题,因此,降低了服务器资源的消耗,减少了服务器的负担。另外,由于只向特定的用户推送问题,也就减少了网络中的数据传送量,提高了网络传输速度,减少了网络的负担。\n[0110] 发布信息\n[0111] 并且,相比单一的被动文本匹配方法在问题解决效率,答案观点的广泛性和精准性都有很大的提高,对商业知识百科问题的解决和答案的推广更具指导性。\n[0112] 实施例三\n[0113] 与上述一种信息推送方法相对应,本申请实施例还提供了一种信息推送装置。请参阅图6,其为本申请一种信息推送装置的一个实施例的结构图,该装置包括提取单元601、获取单元602、统计单元603和推送单元604。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。\n[0114] 提取单元601,用于从用户提交的问题中提取关键词;\n[0115] 获取单元602,用于按照文本匹配方法从用户的历史行为数据中获取所述关键词的发布信息;\n[0116] 统计单元603,用于按照统计分析方法从用户的历史行为数据中统计与所述发布信息相关的相关用户;\n[0117] 推送单元604,用于计算所述问题与所述相关用户之间的匹配度,将所述问题推送给从匹配度最高的相关用户开始的预置数目的用户。\n[0118] 优选的,请参阅图7,其为本申请中推送单元的一个结构图,如图7所示,推送单元\n604包括:第一权重分配子单元6041、第二权重分配在单元6042、第一匹配度计算子单元\n6043和第一发送子单元6044,其中,\n[0119] 第一权重分配子单元6041,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0120] 第二权重分配子单元6042,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0121] 第一匹配度计算子单元6043,用于计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第一匹配度;\n[0122] 第一发送子单元6044,用于按照从高到低的顺序对所述第一匹配度进行排序,将问题发送给从第一匹配度最高的用户开始的、预置数目的用户。\n[0123] 除了图7所示的结构外,优选的,请参阅图8,其为本申请中推送单元的另一个结构图,如图8所示,推送单元604包括:第一权重分配子单元6041、第二权重分配在单元6042、反馈度统计子单元6045、第二匹配度计算子单元6046和第二发送子单元6047,其中,[0124] 第一权重分配子单元6041,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0125] 第二权重分配子单元6042,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0126] 反馈度统计子单元6045,用于按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;\n[0127] 第二匹配度计算子单元6046,用于计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第二匹配度;\n[0128] 第二发送子单元6047,用于按照从高到低的顺序将对所述第二匹配度进行排序,将问题发送给从第二匹配度最高的用户开始的预置数目的用户。\n[0129] 除了图7和图8所示的结构外,进一步优选的,请参阅图9,其为本申请中推送单元的另一个结构图,如图9所示,推送单元604包括:第一权重分配子单元6041、第二权重分配在单元6042、反馈度统计子单元6045、综合计算子单元6048和第三发送子单元6049,其中,[0130] 第一权重分配子单元6041,用于按照关键词在语义表述上对问题的重要性为提取的关键词分配权重,其中,重要性高的关键词比重要性低的关键词的权重大;\n[0131] 第二权重分配子单元6042,用于按照发布信息与关键词的匹配度为获取的发布信息分配权重,其中,匹配度高的发布信息比匹配度低的发布信息的权重大;\n[0132] 反馈度统计子单元6045,用于按照统计分析方法从用户的历史行为数据中统计反馈所述发布信息的用户对所述发布信息的反馈度;\n[0133] 综合计算子单元6048,用于计算关键词的权重和所述关键词的发布信息的权重的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与反馈所述发布信息的用户之间的第一匹配度,以及,计算关键词的权重、所述关键词的发布信息的权重和所述反馈度的乘积,再将问题的类目与发布信息的类目之间的匹配度和所述乘积值求和,得到所述问题与发布所述发布信息的用户之间的第二匹配度;\n[0134] 第三发送子单元6049,用于按照从高到低的顺序对所述第一匹配度和第二匹配度进行排序,将问题发送给从匹配度最高的用户开始的预置数目的用户。\n[0135] 进一步优选的,在图8和图9所示的推送单元中,反馈度统计子单元包括:计算子单元,用于计算反馈所述发布信息的用户的反馈次数与反馈的时效性因子的乘积,其中,距离当前统计时间近的反馈比距离当前统计时间远的反馈的时效性因子大。\n[0136] 由上述实施例可以看出,新问题被提交后,系统能查找与问题的发布信息相关的相关用户,进而有针对性地把问题推送到这些相关用户面前。对于服务器而言,服务器只向特定用户推送“问题”,而不是向所有的用户都推送问题,因此,降低了服务器资源的消耗,减少了服务器的负担。另外,由于只向特定的用户推送问题,也就减少了网络中的数据传送量,提高了网络传输速度,减少了网络的负担。\n[0137] 发布信息并且,相比单一的被动文本匹配方法在问题解决效率,答案观点的广泛性和精准性都有很大的提高,对商业知识百科问题的解决和答案的推广更具指导性。\n[0138] 需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。\n[0139] 以上对本申请所提供的一种信息推送方法和装置进行了详细介绍,本文中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
法律信息
- 2016-05-11
- 2013-01-23
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201110138313.X
申请日: 2011.05.25
- 2012-11-28
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-09-24
|
2008-05-16
| | |
2
| |
2008-09-03
|
2008-02-02
| | |
3
| |
2009-09-02
|
2008-02-29
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |