著录项信息
专利名称 | 一种问答平台的问题分发方法和问题分发系统 |
申请号 | CN201310712577.0 | 申请日期 | 2013-12-20 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-04-23 | 公开/公告号 | CN103744881A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 百度在线网络技术(北京)有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 百度在线网络技术(北京)有限公司 | 当前权利人 | 百度在线网络技术(北京)有限公司 |
发明人 | 刘奭;杨帆;李国洪 |
代理机构 | 北京鸿德海业知识产权代理事务所(普通合伙) | 代理人 | 袁媛 |
摘要
本发明提供了一种问答平台的问题分发方法和问题分发系统,其中方法包括:获取进入问答平台的问题;利用问题分发模型确定适宜回答所述问题的用户,将所述问题分发至适宜回答所述问题的用户所在的第三方平台,其中所述问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的;从第三方平台获取针对所述问题的答案,并将针对所述问题的答案提供给所述问题的提问用户。本发明将问题的回答来源拓展到与问答平台对接的第三方平台,打破了原来问答平台的局限性,使得第三方平台中更适宜回答问题的用户能够提供答案,从而提高问题被及时回答的概率。
1.一种问答平台的问题分发方法,其特征在于,该方法包括:
从与所述问答平台对接的第三方平台获取进入问答平台的问题;
在所述问答平台上形成所述问题的提问页面;
利用问题分发模型确定适宜回答所述问题的用户,将所述问题分发至适宜回答所述问题的用户所在的第三方平台,由该适宜回答所述问题的用户所在的第三方平台通过内嵌的问答平台的应用在适宜回答所述问题的用户所在的第三方平台上提供问答平台上所述问题的提问页面,以将所述问题发送给适宜回答所述问题的用户,其中所述问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的;
从所述适宜回答所述问题的用户所在的第三方平台获取针对所述问题的答案,将该答案发布于所述提问页面,并将针对所述问题的答案发送给所述问题所来源的第三方平台,由该问题所来源的第三方平台发送给对应的提问用户,并由该适宜回答所述问题的用户所在的第三方平台通过内嵌的问答平台的应用将所述问题的答案在所述适宜回答所述问题的用户所在的第三方平台上提供的提问页面上进行更新。
2.根据权利要求1所述的方法,其特征在于,从与所述问答平台对接的第三方平台获取进入问答平台的问题具体包括:
接收由与所述问答平台对接的第三方平台推送来的问题;或者,
主动从与所述问答平台对接的第三方平台拉取问题。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:
收集与问答平台对接的第三方平台的用户数据;
利用收集到的用户数据建立问题分发模型。
4.根据权利要求3所述的方法,其特征在于,在所述利用收集到的用户数据建立问题分发模型之前,该方法还包括:对收集到的用户数据进行格式转化,所述格式转化具体包括:
对收集到的用户数据进行编码转换,得到统一编码格式的用户数据;
对编码转换后的用户数据进行归一化处理;
对归一化处理后的用户数据进行数据结构的标准化。
5.根据权利要求1、2或3所述的方法,其特征在于,问答平台与第三方平台采用以下方式对接:
所述问答平台主动调用第三方平台开放的应用程序编程接口API实现对接;或者,所述问答平台主动开放自身的API,以供第三方平台根据问答平台的API修改第三方平台实现对接。
6.根据权利要求1或3所述的方法,其特征在于,所述问题分发模型包括用户兴趣模型或平台模型中的至少一种;
所述用户兴趣模型由以下多个维度的特征中的至少一种及其权重值来建立:用户的活跃度特征、用户的兴趣关键词特征、用户的兴趣标签特征、用户的兴趣分类特征、用户的地理位置特征以及用户所来源平台特征;
所述平台模型由以下多个维度的特征中的至少一种及其权重值来建立:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征。
7.根据权利要求6所述的方法,其特征在于,所述利用问题分发模型确定适宜回答所述问题的用户包括:
利用所述平台模型确定适宜回答所述问题的第三方平台,将确定出的第三方平台中的用户确定为适宜回答所述问题的用户;或者,
利用所述平台模型确定适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,将提问用户指定的第三方平台确定为适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,利用所述平台模型和用户兴趣模型融合后得到的扩展后的用户兴趣模型,确定出适宜回答所述问题的用户。
8.一种问答平台的问题分发系统,其特征在于,该系统包括:
平台对接单元,用于实现问答平台和第三方平台之间的对接;
问题引流单元,用于从与所述问答平台对接的第三方平台获取进入问答平台的问题;
页面生成单元,用于在所述问答平台上形成所述问题的提问页面,将获取到的针对所述问题的答案发布于所述提问页面;
所述平台对接单元,还用于通过在第三方平台内嵌的问答平台的应用在第三方平台上提供问答平台上所述问题的提问页面;
问题分发单元,用于利用问题分发模型确定适宜回答所述问题的用户,通过所述平台对接单元将所述问题分发至适宜回答所述问题的用户所在的第三方平台,通过平台对接单元在适宜回答所述问题的用户所在的第三方平台上提供的所述问题的提问页面将所述问题发送给适宜回答所述问题的用户,其中所述问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的;
答案推送单元,用于通过所述平台对接单元从适宜回答所述问题的用户所在的第三方平台获取针对所述问题的答案,并将针对所述问题的答案发送给所述问题所来源的第三方平台,由该问题所来源的第三方平台发送给对应的提问用户,并由该适宜回答所述问题的用户所在的第三方平台通过内嵌的问答平台的应用将所述问题的答案在所述适宜回答所述问题的用户所在的的第三方平台上提供的提问页面上进行更新。
9.根据权利要求8所述的系统,其特征在于,所述问题引流单元,具体用于接收由与所述问答平台对接的第三方平台推送来的问题;或者,主动从与所述问答平台对接的第三方平台拉取问题。
10.根据权利要求8所述的系统,其特征在于,该系统还包括:
数据收集单元,用于收集与问答平台对接的第三方平台的用户数据;
模型建立单元,用于利用收集到的用户数据建立问题分发模型。
11.根据权利要求10所述的系统,其特征在于,所述数据收集单元,还用于对收集到的用户数据进行格式转化,所述格式转化具体包括:
对收集到的用户数据进行编码转换,得到统一编码格式的用户数据;
对编码转换后的用户数据进行归一化处理;
对归一化处理后的用户数据进行数据结构的标准化。
12.根据权利要求8、9或10所述的系统,其特征在于,所述平台对接单元,具体用于采用所述问答平台主动调用第三方平台开放的应用程序编程接口API的方式实现对接;或者,采用所述问答平台主动开放自身的API的方式以供第三方平台根据问答平台的API修改第三方平台实现对接。
13.根据权利要求8或10所述的系统,其特征在于,所述问题分发模型包括用户兴趣模型或平台模型中的至少一种;
所述用户兴趣模型由以下多个维度的特征中的至少一种及其权重值来建立:用户的活跃度特征、用户的兴趣关键词特征、用户的兴趣标签特征、用户的兴趣分类特征、用户的地理位置特征以及用户所来源平台特征;
所述平台模型由以下多个维度的特征中的至少一种及其权重值来建立:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征。
14.根据权利要求13所述的系统,其特征在于,所述问题分发单元,具体用于利用所述平台模型确定适宜回答所述问题的第三方平台,将确定出的第三方平台中的用户确定为适宜回答所述问题的用户;或者,
利用所述平台模型确定适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,将提问用户指定的第三方平台确定为适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,利用所述平台模型和用户兴趣模型融合后得到的扩展后的用户兴趣模型,确定出适宜回答所述问题的用户。
一种问答平台的问题分发方法和问题分发系统\n【技术领域】\n[0001] 本发明涉及计算机网络技术领域,特别涉及一种问答平台的问题分发方法和问题分发系统。\n【背景技术】\n[0002] 现有问答平台中,当有新增的问题时,由本网站的用户登录问题页面并在该页面上提供相应的回答,将该新增的问题推送给本网站的用户并等待用户给予回答,或者,查找本网站中已有的问答资源中与该问题相对应的回答。\n[0003] 可以看出,现有的问答平台中,回答来源具有很大的局限性,仅限于本网站的用户,这种方式受限于网站规模,对于比较偏门或者比较专业的问题,可能很难短时间内找到合适的人来回答。\n【发明内容】\n[0004] 有鉴于此,本发明提供了一种问答平台的问题分发方法和问题分发系统,以便于打破回答来源是本问答平台网站的局限性,从而提高问题被及时回答的概率。\n[0005] 具体技术方案如下:\n[0006] 本发明提供了一种问答平台的问题分发方法,该方法包括:\n[0007] 获取进入问答平台的问题;\n[0008] 利用问题分发模型确定适宜回答所述问题的用户,将所述问题分发至适宜回答所述问题的用户所在的第三方平台,其中所述问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的;\n[0009] 从第三方平台获取针对所述问题的答案,并将针对所述问题的答案提供给所述问题的提问用户。\n[0010] 根据本发明一优选实施方式,所述获取进入问答平台的问题具体包括:\n[0011] 获取所述问答平台的用户产生的问题;或者,\n[0012] 接收由与所述问答平台对接的第三方平台推送来的问题;或者,\n[0013] 主动从与所述问答平台对接的第三方平台拉取问题。\n[0014] 根据本发明一优选实施方式,该方法还包括:\n[0015] 收集与问答平台对接的第三方平台的用户数据;\n[0016] 利用收集到的用户数据建立问题分发模型。\n[0017] 根据本发明一优选实施方式,在所述利用收集到的用户数据建立问题分发模型之前,该方法还包括:对收集到的用户数据进行格式转化,所述格式转化具体包括:\n[0018] 对收集到的用户数据进行编码转换,得到统一编码格式的用户数据;\n[0019] 对编码转换后的用户数据进行归一化处理;\n[0020] 对归一化处理后的用户数据进行数据结构的标准化。\n[0021] 根据本发明一优选实施方式,问答平台与第三方平台采用以下方式对接:\n[0022] 所述问答平台主动调用第三方平台开放的应用程序编程接口API实现对接;或者,[0023] 所述问答平台主动开放自身的API,以供第三方平台根据问答平台的API修改第三方平台实现对接。\n[0024] 根据本发明一优选实施方式,所述问题分发模型包括用户兴趣模型或平台模型中的至少一种;\n[0025] 所述用户兴趣模型由以下多个维度的特征中的至少一种及其权重值来建立:用户的活跃度特征、用户的兴趣关键词特征、用户的兴趣标签特征、用户的兴趣分类特征、用户的地理位置特征以及用户所来源平台特征;\n[0026] 所述平台模型由以下多个维度的特征中的至少一种及其权重值来建立:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征。\n[0027] 根据本发明一优选实施方式,所述利用问题分发模型确定适宜回答所述问题的用户包括:\n[0028] 利用所述平台模型确定适宜回答所述问题的第三方平台,将确定出的第三方平台中的用户确定为适宜回答所述问题的用户;或者,\n[0029] 利用所述平台模型确定适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,[0030] 将提问用户指定的第三方平台确定为适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,\n[0031] 利用所述平台模型和用户兴趣模型融合后得到的扩展后的用户兴趣模型,确定出适宜回答所述问题的用户。\n[0032] 根据本发明一优选实施方式,该方法还包括:在所述问答平台上形成所述问题的提问页面;\n[0033] 将获取到的针对所述问题的答案发布于所述提问页面。\n[0034] 根据本发明一优选实施方式,将所述问题分发至适宜回答所述问题的用户所在的第三方平台之后,还包括:\n[0035] 由第三方平台采用自身特有的消息发送形式将该问题推送给适宜回答所述问题的用户;或者,\n[0036] 通过在第三方平台内嵌的问答平台应用在第三方平台上提供问答平台上所述问题的提问页面。\n[0037] 根据本发明一优选实施方式,将针对所述问题的答案提供给所述问题的提问用户具体包括:\n[0038] 如果所述问题由所述问答平台的用户产生,则将针对所述问题的答案采用短信、邮件、站内消息中的至少一种推送给所述问题的提问用户;或者,\n[0039] 如果所述问题来源于与所述问答平台对接的第三方平台,则将针对所述问题的答案提供给所述问题所来源的第三方平台,由该第三方平台采用自身特有的形式将针对所述问题的答案推送给所述问题的提问用户。\n[0040] 本发明还提供了一种问答平台的问题分发系统,该系统包括:\n[0041] 平台对接单元,用于实现问答平台和第三方平台之间的对接;\n[0042] 问题引流单元,用于获取进入问答平台的问题;\n[0043] 问题分发单元,用于利用问题分发模型确定适宜回答所述问题的用户,通过所述平台对接单元将所述问题分发至适宜回答所述问题的用户所在的第三方平台,其中所述问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的;\n[0044] 答案推送单元,用于通过所述平台对接单元从第三方平台获取针对所述问题的答案,并将针对所述问题的答案提供给所述问题的提问用户。\n[0045] 根据本发明一优选实施方式,所述问题引流单元,具体用于获取所述问答平台的用户产生的问题;或者,接收由与所述问答平台对接的第三方平台推送来的问题;或者,主动从与所述问答平台对接的第三方平台拉取问题。\n[0046] 根据本发明一优选实施方式,该系统还包括:\n[0047] 数据收集单元,用于收集与问答平台对接的第三方平台的用户数据;\n[0048] 模型建立单元,用于利用收集到的用户数据建立问题分发模型。\n[0049] 根据本发明一优选实施方式,所述数据收集单元,还用于对收集到的用户数据进行格式转化,所述格式转化具体包括:\n[0050] 对收集到的用户数据进行编码转换,得到统一编码格式的用户数据;\n[0051] 对编码转换后的用户数据进行归一化处理;\n[0052] 对归一化处理后的用户数据进行数据结构的标准化。\n[0053] 根据本发明一优选实施方式,所述平台对接单元,具体用于采用所述问答平台主动调用第三方平台开放的应用程序编程接口API的方式实现对接;或者,采用所述问答平台主动开放自身的API的方式以供第三方平台根据问答平台的API修改第三方平台实现对接。\n[0054] 根据本发明一优选实施方式,所述问题分发模型包括用户兴趣模型或平台模型中的至少一种;\n[0055] 所述用户兴趣模型由以下多个维度的特征中的至少一种及其权重值来建立:用户的活跃度特征、用户的兴趣关键词特征、用户的兴趣标签特征、用户的兴趣分类特征、用户的地理位置特征以及用户所来源平台特征;\n[0056] 所述平台模型由以下多个维度的特征中的至少一种及其权重值来建立:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征。\n[0057] 根据本发明一优选实施方式,所述问题分发单元,具体用于利用所述平台模型确定适宜回答所述问题的第三方平台,将确定出的第三方平台中的用户确定为适宜回答所述问题的用户;或者,\n[0058] 利用所述平台模型确定适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,[0059] 将提问用户指定的第三方平台确定为适宜回答所述问题的第三方平台,再利用所述用户兴趣模型确定在适宜回答所述问题的第三方平台中适宜回答所述问题的用户;或者,\n[0060] 利用所述平台模型和用户兴趣模型融合后得到的扩展后的用户兴趣模型,确定出适宜回答所述问题的用户。\n[0061] 根据本发明一优选实施方式,该系统还包括:页面生成单元,用于在所述问答平台上形成所述问题的提问页面,将获取到的针对所述问题的答案发布于所述提问页面。\n[0062] 根据本发明一优选实施方式,所述平台对接单元,还用于通过在第三方平台内嵌的问答平台应用在第三方平台上提供问答平台上所述问题的提问页面。\n[0063] 根据本发明一优选实施方式,所述答案推送单元,具体用于如果所述问题由所述问答平台的用户产生,则将针对所述问题的答案采用短信、邮件、站内消息中的至少一种推送给所述问题的提问用户;或者,如果所述问题来源于与所述问答平台对接的第三方平台,则将针对所述问题的答案提供给所述问题所来源的第三方平台,由该第三方平台采用自身特有的形式将针对所述问题的答案推送给所述问题的提问用户。\n[0064] 由以上技术方案可以看出,本发明将问题的回答来源拓展到与问答平台对接的第三方平台,打破了原来问答平台的局限性,使得第三方平台中更适宜回答问题的用户能够提供答案,从而提高问题被及时回答的概率。\n【附图说明】\n[0065] 图1为本发明实施例一提供的问答平台的问题分发方法流程图;\n[0066] 图2a为一个问题发布页面的实例图;\n[0067] 图2b为一个提问页面的实例图;\n[0068] 图2c为一个回答页面上的实例图;\n[0069] 图3a为通过微博平台发布一个问题的实例图;\n[0070] 图3b为将微博平台的提问发布在问答平台上形成的提问页面的实例图;\n[0071] 图3c为在微博平台上通过内嵌问答平台应用的方式显示提问页面的示意图;\n[0072] 图3d为在微博平台上通过内嵌问答平台应用的方式更新提问页面的示意图;\n[0073] 图4为本发明实施例二提供的问答平台的问题分发系统结构图;\n[0074] 图5为本发明提供的问题分发系统作为第三方平台功能的入口的示意图。\n【具体实施方式】\n[0075] 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。\n[0076] 在传统方式下,问答平台依靠本站点积累的用户进行问题的消化解决,扩大回答能力的途径不外乎扩大用户规模或者提高单个用户贡献。但目前互联网上的问题呈现出两个主要趋势,一个是专业性问题越来越多,对回答质量和回答者专业资质的诉求越来越强;\n另外一个是随着上网人群普及率逐渐提高,移动终端上网网民的数量增长,使得局部地区的各种生活相关问题也越来越多,解决这部分问题的难度在于能否及时找到适宜回答问题的人。在这样的大背景下,原有的问答平台和资源积累已经很难满足现有需求,本发明的核心思想就在于将问答资源扩宽到除了问答平台之外的其他平台,甚至可以扩宽到全网范围。\n[0077] 下面通过实施例一对本发明提供的方法首先进行详细描述。\n[0078] 实施例一、\n[0079] 图1为本发明实施例一提供的问答平台的问题分发方法流程图,需要说明的是,在本发明实施例中第三方平台指的是除了问答平台之外的其他平台,可以是诸如法律、教育、医疗等专业的垂直类网站平台,也可以是诸如微博、朋友圈、人人网等社交类网站平台,还可以是第三方的问答平台,等等。如图1中所示,该问题推送方法可以包括以下步骤:\n[0080] 101:收集与问答平台对接的第三方平台的用户数据。\n[0081] 在本发明中,将问答平台与第三方平台进行对接,对接的方式可以有两种模式:问答平台主动对接和问答平台开放接口。\n[0082] 其中,问答平台主动对接的模式指的是,问答平台主动调用已经开放API(Application Programming Interface,应用程序编程接口)的第三方平台的API,来完成数据交互。主动对接的模式主要是针对主流的平台,诸如微博平台,这类平台的特点是开放API大多是服务模式,即提供http监听服务,由应用方(本发明实施例中指的是问答平台)主动发起请求来获取或提交数据。\n[0083] 因此,对于这种模式,不管是第三方平台作为上游还是下游,都需要问答平台按照对方已经约定好的API接口进行主动的请求,这种对接场景下,第三方平台不需要做任何的开发和部署升级,完全是基于已有的接口进行对接。\n[0084] 问答平台开放接口的模式指的是,问答平台开放自身的API,供第三方平台根据问答平台的API修改第三方平台的网站进行对接,这种方式是本发明的创新点之一。开放接口的模式主要是针对还没有发布、没有固定开放接口或者是非通用性开放接口的第三方平台,由于第三方平台的API不确定或不规范,导致如果按照主动对接的模式去做对接的话,初始开发和维护成本会很高,因此优选的方式是,问答平台开放自身的API,由第三方平台按照问答平台的API进行对接。\n[0085] 这种模式下,如果问答平台作为下游,则问答平台可以作为Server(服务器),由第三方平台主动发起调用并返回结果。如果问答平台作为上游,则可以提供主动推送或者被动接收两种方式。\n[0086] 为了降低第三方平台的对接成本,问答平台可以针对一些开源的第三方平台发布组件包,第三方平台仅需要安装组件包进行必要的配置就可以对接成功,这样就不需要开发成本,至需要部署更新即可。对于那些自主研发的第三方平台,就需要第三方平台按照问答平台提供的API接口进行设计开发了。\n[0087] 在本发明中,与问答平台对接的第三方平台可以是一个,也可以是多个,本发明实施例中所述的多个指的是两个以上。\n[0088] 收集第三方平台的用户数据时,可以采用接收由第三方平台主动推送的用户数据的方式,这时第三方平台使用长连接或者短连接实时地将用户数据推送给问答平台,问答平台中的监听服务实时响应第三方平台的推送。也可以采用问答平台主动从第三方平台拉取用户数据的方式,这时问答平台采用主动查询的方式拉取用户数据,第三方平台中的监听服务实时响应问答平台的拉取。\n[0089] 收集的用户数据可以包括但不限于:诸如用户属性、用户标签等的静态数据,也可以是诸如用户行为等的动态数据,这些数据能够直接或者间接的反映用户兴趣或者用户能力,为后续建立问题分发模型提供数据源。\n[0090] 由于第三方平台提供的数据可能具有不同的类型或结构,因此在本步骤中还可以进一步对收集的用户数据进行格式转化,从而降低对异构数据的处理难度。这里进行的格式转化可以包括以下几个处理:\n[0091] 首先对收集到的用户数据进行编码转换,得到统一编码格式的用户数据。例如,将GBK(Chinese Internal Code Specification,汉字内码扩展规范)编码的格式都统一转换为utf-8(8-bit Unicode Transformation Format,万国码)的编码格式。\n[0092] 在编码转换之后,可以按照预设的过滤规则进行过滤处理。这里的过滤可以是针对特定字符的过滤、针对质量的过滤等等,具体的过滤规则可以自定义。例如,对于可以对于微博中特有的表情符号进行过滤。\n[0093] 然后,对经过上述处理后的用户数据进行归一化,这里的归一化主要是对等价信息的替换,即将等价的用户数据统一为相同的表达。\n[0094] 归一化处理之后,还可以进一步进行数据结构标准化,将用户数据中的关键属性变成同构数据。例如将用户数据中用户发表的内容、用户id、发表时间分别存储于content、user_id和create_time字段中,其余的内容保存到other字段中。\n[0095] 收集到的用户数据可以存储于数据库,以便后续建立问题分发模型时使用,另外,从第三方平台收集用户数据的步骤可以是周期性的或者持续性的过程,从而保证数据库中的用户数据能够及时得到更新。\n[0096] 102:利用收集到的用户数据建立问题分发模型。\n[0097] 这里的问题分发模型主要包括:用户兴趣模型和平台模型。\n[0098] 其中用户兴趣模型可以由体现用户兴趣的多个维度的特征来建立,这些特征可以包括但不限于以下特征中的至少一种:活跃度特征、兴趣关键词特征、兴趣标签特征、兴趣分类特征、地理位置特征、来源平台特征等等,每个特征具有对应的权重值。\n[0099] 其中活跃度特征表明用户的活跃程度,反映了用户及时回答问题的能力。可以由分发给用户的问题数以及用户提供的答案数来反映,并且还可以考虑活跃度随着时间的衰减状况。例如,用户当前的活跃度UFAi可以为:\n[0100]\n[0101] 其中,j为时间单位,α为活跃度特征随时间的衰减系数,n为当前累计的时间单位。\nUFacurrent为用户当前在问题分发系统上反馈计算的活跃度的值,可以为:\n[0102]\n其中,AA表示总的答案数,AP表示总的分发给该用户的问题数,RA表示当前时间单位的答案数,RP表示当前时间单位分发给该用户的问题数,w1和w2为归一化权重,wa和wb为调权系数。\n[0103] 兴趣关键词特征表明用户较细粒度的兴趣,可以从分发给该用户的问题以及该用户提供的答案中提取,也可以从该用户在第三方平台上发布的内容中提取,也可以从用户定制的兴趣关键词中提取。\n[0104] 兴趣标签特征是在兴趣关键词再上一层粒度上的兴趣体现,可以从用户在第三方平台中的标签中提取,也可以从用户在第三方平台中的用户关系中扩展挖掘出的标签中提取,也可以从用户定制的标签中提取。\n[0105] 兴趣分类特征是在兴趣标签特征和兴趣关键词特征之上粒度上的兴趣体现,通常是对兴趣关键词和兴趣标签进行聚类之后得到的特征。\n[0106] 地理位置特征是对用户地理位置属性的刻画,可以从用户在第三方平台中的地理位置属性或者用户定制的地理位置特征中获取。\n[0107] 来源平台特征是对用户所来源平台的标识和描述,对应的权重值可以由第三方平台的权威性决定。\n[0108] 该用户兴趣模型可以用于确定一个具体的问题被分发到哪个用户较为适宜,也就是说,用于确定适宜回答问题的用户。除了具体到用户之外,还存在这样的需求,一个具体的问题适宜分发到哪个第三方平台能够得到较好的解决,也就是说,确定适宜回答问题的第三方平台,此时会用到平台模型。\n[0109] 平台模型也可以由体现平台能力的多个维度的特征来建立,这些特征可以包括但不限于以下特征中的至少一种:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征等,每个特征具有对应的权重值。\n[0110] 其中平台所擅长的关键词特征可以从分发给该平台的问题以及该平台提供的答案中提取,也可以从该平台上的内容中提取,还可以由专家凭借平台上的内容利用经验来确定。\n[0111] 平台所擅长的标签特征可以从该平台中的标签中提取,也可以由专家凭借该平台中的标签利用经验来确定。\n[0112] 平台所擅长的分类特征可以对平台所擅长的关键词特征和标签特征进行聚类后得到,也可以由专家凭借该平台中的内容利用经验来确定。\n[0113] 平台所擅长的地理位置特征可以从平台中用户的地理位置属性中确定,也可以由专家利用经验来确定。\n[0114] 平台的权威性特征可以利用搜索引擎对该平台的权威性评定中得到,也可以通过问题的提问用户对该平台提供的答案所做的评定来确定。\n[0115] 平台的活跃度特征可以由平台的用户总量、平台的日活跃用户量、提供答案的用户总量以及提供答案的日活跃用户量中的至少一种来确定。\n[0116] 以上101和102是线下执行的操作,对于线上问题的分发过程为以下步骤。\n[0117] 103:获取进入问答平台的问题。\n[0118] 该问题可以是问答平台的用户产生的问题,例如问答平台的用户登录问答平台并提出问题。也可以是与问答平台对接的第三方平台产生的问题,这种情况下可以采用接收由第三方平台主动推送来的问题,或者主动从第三方平台拉取问题的方式。例如,与问答平台对接的微博平台上,有微博用户在微博上发表了一篇微博提出了某问题,微博平台可以将该问题通过与问答平台对接的接口推送给问答平台,或者,由问答平台主动拉取该问题。\n[0119] 由于各平台用户提出的问题千变万化多种多样,在此可以对获取的问题进行基本的过滤,该过滤策略可以是针对问题所来源的平台进行的个性化定制,也可以是全局定制,从而拦截掉一些不希望进入后续分发流程的问题。\n[0120] 这里涉及的过滤策略可以包括但不限于:对广告进行过滤、对敏感信息的过滤、对无意义灌水内容的过滤等等。其中对广告进行过滤主要采用的是基于问题的数据形式的过滤,例如将包含图片、视频等的问题过滤掉,其很可能包括广告内容。对敏感信息、无意义灌水内容的过滤主要是基于关键词或语义的过滤。\n[0121] 104:利用问题分发模型确定适宜回答该问题的用户,将该问题分发至确定的用户所在的第三方平台。\n[0122] 本步骤主要是对问题进行基本特征识别,利用问题分发模型确定出适宜回答该问题的用户,完成由问题到用户集合的映射。这里的映射是根据问题的特征和各平台用户的特征进行非对等的下发,而并非统一下发或者内部平台消化。其中问题的特征可以包括问题的语义特征或者问题所来源平台的信息。\n[0123] 这里确定适宜回答问题的用户时,可以采用以下方式:\n[0124] 第一种方式:利用平台模型确定适宜回答该问题的第三方平台,将该第三方平台中的用户都确定为适宜回答该问题的用户。\n[0125] 采用这种方式时,首先按照平台模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到平台模型中所具有的各维度的特征后,利用各特征的权重值,计算由各平台回答该提问的打分值,从中选择打分值满足预设条件的平台作为适宜回答该问题的第三方平台。\n[0126] 第二种方式:利用平台模型先确定适宜回答该问题的第三方平台,再利用用户兴趣模型确定在该第三方平台中适宜回答该问题的用户。\n[0127] 在利用用户兴趣模型确定适宜回答该问题的用户时,按照用户兴趣模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到用户兴趣模型中所具有的各维度的特征后,利用各特征的权重值,计算由确定出的第三方平台中各用户回答该提问的打分值,从中选择打分值满足预设条件的用户作为适宜回答该问题的用户。\n[0128] 第三种方式:结合平台模型和用户兴趣模型,综合确定出适宜回答该问题的用户。\n[0129] 在这种方式中,将平台模型和用户兴趣模型进行融合,即将用户所属平台的特征加入到用户兴趣模型中,从而得到扩展后的用户兴趣模型,利用扩展后的用户兴趣模型进行问题到用户的映射。按照扩展后的用户兴趣模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到扩展后的用户兴趣模型中所具有的各维度的特征后,利用各特征的权重值,计算由各用户回答该提问的打分值,从中选择打分值满足预设条件的用户作为适宜回答该问题的用户。\n[0130] 另外,除了104中所描述的利用问题分发模型来确定将问题发送给哪个第三方平台之外,也可以通过由提问用户指定的方式,即提问用户在提出问题时,指定第三方平台,然后问答平台按照提问用户指定的第三方平台来进行问题分发。\n[0131] 将问题分发给第三方平台后,在第三方平台上可以主要采用以下两种方式发送给适宜回答该问题的用户:\n[0132] 第一种方式:由第三方平台采用其平台特有的消息发送形式推送该问题。以微博平台为例,微博平台具有其特有的消息发送形式,例如引用(@)微博用户、评论微博用户、私信微博用户等等,在此就可以利用其特有的消息发送形式将问题推送给适宜回答该问题的用户。\n[0133] 第二种方式:采用在第三方平台内嵌问答平台应用的方式,通过该内嵌的问答平台应用可以在第三方平台上提供问答平台上该问题的提问页面,第三方平台的用户就能够在该提问页面上进行问题的回答,这种方式第三方平台的用户实际上是与问答平台应用进行数据的交互。\n[0134] 105:从第三方平台获取针对该问题的答案。\n[0135] 对于分发至第三方平台的问题,对应的用户如果针对该问题提供了答案,则问答平台可以采用接收第三方平台主动推送的答案或者主动从第三方平台获取答案的方式,从第三方平台获取针对该问题的答案。\n[0136] 如果该问题由问答平台的用户产生,则将该问题的答案推送给本问答平台的用户即可,推送的方式可以采用短信、邮件、站内消息等等方式。或者将该问题的答案发布在该问题所在的页面上。如果该问题是从第三方平台获取的,则可以继续执行106。\n[0137] 106:如果该问题是从第三方平台获取的,则将该问题的答案发送给该问题所来源的第三方平台。\n[0138] 如果该问题是由第三方平台自身挖掘出的问题,则由第三方平台采用其平台特有的形式发布该问题的答案。如果该问题是由第三方平台的用户提问的,则由第三方平台发送给对应的提问用户,具体第三方平台采用什么样的形式发送给对应的提问用户,则可以根据第三方平台特有的形式决定。\n[0139] 需要说明的是,本发明实施例中的问题包括初始提问的问题、针对该问题的追问、修改和补充等,对于这些都会进行关联推送并在提问页面上进行更新。\n[0140] 在此举两个具体的实例:\n[0141] 实例一、\n[0142] 问答平台上的用户A登录问答平台后,通过如图2a所示的页面发布问题,在该页面中除了发布问题之外,还可以选择问题的分类、答案的发送方式、甚至指定将该问题分发至的第三方平台等等。假设其发布的问题形成提问页面后如图2b所示。由于该问题为医疗领域,利用问题分发模型可以确定出该问题的类型适宜与该问答平台对接的医疗领域的垂直平台,具体适宜于该医疗领域的垂直平台上的妇产科或儿科专家,因此问答平台将该问题发送给与该问答平台对接的医疗领域的垂直平台中的妇产科或儿科专家。与此同时,问答平台上的其他用户也可以在提问页面上提供答案。如果医疗领域的垂直平台上有妇产科或儿科专家针对该问题提供了答案,将该答案发送回问答平台,由问答平台将该答案按照提问用户所选择的答案的发送方式发送给提问用户。与此同时,可以将该答案在提问页面上发布,如图2c所示。可以看出,通过这种方式,问答平台上的用户就能够得到除了本平台之外的其他平台的用户的帮助,这些用户回答该问题更适宜,用户就能够更及时地得到解答。\n[0143] 实例二、\n[0144] 微博平台上的微博用户B发布了一条微博进行提问,如图3a所示,微博平台获取到该实时的问题后,将该问题通过与问答平台对接的接口发送给问答平台。问答平台获取到该问题后,也可以形成一个提问页面,如图3b所示,以便问答平台的用户也可能够回答该问题,当然也可以不形成提问页面。\n[0145] 问答平台利用问题分发模型确定该问题适宜社交类平台的北京用户或者对车感兴趣的用户回答,假设与问答平台对接的社交类平台只有微博,那么问答平台就将该问题发送给微博平台,微博平台可以采用引用(@)、私信或者评论对方微博等形式将该问题发送给北京的微博用户或者对车感兴趣的微博用户。还有一种方式,即微博平台可以采用内嵌的问答平台应用的方式发布该提问,微博用户通过该内嵌的问答平台应用就可以在微博的页面上查看到问答平台上该问题的提问页面,如图3c所示。当微博平台获取到对该问题的答案后,将该答案重新反馈回问答平台。由问答平台再发回微博平台,由微博平台将该问题的答案采用引用(@)、私信或者评论对方微博等形式推送给提问的微博用户。与此同时,问答平台也可以将该问题的答案发布在提问页面上,从而进行本站资源的积累。另外该提问页面上更新的内容在微博平台上内嵌的问答平台应用中也会得到更新,如图3d所示。\n[0146] 以上是对本发明所提供的方法进行的详细描述,下面通过实施例二对本发明所提供的系统进行详细的描述。\n[0147] 实施例二、\n[0148] 图4为本发明实施例二提供的问答平台的问题分发系统结构图,该问题分发系统可以设置于问答平台,如图4所示,该问题分发系统可以包括:平台对接单元01、问题引流单元02、问题分发单元03和答案推送单元04,还可以进一步包括数据收集单元05、模型建立单元06和页面生成单元07。\n[0149] 其中,平台对接单元01主要实现问答平台和第三方平台之间的对接。对接的方式可以有两种模式:问答平台主动对接和问答平台开放接口。\n[0150] 其中,问答平台主动对接的模式指的是,问答平台主动调用已经开放API的第三方平台的API,来完成数据交互。主动对接的模式主要是针对主流的平台,诸如微博平台,这类平台的特点是开放API大多是服务模式,即提供http监听服务,由应用方(本发明实施例中指的是问答平台)主动发起请求来获取或提交数据。\n[0151] 因此,对于这种模式,不管是第三方平台作为上游还是下游,都需要问答平台按照对方已经约定好的API接口进行主动的请求,这种对接场景下,第三方平台不需要做任何的开发和部署升级,完全是基于已有的接口进行对接。\n[0152] 问答平台开放接口的模式指的是,问答平台开放自身的API,供第三方平台根据问答平台的API修改第三方平台的网站进行对接,这种方式是本发明的创新点之一。开放接口的模式主要是针对还没有发布、没有固定开放接口或者是非通用性开放接口的第三方平台,由于第三方平台的API不确定或不规范,导致如果按照主动对接的模式去做对接的话,初始开发和维护成本会很高,因此此时优选的方式是,问答平台开放自身的API,由第三方平台按照问答平台的API进行对接。\n[0153] 这种模式下,如果问答平台作为下游,可以作为Server,由第三方平台主动发起调用并返回结果。如果问答平台作为上游,则可以提供主动推送或者被动接收两种方式。\n[0154] 为了降低第三方平台的对接成本,问答平台可以针对一些开源的第三方平台发布组件包,第三方平台仅需要安装组件包进行必要的配置就可以对接成功,这样就不需要开发成本,至需要部署更新即可。对于那些自主研发的第三方平台,就需要第三方平台按照问答平台提供的API接口进行设计开发了。\n[0155] 问题引流单元02负责获取进入问答平台的问题;该问题可以是问答平台的用户产生的问题,例如问答平台的用户登录问答平台并提出问题。也可以是与问答平台对接的第三方平台产生的问题,这种情况下可以采用接收由第三方平台主动推送来的问题,或者主动从第三方平台拉取问题的方式。\n[0156] 然后问题分发单元03利用问题分发模型确定适宜回答问题的用户,通过平台对接单元01将问题分发至适宜回答问题的用户所在的第三方平台,其中问题分发模型是利用从与问答平台对接的第三方平台收集来的用户数据建立的。\n[0157] 最后由答案推送单元04通过平台对接单元01从第三方平台获取针对问题的答案,并将针对问题的答案提供给问题的提问用户。\n[0158] 为了实现问题分发模型的建立,需要数据收集单元05收集与问答平台对接的第三方平台的用户数据。在收集第三方平台的用户数据时,可以采用接收由第三方平台主动推送的用户数据的方式,这时第三方平台使用长连接或者短连接实时地将用户数据推送给问答平台,问答平台中的监听服务实时响应第三方平台的推送。也可以采用问答平台主动从第三方平台拉取用户数据的方式,这时问答平台采用主动查询的方式拉取用户数据,第三方平台中的监听服务实时响应问答平台的拉取。\n[0159] 收集的用户数据可以包括但不限于:诸如用户属性、用户标签等的静态数据,也可以是诸如用户行为等的动态数据,这些数据能够直接或者间接的反映用户兴趣或者用户能力,为后续建立问题分发模型提供数据源。\n[0160] 由于第三方平台提供的数据可能具有不同的类型或结构,因此数据收集单元05可以对收集到的用户数据进行格式转化,这里的格式转化可以具体包括:对收集到的用户数据进行编码转换,得到统一编码格式的用户数据;对编码转换后的用户数据进行归一化处理;对归一化处理后的用户数据进行数据结构的标准化。\n[0161] 数据收集单元05收集到的用户数据可以存储于数据库,以便后续建立问题分发模型时使用,另外,数据收集单元05从第三方平台收集用户数据的操作可以是周期性的或者持续性的过程,从而保证数据库中的用户数据能够及时得到更新。\n[0162] 模型建立单元06负责利用收集到的用户数据建立问题分发模型。\n[0163] 该问题分发模型可以包括用户兴趣模型或平台模型中的至少一种。其中用户兴趣模型可以由以下多个维度的特征中的至少一种及其权重值来建立:用户的活跃度特征、用户的兴趣关键词特征、用户的兴趣标签特征、用户的兴趣分类特征、用户的地理位置特征以及用户所来源平台特征。平台模型由以下多个维度的特征中的至少一种及其权重值来建立:平台所擅长的关键词特征、平台所擅长的标签特征、平台所擅长的分类特征、平台所擅长的地理位置特征、平台的权威性特征以及平台活跃度特征。关于这些特征的具体含义可以参见实施例一中的相关描述在此不再赘述。\n[0164] 问题分发单元03在确定适宜回答该问题的用户时,可以以下方式:\n[0165] 第一种方式:利用平台模型确定适宜回答问题的第三方平台,将确定出的第三方平台中的用户确定为适宜回答问题的用户。\n[0166] 采用这种方式时,首先按照平台模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到平台模型中所具有的各维度的特征后,利用各特征的权重值,计算由各平台回答该提问的打分值,从中选择打分值满足预设条件的平台作为适宜回答该问题的第三方平台。\n[0167] 第二种方式:利用平台模型确定适宜回答问题的第三方平台,再利用用户兴趣模型确定在适宜回答问题的第三方平台中适宜回答问题的用户。\n[0168] 在利用用户兴趣模型确定适宜回答该问题的用户时,按照用户兴趣模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到用户兴趣模型中所具有的各维度的特征后,利用各特征的权重值,计算由确定出的第三方平台中各用户回答该提问的打分值,从中选择打分值满足预设条件的用户作为适宜回答该问题的用户。\n[0169] 第三种方式:将提问用户指定的第三方平台确定为适宜回答问题的第三方平台,再利用用户兴趣模型确定在适宜回答问题的第三方平台中适宜回答问题的用户。\n[0170] 第四种方式:利用平台模型和用户兴趣模型融合后得到的扩展后的用户兴趣模型,确定出适宜回答问题的用户。\n[0171] 这种方式中,将用户所属平台的特征加入到用户兴趣模型中,从而得到扩展后的用户兴趣模型,利用扩展后的用户兴趣模型进行问题到用户的映射。按照扩展后的用户兴趣模型中所具有的各维度的特征,从待分发的问题中提取各维度的特征,将提取的特征映射到扩展后的用户兴趣模型中所具有的各维度的特征后,利用各特征的权重值,计算由各用户回答该提问的打分值,从中选择打分值满足预设条件的用户作为适宜回答该问题的用户。\n[0172] 该系统中的页面生成单元07是平台系统中已有的单元,将已有功能与本系统提供的功能进行对接,即负责在问答平台上形成问题的提问页面,将获取到的针对问题的答案发布于提问页面。\n[0173] 在将问题分发给第三方平台后,可以由第三方平台采用其平台特有的消息发送形式推送该问题。以微博平台为例,微博平台具有其特有的消息发送形式,例如引用(@)微博用户、评论微博用户、私信微博用户等等,在此就可以利用其特有的消息发送形式将问题推送给适宜回答该问题的用户。\n[0174] 还存在一种发布问题的方式,即由平台对接单元01通过在第三方平台内嵌的问答平台应用在第三方平台上提供问答平台上问题的提问页面,这样第三方平台的用户就能够在该提问页面上进行问题的回答,这种方式第三方平台的用户实际上是与问答平台应用进行数据的交互。对于提问页面上数据的更新,例如有问题的追问、修改和补充,以及后续有答案,都会在该第三方平台上的提问页面上进行更新。\n[0175] 该系统中的答案推送单元04在推送答案时,如果问题由问答平台的用户产生,则将针对问题的答案采用短信、邮件、站内消息中的至少一种推送给问题的提问用户。如果问题来源于与问答平台对接的第三方平台,则将针对问题的答案提供给问题所来源的第三方平台,由该第三方平台采用自身特有的形式将针对问题的答案推送给问题的提问用户。\n[0176] 本系统实际能够是将用户使用第三方平台功能的入口进行集成,如图5中所示,对于平台A提出的问题,经由本系统分发至平台a、平台b和平台c,并可以从平台a、平台b和平台c获取答案,并回复给平台A。其中平台A可以是问答平台,也可以是平台a、平台b和平台c中的一个,也可以是不同于平台a、平台b和平台c的其他第三方平台。\n[0177] 由以上描述可以看出,本发明提供的方法和系统可以具备以下优点:\n[0178] 1)本发明将问题的回答来源拓展到与问答平台对接的第三方平台,打破了原来问答平台的局限性,使得第三方平台中更专业或更适宜回答问题的用户能够提供答案,从而提高问题被及时回答的概率。\n[0179] 2)与问答平台对接的第三方平台也可以利用本发明的方式获取到更广阔的回答资源,从而实现互惠互利,问答资源逐渐扩展到全网范围。\n[0180] 3)开放问答平台API,可以让任何形态的第三方平台方便地接入。提问用户可以不关心如何去寻找能回答自己问题的人,就能够有专业或者适宜回答自己问题的人提供答案。\n[0181] 4)本发明中第三方平台的实现形式可以有浏览器插件、网站页面或手机APP等,这种广泛的兼容形式,可以方便用户采用各种方式来发布提问和获取答案,完全不受问答平台的形式限制。\n[0182] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。\n[0183] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。\n[0184] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。\n[0185] 上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。\n[0186] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
法律信息
- 2018-09-04
- 2014-05-21
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310712577.0
申请日: 2013.12.20
- 2014-04-23
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-05-11
|
2010-12-30
| | |
2
| |
2008-07-30
|
2008-02-28
| | |
3
| |
2012-08-15
|
2011-02-10
| | |
4
| |
2013-07-24
|
2012-01-18
| | |
5
| |
2011-07-06
|
2010-12-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |