著录项信息
专利名称 | 信息回复方法及装置 |
申请号 | CN201310740010.4 | 申请日期 | 2013-12-27 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-07-01 | 公开/公告号 | CN104750705A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 华为技术有限公司 | 申请人地址 | 广东省深圳市龙岗区坂田华为总部办公楼
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 华为技术有限公司 | 当前权利人 | 华为技术有限公司 |
发明人 | 吉宗诚;张轶博;李航 |
代理机构 | 北京林达刘知识产权代理事务所(普通合伙) | 代理人 | 刘新宇 |
摘要
本发明涉及一种信息回复方法及装置,其中,该信息回复方法包括:接收待回复信息,待回复信息包括文本内容和联系人信息;根据文本内容和联系人信息,从数据库中查找对应的对话风格信息;对文本内容进行预处理,预处理包括分词处理和去停用词处理;根据预处理后的数据,在对话风格信息对应的数据库中进行查找,以确定回复信息。通过待回复信息确定对话风格,并根据预处理后的数据在该对话风格对应的数据库中查找合适的回复信息供用户选择,可以缩短用户回复信息的时间,增强用户体验。
信息回复方法及装置\n技术领域\n[0001] 本发明涉及通信技术领域,尤其涉及一种信息回复方法及装置。\n背景技术\n[0002] 近年来,随着移动终端(例如智能手机、平板电脑等)的发展与普及,人与人之间的文字信息交互方式也逐渐从传统短信服务向微信、微博、飞信、移动QQ等新兴应用转移。在移动终端中,传统短信服务的信息和用户自己安装的客户端(例如微信、微博、飞信、移动QQ等)的信息都需要用户的参与进行回复,然而,进行信息回复的最大问题在于信息的输入非常慢。作为移动终端生产商,为用户提供出色的文字信息交互的操作体验是移动终端生产商赢得用户的重要途径,而在移动终端设计一个高效而实用的信息自动回复系统将会大大提高移动终端的用户体验。\n[0003] 在现有技术中,基于语音识别的输入技术在一定场景下可以很大的提升信息输入的速度,极大地提高了移动终端的用户体验。但是该技术受限于使用的场景,在吵杂的环境下语音识别的准确率不能达到实用水平,因此并不能让所有用户满意,并且在某些不宜讲话而急需输入信息进行回复的场景下(例如在开会中需要回复信息)不能应用此种输入技术。\n[0004] 基于预先设定好的规则或模式的输入技术,回复的短信通常是系统内置或者用户预先定义的,移动终端接收到待回复的短信后,根据预先定义好的规则(例如开会、开车等)回复设置好的短信。这种输入技术能够满足用户的部分需求,但不能回复所有的短信,因为预先设定好的规则或模式比较固定,而且很有限,因此很少被人们使用;此外,这种输入技术无法适用于用户对通过客户端接收到的信息的回复。\n[0005] 综上所述,现有的信息回复方法存在适用范围有限、语言风格单一等缺陷。\n发明内容\n[0006] 技术问题\n[0007] 有鉴于此,本发明要解决的技术问题是,如何提供一种适用范围广、可以适应性调整语言风格的信息自动回复方法及装置。\n[0008] 解决方案\n[0009] 为了解决上述技术问题,在第一方面,本发明提供了一种信息回复方法,包括:\n[0010] 接收待回复信息,所述待回复信息包括文本内容和联系人信息;\n[0011] 根据所述文本内容和所述联系人信息,从数据库中查找对应的对话风格信息;\n[0012] 对所述文本内容进行预处理,所述预处理包括分词处理和去停用词处理;\n[0013] 根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息。\n[0014] 结合第一方面,在第一方面的第一种可能的实现方式中,所述对话风格信息为移动终端中预先保存的对话风格信息;或所述对话风格信息为所述移动终端响应用户操作生成的对话风格信息。\n[0015] 结合第一方面,在第一方面的第二种可能的实现方式中,所述根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息,包括:\n[0016] 根据所述预处理后的数据,从所述对话风格信息对应的数据库检索出备选的信息回复二元组;\n[0017] 从所述信息回复二元组中确定所述回复信息。\n[0018] 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,从所述信息回复二元组中确定所述回复信息,包括:\n[0019] 如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二元组,则根据重排序模型对多条所述信息回复二元组进行重排序;\n[0020] 从所述重排序后的信息回复二元组中确定所述回复信息。\n[0021] 结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,还包括:\n[0022] 按照第一设定周期,根据所述数据库中的数据,训练学习所述重排序模型。\n[0023] 结合第一方面的第二种可能的实现方式,在第一方面的第五种可能的实现方式中,所述根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息,还包括:\n[0024] 按照第二设定周期,对所述数据库中的数据进行数据统计,得到所述待回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得到的;\n[0025] 根据所述预处理后的数据和所述统计信息,从所述对话风格信息对应的数据库检索出备选的信息回复二元组。\n[0026] 结合第一方面以及第一方面的第一种至第五种可能的实现方式中的任一种可能的实现方式,在第一方面的第六种可能的实现方式中,还包括:\n[0027] 对所述待回复信息和所述回复信息进行对话风格分析,并对所述回复信息进行所述预处理;\n[0028] 将分析后的对话风格信息、预处理后的数据和原始数据存入所述数据库,[0029] 其中,所述原始数据包括所述待回复信息的文本内容和联系人信息,以及所述回复信息的文本内容和联系人信息。\n[0030] 在第二方面,本发明提供了一种信息回复装置,包括:\n[0031] 接收单元,用于接收待回复信息,所述待回复信息包括文本内容和联系人信息;\n[0032] 查找单元,与所述接收单元连接,用于根据所述文本内容和所述联系人信息,从数据库中查找对应的对话风格信息;\n[0033] 处理单元,与所述查找单元连接,用于对所述文本内容进行预处理,所述预处理包括分词处理和去停用词处理;\n[0034] 确定单元,与所述处理单元连接,用于根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息。\n[0035] 结合第二方面,在第二方面的第一种可能的实现方式中,所述对话风格信息为移动终端中预先保存的对话风格信息;或所述对话风格信息为所述移动终端响应用户操作生成的对话风格信息。\n[0036] 结合第二方面,在第二方面的第二种可能的实现方式中,所述确定单元还包括:\n[0037] 检索单元,与所述处理单元连接,用于根据所述预处理后的数据,从所述对话风格信息对应的数据库检索出备选的信息回复二元组;\n[0038] 所述确定单元还被配置为,从所述信息回复二元组中确定所述回复信息。\n[0039] 结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述确定单元还包括:\n[0040] 排序单元,与所述检索单元连接,用于如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二元组,则根据重排序模型对多条所述信息回复二元组进行重排序;\n[0041] 所述确定单元还被配置为,从所述重排序后的信息回复二元组中确定所述回复信息。\n[0042] 结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,还包括:\n[0043] 训练单元,用于按照第一设定周期,根据所述数据库中的数据,训练学习所述重排序模型。\n[0044] 结合第二方面的第二种可能的实现方式,在第二方面的第五种可能的实现方式中,所述确定单元还包括:\n[0045] 统计单元,用于按照第二设定周期,对所述数据库中的数据进行数据统计,得到所述待回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得到的;\n[0046] 所述确定单元还被配置为,根据所述预处理后的数据和所述统计信息,从所述对话风格信息对应的数据库检索出备选的信息回复二元组。\n[0047] 结合第二方面以及第二方面的第一种至第五种可能的实现方式中的任一种可能的实现方式,在第二方面的第六种可能的实现方式中,还包括:\n[0048] 分析单元,用于对所述待回复信息和所述回复信息进行对话风格分析,并对所述回复信息进行所述预处理;\n[0049] 存储单元,与所述分析单元连接,用于将分析后的对话风格信息、预处理后的数据和原始数据存入所述数据库,\n[0050] 其中,所述原始数据包括所述待回复信息的文本内容和联系人信息,以及所述回复信息的文本内容和联系人信息。\n[0051] 有益效果\n[0052] 本发明实施例的信息回复方法,通过待回复信息确定对话风格,并根据预处理后的数据在该对话风格对应的数据库中查找合适的回复信息供用户选择,可以缩短用户回复信息的时间,增强用户体验。\n[0053] 根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。\n附图说明\n[0054] 包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。\n[0055] 图1示出根据本发明一实施例的信息回复方法的流程图;\n[0056] 图2示出根据本发明另一实施例的信息回复方法的流程图;\n[0057] 图3示出根据本发明另一实施例的信息回复装置的结构框图;\n[0058] 图4示出根据本发明另一实施例的信息回复装置的结构框图;\n[0059] 图5示出根据本发明另一实施例的信息回复装置的结构框图。\n具体实施方式\n[0060] 以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。\n[0061] 在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。\n[0062] 另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。\n本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。\n[0063] 图1示出根据本发明一实施例的信息回复方法的流程图。如图1所示,该信息回复方法主要可以包括:\n[0064] 步骤100、接收待回复信息,所述待回复信息包括文本内容和联系人信息;\n[0065] 步骤110、根据所述文本内容和所述联系人信息,从数据库中查找对应的对话风格信息。\n[0066] 具体地,在用户使用移动终端(例如手机、平板电脑等)的时候,除了可以通过短信与他人进行沟通交流之外,还可以通过在移动终端安装各种各样的应用客户端(例如移动QQ、微信、微博等)与他人进行沟通交流。在用户接收到他人通过短信或者应用客户端发送的待回复信息之后,可以从待回复信息中读取到其中包括的文本内容以及联系人信息。其中,文本内容即为待回复信息中的内容,联系人信息为用户在移动终端中保存的该联系人的相关信息,例如姓名、电话号码、分组信息等。\n[0067] 在一种可能的实现方式中,在移动终端中,可以保存一个数据库,在该数据库中可以按照不同的对话风格保存用户与他人通过短信或者应用客户端进行沟通的过程中产生的文本内容。在该数据库中,上述文本内容可以以信息回复二元组的形式进行保存。例如,可以将对话风格设置为“对领导/长辈的尊敬风格”、“对朋友/同事的随意风格”和“对家人的亲密风格”等。若用户的领导王某通过短信给用户发来一条短信:帮我定张机票,用户回复:请您稍等,一会儿帮您搞定。可以将信息1“帮我定张机票”,回复1“请您稍等,一会儿帮您搞定”保存在“对领导/长辈的尊敬风格”的对话风格数据库1中。\n[0068] 需要说明的是,上述对话风格信息可以为移动终端中预先保存的对话风格信息,即在移动终端的开发阶段预先保存的对话风格信息;也可以为所述移动终端响应用户操作生成的对话风格信息,即在用户使用移动终端的过程中,可以根据自身的需求对预先保存的对话风格信息进行修改,并设置可以较好满足用户自身需求的对话风格信息,有助于提高该移动终端的用户体验。\n[0069] 在用户接收到待回复信息时,可以结合待回复信息中的文本内容和联系人信息,从数据库中查找当前的对话风格信息,以使得可以在该对话风格信息对应的数据库中查找到合适的回复信息。例如,用户接收到好友刘某发送来的信息:帮我定张机票,文本内容为:\n帮我定张机票,联系人信息可以包括姓名:刘某、分组:好友等,可以结合文本内容和联系人信息从数据库中查找当前的对话风格信息为“对朋友/同事的随意风格”。\n[0070] 步骤120、对所述文本内容进行预处理,所述预处理包括分词处理和去停用词处理。\n[0071] 具体地,在查找到当前的对话风格信息之后,可以对待回复信息中的文本内容进行预处理,该预处理可以包括对文本内容进行分词处理和去停用词处理。其中,不同的文本内容都是由若干个单词或词组组成的,分词处理即为将文本内容按照单词或词组进行拆分,例如“帮我定张机票”通过分词处理之后可以变为“帮/我/定/张/机票”;此外,在文本内容中可能会包括一些停用词,如“的”、“等”等词,这些停用词对查询的结果没有影响,则可以通过去停用词处理将这个词去掉,这样可以减少查找过程的工作量,加快系统的运行速度。\n[0072] 步骤130、根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息。\n[0073] 具体地,经过预处理之后,待回复信息中的原始文本内容可以变为处理后的查询信息,以用于在对话风格信息对应的数据库中进行查找,从而确定用户可以回复的回复信息,其中对话风格信息为步骤110查找到的对话风格信息。\n[0074] 在移动终端中,充分利用用户保存的联系人信息及产生的对话数据,设定不同的对话风格,并根据对话风格信息将产生的对话数据分别保存在对应的数据库中。这样,不需要将用户的对话数据上传至远程云端,有利于保护用户的隐私,并且用户使用的移动终端可以直接完成本实施例的上述步骤,进一步地保护了用户的隐私。\n[0075] 本实施例的信息回复方法,通过待回复信息的文本内容和联系人信息查找对话风格信息,并以预处理后的文本内容作为查询信息,在该对话风格信息对应的数据库中进行查找,可以查找到合适的回复信息供用户选择并进行回复,用户不需要手动输入回复信息,可以缩短用户回复信息的时间,进一步地,通过对话风格的设置,可以向用户提供与待回复信息相匹配的风格的回复,增强了用户体验。\n[0076] 图2示出根据本发明另一实施例的信息回复方法的流程图。图2中标号与图1相同的步骤具有相同的功能,为简明起见,省略对这些步骤的详细说明。\n[0077] 如图2所示,图2所示的信息回复方法与图1所示的信息回复方法主要区别在于,步骤130还可以包括:\n[0078] 步骤200、根据所述预处理后的数据,从所述对话风格信息对应的数据库检索出备选的信息回复二元组;\n[0079] 步骤210、从所述信息回复二元组中确定所述回复信息。\n[0080] 具体地,在一种可能的实现方式中,根据确定的对话风格信息和预处理后的数据,可以在该对话风格信息对应的数据库中检索出备选的信息回复二元组。可以将这些检索到的信息回复二元组推送给用户,用户根据自身的需求,可以从中选择一条回复作为回复信息。同时,用户还可以对该回复信息作一些适当的调整或者修改,以使得回复的信息更加恰当。例如,参见上述实施例一中信息回复方法的相关描述,用户的领导王某通过短信给用户发来一条短信:帮我定张机票,根据待回复信息的文本内容和联系人信息,可以确定对话风格为“对领导/长辈的尊敬风格”,经过预处理可以得到查询信息为“帮/我/定/张/机票”,在该对话风格信息对应的数据库中检索后,得到如下三组备选的信息回复二元组并推送给用户:信息1“帮我定张去香港的机票”,回复1“请您稍等,一会帮您搞定”;信息2“帮我定张去上海的机票”,回复2“好的,请问定什么时候的?”;信息3“给我定两张去上海的机票吧,谢谢!”,回复3“好的,马上!”。在上述检索到的信息回复二元组中,用户可以根据自身的需求选择回复2作为回复信息,并对在回复之前对回复2进行适当的修改,如可以修改为:“好的,请问定去哪里、什么时间的?”。\n[0081] 进一步地,步骤210还可以包括:\n[0082] 步骤220、如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二元组,则根据重排序模型对多条所述信息回复二元组进行重排序;\n[0083] 步骤230、从所述重排序后的信息回复二元组中确定所述回复信息。\n[0084] 具体地,在一种可能的实现方式中,如果步骤200检索到多条(如20条)信息回复二元组,这时如果将这些信息回复二元组直接推送给用户,用户可能无法很快地选择出合适的回复信息,无法提供很好的用户体验。在移动终端中,可以设置一种重排序模型。在检索出多条信息回复二元组之后,可以根据该重排序模型对这些信息回复二元组进行重排序,重排序之后,可以将热点程度较高的信息回复二元组排在靠前的位置推送给用户,其中热点程度较高表示用户使用较为频繁或者回复的可能性较大。\n[0085] 在一种可能的实现方式中,可以对待回复信息和检索出的信息回复二元组抽取一些特征,每个特征都有对应的特征值。训练学习重排序模型就是学习每个特征的特征权重。\n根据重排序模型对检索出的信息回复二元组进行重排序,需要计算每一条信息回复二元组的排序值,该排序值可以用来指示某一条信息回复二元组与待回复信息的相关性,排序值越大表明相关性越强,重排序后的该信息回复二元组的位置越靠前,具体地,排序值可以由以下公式计算得到:\n[0086]\n[0087] 其中,msgnew表示待回复信息,(msg,reply)表示检索出的一条信息回复二元组,msg、reply分别表示信息回复二元组中的信息和回复,n表示抽取的特征数目,fi表示第i个特征的特征值,wi为第i个特征的特征权重。\n[0088] 这里的n个特征可以由开发者预先设定,这n个特征可以包括如下特征:1、初始检索的排序值;2、用户使用某一回复的频率;3、msgnew与msg共有单词的数目;4、msgnew与msg的相似度;5、msgnew与reply共有单词的数目;6、msgnew与reply的相似度。\n[0089] 举例而言,按照设置的K=3推送给用户如下三条信息回复二元组:\n[0090] 信息1“帮我定张去香港的机票”,回复1“请您稍等,一会帮您搞定”;\n[0091] 信息2“帮我定张去上海的机票”,回复2“好的,请问定什么时候的?”;\n[0092] 信息3“给我定两张去上海的机票吧,谢谢!”,回复3“好的,马上!”。\n[0093] 假设检索出的第四条信息回复二元组是:\n[0094] 信息4“记得帮我定张机票,谢谢!”,回复4“好的,请问定去哪里、什么时间的?”。\n[0095] 在设置K=3即推送给用户三条信息回复二元组的情况下,用户并没有看到第四条信息回复二元组。所以用户可以选择第二条并进行修改得到“好的,请问定去哪里、什么时间的?”进行回复。\n[0096] 若使用了重排序模型,系统可以通过计算每条检索出的信息回复二元组(msg,reply)在待回复信息msgnew下的新的排序值,可以将第四条信息回复二元组排到前三位(甚至第一位),这样用户便可以在按照设置的K=3推送给用户的三条信息回复二元组中直接选择“好的,请问定去哪里、什么时间的?”作为回复信息进行回复。这样不但可以提高移动终端推荐回复的精度,而且在一定程度上减少了用户参与修改带来的麻烦,进一步提升该移动终端的用户体验。\n[0097] 需要说明的是,在没有使用重排序模型的时候,每个检索出的信息回复二元组都会有一个排序值,称为初始排序值。这个排序值是通过使用一些简单的统计信息计算得到。\n在重排序模型中,可以将该初始排序值作为一个特征(即上述的特征1),同时还可以考虑更多的特征(如上述的特征2~特征6),因此重排序模型可以使用一种更精确的计算方法得到新的排序值,从而取得更好的排序结果。\n[0098] 在一种可能的实现方式中,上述实施例的信息回复方法中,在移动终端中可以设置两个初始值(如N,K),其中初始值N可以表示检索出的信息回复二元组个数,初始值K可以表示推送给用户的待选择的信息回复二元组个数。例如,在移动终端中,可以设置初始值N=\n20,K=3,则在对话风格信息对应的数据库中检索时,需要检索出N=20条备选的信息回复二元组。对这些信息回复二元组根据重排序模型进行重排序之后,选择前K=3条信息回复二元组作为待选择的信息回复二元组推送给用户,以供用户选择、修改以及回复。\n[0099] 需要说明的是,除了开发者可以设置这两个初始值之外,在用户使用移动终端的过程中,用户还可以根据自身的需求对初始值进行修改,以提供更好的用户体验。\n[0100] 在一种可能的实现方式中,该信息回复方法还可以包括:按照第一设定周期,根据所述数据库中的数据,训练学习所述重排序模型。\n[0101] 具体地,随着用户使用移动终端,由短信和应用客户端产生的对话数据越来越多,在数据库中保存的信息回复二元组也会随之增多,这样初始阶段设置的重排序模型准确度可能会降低,根据重排序模型进行重排序之后,可能不会将热点程度较高的信息回复二元组排在靠前的位置,影响用户的选择。\n[0102] 在一种可能的实现方式中,在移动终端中,可以由开发者设置一个第一设定周期(如30天),按照第一设定周期,移动终端可以自动根据数据库中的对话数据、信息回复二元组指示的信息回复对应关系,重新训练学习一个新的重排序模型,得到准确度高的重排序模型,以使得用户可以快速的得到更为恰当的回复信息。在另一种可能的实现方式中,用户可以根据自身的需求对第一设定周期进行修改。例如,若用户很少使用短信以及微信、移动QQ等应用客户端,由此产生的对话数据会很少,这样初始的重排序模型可能在很长的时间内都可以保持较高的准确度,那么用户可以将第一设定周期延迟,如由30天改为100天。若用户经常使用短信以及微信、移动QQ等应用客户端,由此产生的对话数据会很多,这样初始的重排序模型的准确度可能在很短的时间内下降,那么用户可以将第一设定周期缩短,如由30天改为10天。\n[0103] 通过用户主动修改第一设定周期,以较合适的频率启动训练学习重排序模型的过程,可以避免过于频繁的训练学习重排序模型导致的系统运行缓慢的问题,还可以避免由于重排序模型准确度降低引起的用户体验下降的问题。\n[0104] 在一种可能的实现方式中,该信息回复方法还可以包括:按照第二设定周期,对所述数据库中的数据进行数据统计,得到所述待回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得到的;\n[0105] 步骤130还可以包括:根据所述预处理后的数据和所述统计信息,从所述对话风格信息对应的数据库检索出备选的信息回复二元组。\n[0106] 具体地,在移动终端中,可以由开发者设置一个第二设定周期(如30天),按照第二设定周期,移动终端可以自动对数据库中的对话数据和预处理后的数据进行数据统计,以得到统计信息,以使得可以根据预处理后的数据和统计信息,检索与待回复信息相关的信息回复二元组。在另一种可能的实现方式中,用户可以根据自身的需求对第二设定周期进行修改。具体示例可以参见本实施例中信息回复方法的相关描述。\n[0107] 在一种可能的实现方式中,对待回复信息中的文本内容进行分词处理之后,可以得到相应的单词,例如上述实施例中的相关描述,预处理后,可以得到“帮/我/定/张/机票”等多个单词。按照第二设定周期,可以对数据库中预处理后得到的单词进行数据统计,可以得到单词在某个句子中或者某个文档中出现的概率即词频。在检索的过程中,考虑到这些统计信息,可以使检索的结果更加精确。\n[0108] 在一种可能的实现方式中,在步骤130之后,该信息回复方法还可以包括:\n[0109] 步骤240、对所述待回复信息和所述回复信息进行对话风格分析,并对所述回复信息进行所述预处理;\n[0110] 步骤250、将分析后的对话风格信息、预处理后的数据和原始数据存入所述数据库,其中,所述原始数据包括所述待回复信息的文本内容和联系人信息,以及所述回复信息的文本内容和联系人信息。\n[0111] 具体地,通过本实施例以及上述实施例的步骤,接收到待回复信息、确定回复信息并进行回复之后,可以对当前的对话数据即待回复信息和回复信息进行对话风格分析,也可以对回复信息进行预处理。其中,对话风格分析表示确定当前对话属于的对话风格,预处理的具体示例可以参见上述实施例中的相关描述。将分析后的对话风格信息、预处理后的数据和原始对话数据存入对话风格信息对应的数据库中,以用于后续信息的回复。\n[0112] 需要说明的是,在确定回复信息之前,已经确定了当前对话数据的对话风格,但是经过用户对回复信息的修改可能会改变对话数据的对话风格。考虑到确定对话风格时的偏差和用户修改引起的对话风格变化,在此还可以进行一次对话风格分析,以使得可以将对话数据保存到最合适的对话风格对应的数据库中。而移动终端可以保存对待回复信息的预处理结果,并且在信息回复过程中,待回复信息没有发生变化,此时不需要再对待回复信息进行预处理。\n[0113] 本实施例的信息回复方法,通过待回复信息的文本内容和联系人信息确定当前的对话风格,并以预处理后的文本内容作为查询信息,在该对话风格对应的数据库中进行查找,可以查找到合适的回复信息供用户选择并进行回复,用户不需要完全手动输入回复信息,可以缩短用户回复信息的时间,进一步地,通过对话风格的设置,可以向用户提供与待回复信息相匹配的风格的回复,增强了用户体验。\n[0114] 图3示出根据本发明一实施例的信息回复装置的结构框图。如图3所示,该信息回复装置300主要可以包括:\n[0115] 接收单元310,用于接收待回复信息,所述待回复信息包括文本内容和联系人信息;\n[0116] 查找单元320,与所述接收单元310连接,用于根据所述文本内容和所述联系人信息,从数据库中查找对应的对话风格信息。\n[0117] 具体地,在用户使用移动终端(例如手机、平板电脑等)的时候,除了可以通过短信与他人进行沟通交流之外,还可以通过在移动终端安装各种各样的应用客户端(例如移动QQ、微信、微博等)与他人进行沟通交流。在接收单元310接收到他人通过短信或者应用客户端发送的待回复信息之后,可以从待回复信息中读取到其中包括的文本内容以及联系人信息。其中,文本内容即为待回复信息中的内容,联系人信息为用户在移动终端中保存的该联系人的相关信息,例如姓名、电话号码、分组信息等。\n[0118] 在一种可能的实现方式中,在移动终端中,可以保存一个数据库,在该数据库中可以按照不同的对话风格保存用户与他人通过短信或者应用客户端进行沟通的过程中产生的文本内容。在该数据库中,上述文本内容可以以信息回复二元组的形式进行保存。例如,可以将对话风格设置为“对领导/长辈的尊敬风格”、“对朋友/同事的随意风格”和“对家人的亲密风格”等。若用户的领导王某通过短信给用户发来一条短信:帮我定张机票,用户回复:请您稍等,一会儿帮您搞定。可以将信息1“帮我定张机票”,回复1“请您稍等,一会儿帮您搞定”保存在“对领导/长辈的尊敬风格”的对话风格数据库1中。\n[0119] 在接收单元310接收到待回复信息之后,查找单元320可以结合待回复信息中的文本内容和联系人信息,从数据库中查找当前的对话风格信息,以使得可以在该对话风格信息对应的数据库中查找到合适的回复信息。例如,接收单元310接收到好友刘某发送来的信息:帮我定张机票,文本内容为:帮我定张机票,联系人信息可以包括姓名:刘某、分组:好友等,查找单元320可以结合文本内容和联系人信息,从数据库中查找当前的对话风格信息为“对朋友/同事的随意风格”。\n[0120] 对话风格信息的具体示例可以参见本发明上述实施例中的相关描述,在此不再赘述。\n[0121] 处理单元330,与所述查找单元320连接,用于对所述文本内容进行预处理,所述预处理包括分词处理和去停用词处理。\n[0122] 具体地,在查找单元320查找到当前的对话风格信息之后,处理单元330可以对待回复信息中的文本内容进行预处理,该预处理可以包括对文本内容进行分词处理和去停用词处理。其中,不同的文本内容都是由若干个单词或词组组成的,分词处理即将文本内容按照单词或词组进行拆分,例如“帮我定张机票”通过分词处理之后可以变为“帮/我/定/张/机票”;此外,在文本内容中可能会包括一些停用词,如“的”、“等”等词,这些停用词对查询的结果没有影响,则可以通过去停用词处理将这个词去掉,这样可以减少查找过程的工作量,加快系统的运行速度。\n[0123] 确定单元340,与所述处理单元330连接,用于根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息。\n[0124] 具体地,经过处理单元330进行预处理之后,待回复信息中的原始文本内容可以变为处理后的查询信息,以用于确定单元340在对话风格信息对应的数据库中进行查找,从而确定用户可以回复的回复信息,其中对话风格信息为查找单元320查找到的对话风格信息。\n[0125] 在移动终端中,充分利用用户保存的联系人信息及产生的对话数据,设定不同的对话风格,并根据对话风格信息将产生的对话数据分别保存在对应的数据库中。这样,不需要将用户的对话数据上传至远程云端,有利于保护用户的隐私。\n[0126] 本实施例的信息回复装置,查找单元根据待回复信息的文本内容和联系人信息查找对话风格信息,并以处理单元预处理后的文本内容作为查询信息,在该对话风格信息对应的数据库中进行查找,可以查找到合适的回复信息供用户选择并进行回复,用户不需要手动输入回复信息,可以缩短用户回复信息的时间,进一步地,通过对话风格的设置,可以向用户提供与待回复信息相匹配的风格的回复,增强了用户体验。\n[0127] 图4示出根据本发明另一实施例的信息回复装置的结构框图。图4中标号与图3相同的组件具有相同的功能,为简明起见,省略对这些组件的详细说明。\n[0128] 如图4所示,图4所示的信息回复装置400与图3所示的信息回复装置300的主要区别在于,确定单元340还可以包括:\n[0129] 检索单元410,与所述处理单元330连接,用于根据所述预处理后的数据,从所述对话风格信息对应的数据库检索出备选的信息回复二元组;\n[0130] 所述确定单元340还被配置为,从所述信息回复二元组中确定所述回复信息。\n[0131] 具体地,在一种可能的实现方式中,根据查找单元320查找的对话风格信息和处理单元330预处理后的数据,检索单元410可以在该对话风格信息对应的数据库中检索出备选的信息回复二元组。信息回复装置400可以将这些检索到的信息回复二元组推送给用户,用户根据自身的需求,可以从中选择一条回复作为回复信息。同时,用户还可以对该回复信息作一些适当的调整或者修改,以使得回复的信息更加恰当。具体示例可以参见本发明上述实施例信息回复方法中的相关描述。\n[0132] 进一步地,确定单元340还可以包括:\n[0133] 排序单元420,与所述检索单元410连接,用于如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二元组,则根据重排序模型对多条所述信息回复二元组进行重排序;\n[0134] 所述确定单元340还被配置为,从所述重排序后的信息回复二元组中确定所述回复信息。\n[0135] 具体地,在一种可能的实现方式中,如果步骤200检索单元410检索到多条(如20条)信息回复二元组,这时如果信息回复装置400将这些信息回复二元组直接推送给用户,用户可能无法很快地选择出合适的回复信息,无法提供很好的用户体验。可以在信息回复装置中设置一种重排序模型。在检索单元410检索出多条信息回复二元组之后,排序单元\n420可以根据该重排序模型对这些信息回复二元组进行重排序,重排序之后,可以将热点程度较高的信息回复二元组排在靠前的位置推送给用户,其中热点程度较高表示用户使用较为频繁或者回复的可能性较大。重排序模型以及重排序过程的具体示例可以参见本发明上述实施例信息回复方法中的相关描述。\n[0136] 在一种可能的实现方式中,在信息回复装置400中,可以设置两个初始值(如N,K),其中初始值N可以表示检索单元410检索出的信息回复二元组个数,初始值K可以表示信息回复装置400推送给用户的待选择的信息回复二元组个数。例如,可以设置初始值N=20,K=\n3,则检索单元410在对话风格信息对应的数据库中检索时,需要检索出N=20条信息回复二元组。排序单元420对这些信息回复二元组根据重排序模型进行重排序之后,选择前K=3条信息回复二元组作为待选择的信息回复二元组推送给用户,以供用户选择、修改以及回复。\n[0137] 需要说明的是,除了开发者可以设置这两个初始值之外,在用户使用移动终端的过程中,用户还可以根据自身的需求对初始值进行修改,以提供更好的用户体验。\n[0138] 在一种可能的实现方式中,该信息回复装置400还可以包括:\n[0139] 训练单元430,用于按照第一设定周期,根据所述数据库中的数据,训练学习所述重排序模型。\n[0140] 具体地,随着用户使用移动终端,由短信和应用客户端产生的对话数据越来越多,在数据库中保存的信息回复二元组也会随之增多,这样初始阶段设置的重排序模型准确度可能会降低,排序单元420根据重排序模型进行重排序之后,可能不会将热点程度较高的信息回复二元组排在靠前的位置,影响用户的选择。\n[0141] 在一种可能的实现方式中,在信息回复装置400中,可以由开发者设置一个第一设定周期(如30天),训练单元430可以按照第一设定周期,根据数据库中的对话数据、信息回复二元组指示的信息回复对应关系,重新训练学习一个新的重排序模型,得到准确度高的重排序模型,以使得用户可以快速的得到更为恰当的回复信息。在另一种可能的实现方式中,用户可以根据自身的需求对第一设定周期进行修改。具体示例可以参见本发明上述实施例信息回复方法中的相关描述。\n[0142] 通过用户主动修改第一设定周期,以较合适的频率启动训练单元430训练学习重排序模型的过程,可以避免过于频繁的训练学习重排序模型导致的移动终端运行缓慢的问题,还可以避免由于重排序模型准确度降低引起的用户体验下降的问题。\n[0143] 在一种可能的实现方式中,该信息回复装置400还可以包括:\n[0144] 统计单元440,用于按照第二设定周期,对所述数据库中的数据进行数据统计,得到所述待回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得到的;\n[0145] 确定单元340还被配置为:根据所述预处理后的数据和所述统计信息,从所述对话风格信息对应的数据库检索出备选的信息回复二元组。\n[0146] 具体地,在信息回复装置400中,可以由开发者设置一个第二设定周期(如30天),统计单元440可以按照第二设定周期,移动终端可以自动对数据库中的对话数据和预处理后的数据进行数据统计,以得到统计信息,以使得确定单元340可以根据预处理后的数据和统计信息,检索与待回复信息相关的信息回复二元组。在另一种可能的实现方式中,用户可以根据自身的需求对第二设定周期进行修改。具体示例可以参见本实施例中信息回复方法的相关描述。\n[0147] 在一种可能的实现方式中,对待回复信息中的文本内容进行分词处理之后,可以得到相应的单词,例如上述实施例中的相关描述,预处理后,可以得到“帮/我/定/张/机票”等多个单词。统计单元440可以按照第二设定周期,对数据库中预处理后得到的单词进行数据统计,得到单词在某个句子中或者某个文档中出现的概率即词频。在检索单元410进行检索的过程中,考虑到这些统计信息,可以使检索的结果更加精确。\n[0148] 在一种可能的实现方式中,该信息回复装置400还可以包括:\n[0149] 分析单元450,与所述确定单元340连接,用于对所述待回复信息和所述回复信息进行对话风格分析,并对所述回复信息进行所述预处理;\n[0150] 存储单元460,与所述分析单元450连接,用于将分析后的对话风格信息、预处理后的数据和原始数据存入所述数据库,其中,所述原始数据包括所述待回复信息的文本内容和联系人信息,以及所述回复信息的文本内容和联系人信息。\n[0151] 具体地,本实施例以及上述实施例的信息回复装置,接收单元310接收到待回复信息、确定单元430确定回复信息并进行回复之后,分析单元450可以对当前的对话数据即待回复信息和回复信息进行对话风格分析,也可以对回复信息进行预处理。其中,对话风格分析表示确定当前对话数据的对话风格信息,预处理的具体示例可以参见本发明上述实施例信息回复方法中的相关描述。存储单元460可以将分析单元450得到的对话风格信息、预处理后的数据和原始对话数据存入对话风格信息对应的数据库中,以用于后续信息的回复。\n[0152] 需要说明的是,查找单元320已经确定了当前对话数据的对话风格信息,但是经过用户对回复信息的修改之后可能会改变对话数据的对话风格信息。考虑到查找单元320查找对话风格信息时的偏差和用户修改引起的对话风格变化,再进行一次对话风格分析,以使得存储单元460可以将对话数据保存到最合适的对话风格信息对应的数据库中。而移动终端可以保存对待回复信息的预处理结果,并且在信息回复过程中,待回复信息没有发生变化,此时不需要再对待回复信息进行预处理。\n[0153] 本实施例的信息回复装置,查找单元根据待回复信息的文本内容和联系人信息查找对话风格信息,并以处理单元预处理后的文本内容作为查询信息,在该对话风格信息对应的数据库中进行查找,可以查找到合适的回复信息供用户选择并进行回复,用户不需要手动输入回复信息,可以缩短用户回复信息的时间,进一步地,通过对话风格的设置,可以向用户提供与待回复信息相匹配的风格的回复,增强了用户体验。\n[0154] 图5示出根据本发明的另一实施例的信息回复装置的结构框图。所述信息回复装置500可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或移动终端等。本发明具体实施例并不对计算节点的具体实现做限定。\n[0155] 所述信息回复装置500包括处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和总线540。其中,处理器510、通信接口520、以及存储器530通过总线540完成相互间的通信。\n[0156] 通信接口520用于与网络设备通信,其中网络设备包括例如虚拟机管理中心、共享存储等。\n[0157] 处理器510用于执行程序。处理器510可能是一个中央处理器CPU,或者是专用集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。\n[0158] 存储器530用于存放文件。存储器530可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器530也可以是存储器阵列。存储器530还可能被分块,并且所述块可按一定的规则组合成虚拟卷。\n[0159] 在一种可能的实施方式中,上述程序可为包括计算机操作指令的程序代码。该程序具体可用于:\n[0160] 接收待回复信息,所述待回复信息包括文本内容和联系人信息;\n[0161] 根据所述文本内容和所述联系人信息,从数据库中查找对应的对话风格信息;\n[0162] 对所述文本内容进行预处理,所述预处理包括分词处理和去停用词处理;\n[0163] 根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行查找,以确定回复信息。\n[0164] 在一种可能的实现方式中,所述根据所述文本内容,在所述对话风格信息对应数据库中进行查找,以确定回复信息,包括:\n[0165] 根据所述预处理后的数据,从所述对话风格信息对应的数据库检索出备选的信息回复二元组;\n[0166] 从所述信息回复二元组中确定所述回复信息。\n[0167] 在一种可能的实现方式中,从所述信息回复二元组中确定所述回复信息,包括:\n[0168] 如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二元组,则根据重排序模型对多条所述信息回复二元组进行重排序;\n[0169] 从所述重排序后的信息回复二元组中确定所述回复信息。\n[0170] 在一种可能的实现方式中,还包括:\n[0171] 按照第一设定周期,根据所述数据库中的数据,训练学习所述重排序模型。\n[0172] 在一种可能的实现方式中,所述根据所述文本内容,在所述对话风格信息对应的数据库中进行查找,以确定回复信息,还包括:\n[0173] 按照第二设定周期,对所述数据库中的数据进行数据统计,得到所述待回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得到的;\n[0174] 根据所述预处理后的数据和所述统计信息,从所述对话风格信息对应的数据库检索出备选的信息回复二元组。\n[0175] 在一种可能的实现方式中,还包括:\n[0176] 对所述待回复信息和所述回复信息进行对话风格分析,并对所述回复信息进行所述预处理;\n[0177] 将分析后的对话风格信息、预处理后的数据和原始数据存入所述数据库,[0178] 其中,所述原始数据包括所述待回复信息的文本内容和联系人信息,以及所述回复信息的文本内容和联系人信息。\n[0179] 本领域普通技术人员可以意识到,本文所描述的实施例中的各示例性单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现,取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。\n[0180] 如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时,则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中,包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。\n[0181] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
法律信息
- 2019-05-28
- 2015-07-29
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310740010.4
申请日: 2013.12.27
- 2015-07-01
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-11-24
|
2010-05-10
| | |
2
| |
2012-09-26
|
2012-06-05
| | |
3
| |
2009-01-14
|
2007-07-12
| | |
4
| |
2009-07-01
|
2007-12-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |