技术领域\n本发明属于搜索引擎和即时通信系统领域,尤其涉及一种利用即时通信系统进行信息搜索的方法及系统。\n背景技术\n即时通信系统是指用户以各种终端设备通过互联网、移动网进行实时交流,立刻把文本、图像、视频、音频及电子邮件等信息发送到指定接收者,接收者根据需要可以马上回复或以后回复。即时通信系统已成为公众实时交流的一种重要通信方式。用户要使用即时通信系统则必须先申请即时通信系统的帐号。现有的即时通信系统提供了信息搜索的功能,在进行信息搜索的时候必须通过帐号登录即时通信系统,用户输入所要搜索信息的关键词以后,搜索引擎根据所输入的关键词在互联网的数据库中搜索相匹配的信息,并将结果提供给用户。\n然而,虽然互联网的内容已经十分丰富,但是人类所掌握的知识更加丰富,有很多知识存在于人们的大脑中,可能因为种种原因,它不一定在互联网上;另外有的信息即使在互联网上,但是由于当前搜索技术的限制,人们不一定能方便的找到自己所要的信息,例如一部电影的下载地址,排在前面的结果不一定能连接。总之,当前的进行信息搜索的方法及系统还不能完全满足人们的搜索需求,一方面是不能搜索到互联网上没有的知识,另一方面是不能够找到能给进行信息搜索的用户提供所要搜索信息的用户。\n发明内容\n本发明实施例所要解决的技术问题在于提供一种利用即时通信系统进行信息搜索的方法及系统,其能通过找到能给进行信息搜索的用户提供所要搜索信息的用户,从而使进行信息搜索的用户取得互联网上没有的知识。\n为解决上述技术问题,本发明实施例提供一种利用即时通信系统进行信息搜索的方法,其包括以下步骤:\nA、确定每个即时通信系统的帐号对某一查询串的认知级别;\nB、向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户;\n所述步骤A包括以下步骤:\nA1、用户通过即时通信系统的帐号登录即时通信系统;\nA2、用户在即时通信系统中输入所要搜索信息的查询串,或者用户注册一个查询串;\nA3、通过向量空间模型或通过字符串比较计算匹配度,将该查询串与数据库中的查询串进行相似性计算;\nA4、搜索到最相关的查询串后,将用户的查询次数和即时通信系统的帐号存储到数据库中;\nA5、计算每个即时通信系统的帐号对某一查询串的认知级别;\nA6、根据用户的查询次数和即时通信系统的帐号对数据库中所有查询串建立索引。\n本发明实施例还提供一种利用即时通信系统进行信息搜索的系统,其包括:\n认知级别设定装置,用于确定每个即时通信系统的帐号对某一查询串的认知级别;和\n推荐装置,用于向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户;\n所述认知级别设定装置包括:\n登录模块,用于用户通过即时通信系统的帐号登录即时通信系统;\n查询串输入模块,用于用户在即时通信系统中输入所要搜索信息的查询串,或者用户注册一个查询串;\n查询串相似性计算模块,用于通过向量空间模型或通过字符串比较计算匹配度,将查询串与数据库中的查询串进行相似性计算;\n信息存储模块,用于将用户的查询次数和即时通信系统的帐号存储到数据库中;\n认知级别计算模块,用于计算每个即时通信系统的帐号对某一查询串的认知级别;\n索引建立模块,用于根据用户的查询次数和即时通信系统的帐号对数据库中所有查询串建立索引。\n由于本发明实施例的利用即时通信系统进行信息搜索的方法和系统通过确定每个即时通信系统的帐号对某一查询串的认知级别,然后向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户,因此使进行信息搜索的用户能取得互联网上没有的知识。\n附图说明\n图1是本发明实施例提供的利用即时通信系统进行信息搜索的方法流程图。\n图2是本发明实施例提供的利用即时通信系统进行信息搜索的方法中步骤A的流程图。\n图3是本发明实施例提供的利用即时通信系统进行信息搜索的方法中步骤B的流程图。\n图4是本发明实施例提供的利用即时通信系统进行信息搜索的系统示意图。\n具体实施方式\n为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。\n请参阅图1至图3,本发明实施例利用即时通信系统进行信息搜索的方法包括以下步骤:\nA、确定每个即时通信系统的帐号对某一查询串的认知级别,具体包括以下步骤:\nA1、用户通过即时通信系统的帐号登录即时通信系统;\nA2、用户在即时通信系统中输入所要搜索信息的查询串,或者用户注册一个查询串;在即时通信系统中输入所要搜索信息的查询串可以在即时通信系统的客户端工具的搜索界面中输入所要搜索信息的查询串,或者通过网页登录即时通信系统的帐号,在网页页面中输入所要搜索信息的查询串;\nA3、通过向量空间模型或通过字符串比较计算匹配度,将该查询串与数据库中的查询串进行相似性计算;其中,\n向量空间模型是搜索模型的一种,向量的特征项一般是语素的权重,可以通过tf*idf计算,通过向量空间的相似性计算确定两个查询串的相似度。向量空间模型计算两个查询串的公式一般如下:其中,d
是数据库保存串的向量,q是查询串的向量;\n通过字符串比较计算匹配度是通过计算相同字符串各自所占比例的和来计算其相似度,可以按如下计算公式:其中,Ld是数据库中查询串的长度,L1是与查询串完全重复的串的长度,Lq是本次查询串的长度,L2是与数据库中查询串完全重复的串的长度,如果两个串完全重复,则Sim(d,q)的值为1;\nA4、搜索到最相关的查询串后,将用户的查询次数和即时通信系统的帐号存储到数据库中;如果完全没有相关的查询串,则将该查询串也保存到数据库中;\nA5、计算每个即时通信系统的帐号对某一查询串的认知级别;该认知级别的计算是根据查询次数、查询时间、注册信息、用户信息(如被邀请的专家)、解答问题的次数、在线情况、用户的年龄、兴趣等因素计算该即时通信系统的帐号对这个查询串的认知级别。例如对一个问题查询次数较多的人,他必定对这个问题比较感兴趣,如果不能在互联网上找到答案,他也有可能通过查阅其他资料和向别人求教来得到答案,因此根据查询次数和查询时间可以确定其认知级别;当然也可以通过其他用户的投票来提高用户的认知级别;\n认知级别的计算具体如下:用户的查询次数因子其中n是查询次数;假设最早查询时间为T1,最近查询时间为T2,则时间权重为Wt=log(T2-T1)×Wa,该公式表示用户对一个问题关注时间较长,并且关注次数多则对这个问题的认识程度较高;假设注册信息与本查询的相关度权重为Wb,用户级别权重为Wc,用户在线权重为Wd,年龄权重为We,由于成年人解决问题的能力更强,速度更快,因此对于年龄较大,并且网龄较长者给于一定加权;对于用户的兴趣权重Wf,可以根据用户的帐户注册信息,也可以根据用户的浏览习惯,如用户经常浏览电脑硬件频道,该用户可能对电脑的硬件配置比较专业,也可以根据用户搜索的关键词特征和类别,以及其点击搜索结果的网页分类特点,确定其兴趣,如果用户的兴趣与该查询串吻合,则可以提高其权重。最终权重和为W=Wt+Wb+Wc+Wd+We+Wf。在计算一个用户对某一查询串的认知级别时,我们也要考虑某些用户为了得到推荐而作弊的行为,比如很小时间段查询次数过多等;\nA6、根据用户的查询次数和即时通信系统的帐号对数据库中所有查询串建立索引;\nB、向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户,其具体包括以下步骤:\nB1、用户在即时通信系统中输入所要搜索信息的查询串;在即时通信系统中输入所要搜索信息的查询串可以在即时通信系统的客户端工具的搜索界面中输入所要搜索信息的查询串,或者通过网页登录即时通信系统的帐号,在网页页面中输入所要搜索信息的查询串;\nB2、提取该查询串的关键词,如去掉一些无意义的感叹词和助词等;\nB3、在索引中搜索该关键词;\nB4、通过向量空间模型或通过字符串比较计算匹配度,计算搜索结果与查询串的相似性;\nB5、从最相关的查询串的所有即时通信系统的帐号中选取对所要搜索信息的查询串认知级别较高的推荐给进行信息搜索的用户。\n请参阅图4,本发明实施例利用即时通信系统进行信息搜索的系统包括:\n认知级别设定装置,用于确定每个即时通信系统的帐号对某一查询串的认知级别;\n推荐装置,用于向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户。\n认知级别设定装置包括:\n登录模块,用于用户通过即时通信系统的帐号登录即时通信系统;\n查询串输入模块,用于用户在即时通信系统中输入所要搜索信息的查询串,或者用户注册一个查询串;\n查询串相似性计算模块,用于通过向量空间模型或通过字符串比较计算匹配度,将查询串与数据库中的查询串进行相似性计算;\n信息存储模块,用于存储用户的查询次数、即时通信系统的帐号和数据库中没有的查询串存储到数据库中;\n认知级别计算模块,用于计算每个即时通信系统的帐号对某一查询串的认知级别;\n索引建立模块,用于根据用户的查询次数和即时通信系统的帐号对数据库中所有查询串建立索引。\n本发明实施例利用即时通信系统进行信息搜索的方法和系统能通过向进行信息搜索的用户推荐对所要搜索信息的查询串认知级别较高的用户,从而使进行信息搜索的用户取得互联网上没有的知识,也可以增强具有相同兴趣的人之间的交流,而知识的交流有可能产生出新的知识,因此具有一定的社会效益。\n以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。