著录项信息
专利名称 | 计算机辅助报告与知识库产生的方法 |
申请号 | CN200810063295.1 | 申请日期 | 2008-07-30 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2008-12-31 | 公开/公告号 | CN101334784 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 施章祖;施侃晟 | 申请人地址 | 浙江省杭州市滨江区江南大道3778号元天科技大楼4楼杭州经合智能控股有限公司
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 施章祖,施侃晟 | 当前权利人 | 施章祖,施侃晟 |
发明人 | 施章祖;施侃晟 |
代理机构 | 杭州九洲专利事务所有限公司 | 代理人 | 陈继亮 |
摘要
本发明涉及一种计算机辅助报告与知识库产生方法,包括步骤:服务器端系统接收用户搜索信息的请求,在互联网及第三方数据库中搜索与用户搜索需求匹配的所有结构化及非结构化网页和网站,并将搜索的结果分类、去重、整理后返回给用户的客户端数字终端系统,同时匹配第三方数据库;服务器端系统记录用户的搜索行为、监测信息源的更新情况并实时捕捉、归类更新的信息,在用户登录时提醒用户信息源的更新情况;用户在搜索得到的结果中挑选需要的信息采集到系统中,并利用知识挖掘方法,生成报告并导出文件。本发明有益的效果是:提高了用户搜索、采集、分类信息的效率,通过人机交互,把非结构化信息转化为结构化信息,并能保留信息之间的语义关联性。
计算机辅助报告与知识库产生的方法\n技术领域\n[0001] 本发明涉及一种计算机情报收集和导出方法,特别是一种计算机辅助报告与知识库产生的方法。\n背景技术\n[0002] 随着市场竞争的日益激烈以及知识经济的不断成长,很多企业尤其是大型集团企业越来越感觉到情报质量以及信息新鲜度的重要性,都认识到市场情报的系统性采集整理、实时监听、产业分析对企业自身的业务发展以及对下属子公司、子集团的业务支持起到了至关重要的、不可或缺的作用。而一般大型的企业业务种类较多,网络情报的收集工作量非常大,传统的人工采集无非就是指派特定的采集人员进行网络搜索,且搜集到的信息需要人工进行整理、过滤、整合,最终形成的情报报告的真实性和新鲜度无法保证,因此,迫切需要借助搜索和报告产生软件工具协助完成。\n[0003] 目前市面上的情报采集和导出系统主要针对信息的采集过程,能够对结构化的信息进行简单的提取、转换、正则过滤并整合成同一个主题的信息集,并有数据的导出功能,在一定程度上减少了人工采集、过滤、整理的工作量,但是对全网非结构化的信息、信息源的实时监控、基于循环追踪的信息垂直挖掘和基于报告模板的导出方面却没有特别突出的建树,而这些恰恰是攸关情报质量和情报新鲜度的最关键、最需要借助计算机辅助的地方。\n在挖掘方面,现在一些商业智能系统和软件已经能够实现较为复杂的数据分析和挖掘,特别是OLAP和数据挖掘的应用,使得系统和软件能够得出一些非线性的结论。但是它们都局限在以结构化数据库为核心的数据中挖掘,而在实际的应用中,系统和软件需要将一些非量化的信息转化为能够为机器计算的数据的同时,很多时候会将非量化的信息之间的关联性丢弃掉,从而造成分析结果的不准确和不完整。而且,商业智能系统和软件对使用者的知识层面的要求较高,不能为一般的情报采集人员广泛使用,所以,目前的商业智能系统和软件也不能很好地解决情报采集和生成的问题。\n[0004] 因此,需要一种具有对结构化和非结构化信息进行全网融合搜索、循环垂直深度追踪挖掘、7×24实时监听、保护内容间语义关联性的信息萃取功能的、可同时面向一般工作人员、专业情报工作人员和行业专家的方法、系统和计算机程序,来真正为更多企业、科研院校和政府职能部门的业务发展、战略制定、规划和决策提供支撑。这样的方法、系统和计算机程序能够为用户的情报体系建设带来全面(结构化和非结构化信息进行全网融合搜索)、深度(循环垂直深度追踪挖掘)、实时(7×24实时监听)以及不损伤信息之间的语义关联(保护内容间语义关联性的信息萃取)等务实的益处。\n发明内容\n[0005] 本发明的目的是克服上述传统技术的缺点和不足,而提供一种计算机辅助报告与知识库产生的方法,更具体地说,是一种基于非结构化信息源和结构化信息源,包括互联网的全网搜索(网页和结构化网站),以及线下的第三方数据库(如:专利数据库等)的全方位融合搜索、对关注兴趣点的不间断地实时监听,并围绕着企业设定的主题而辅助用户产生主题报告的方法。\n[0006] 本发明解决其技术问题采用的技术方案。这种计算机辅助报告与知识库产生方法,具体包括如下步骤:\n[0007] 1.1)、服务器端系统接收用户搜索信息的请求,在互联网及第三方数据库中搜索与用户搜索需求匹配的所有结构化及非结构化网页和网站,并将搜索的结果分类、去重、整理后返回给用户的客户端数字终端系统,同时自动匹配第三方数据库如邓百氏企业数据库、专利数据库、公安案例库、行业数据库等数据库中对应的信息;\n[0008] 1.2)、服务器端系统自动记录用户的搜索行为、主动监测信息源的更新情况并实时捕捉、归类更新的信息,在用户登录时提醒用户信息源的更新情况,同时对用户邮箱发出提醒邮件;\n[0009] 1.3)、用户在搜索得到的结果中挑选需要的信息采集到系统中,并利用知识挖掘方法,生成报告并导出文件;\n[0010] 1.4)、服务器端系统对用户的行为进行机器学习,并主动发掘用户的搜索需求,自动提示用户需要搜索的信息点。\n[0011] 本发明中用户可以对搜索得到的信息进行深度搜索、即时呼叫、用USB KEY的方式对用户进行管理并提供第三方数据库的接口。\n[0012] 本发明有益的效果是:\n[0013] 1)、大大提高了用户搜索、采集、分类信息的效率,并为企业的决策部门和管理者提供多种途径、更便捷的企业决策工具;\n[0014] 2)、通过人机交互,把非结构化信息转化为结构化信息,并能保留信息之间的语义关联性,如“团队”和“项目”之间的关联性,和搜索来的其它结构化信息融合为报告需要的素材,充实了情报信息的构成,使得情报信息更完整、更准确,大幅度地提高了企业获取、利用情报的效率,节省情报信息收集、存储、挖掘的相关费用;\n[0015] 3)、提供循环深度搜索,通过发散、聚合这个过程的不断重复,用户可以在不同的信息层次的兴趣点不断深度搜索下一个层次的信息;\n[0016] 4)、跟踪用户的兴趣点,对这些兴趣点进行不间断实时监听,对这些兴趣点的新动态予以捕捉、采集,以供用户下次登录时对这些信息或者情报及时利用,保证了信息的新鲜度,使得企业能够快地应对竞争对手和市场的变化;\n[0017] 5)、知识挖掘功能能够依据用户给定的主题分析逻辑,在人工协助和修正下对数据进行规模整理并对信息和情报数据进行程序分析,得出互联网和第三方数据库里不具备的初级推理性结论和相对详细的报告,供用户进行更高层次的推理,如:一个产品的未来发展趋势、一种创新的潜在产品的建议。并能够让用户把搜索出来的数据加入报告,提供报告导出功能,方便用户脱机浏览;\n[0018] 6)、能够对搜索出来的公司及人物通过即时通讯联系对方,方便了解信息的真实性和合作的开展。\n附图说明\n[0019] 图1示出示例性实施例中本发明系统得以实现的系统框图;\n[0020] 图2示出示例性实施例中实现本系统的系统流程图;\n[0021] 图3-1示出示例性实施例中的索引数据结构图;\n[0022] 图3-2示出示例性实施例中的搜索结果数据结构图;\n[0023] 图3-3示出示例性实施例中的用户学习模型数据结构图;\n[0024] 图4-1示出示例性网页的用户主界面截图;\n[0025] 图4-2示出示例性网页的信息采集用户界面截图;\n[0026] 图4-3示出示例性网页的深度循环垂直搜索和呼叫中心用户界面截图;\n[0027] 图4-4示出示例性网页的报告导出用户界面截图。\n具体实施方式\n[0028] 下面结合附图和实施例对本发明作进一步介绍:\n[0029] 对本描述来说,在附图的任一个或多个中引用具有相同标号的步骤或特征的情况下,这些步骤或特征具有基本上相同的功能或操作。\n[0030] 图1示出的是示例性实施例中计算机辅助报告与知识库产生系统的系统框图。该系统包括客户端系统I 100,客户端系统II 110,呼叫终端I 120,呼叫终端II 130,数字网络140,第三方数据源150,服务器端系统160,应用程序170,数据库记录180以及数据库服务器端系统190。下面结合图1对各个部分进行详细地说明。\n[0031] 客户端系统I 100和客户端系统II 110是两种不同形式的客户端系统,而客户端系统和服务器端系统在功能组成上可以认为都是一种客户机系统。\n[0032] 客户机系统:本发明所述的客户机系统都可以通过数字终端系统来实现,用于执行本发明所述处理过程的应用程序,但并不仅限于此。客户机系统可以是数字终端或是连接到数字终端的终端。一般地,为了实现本发明所述系统,在本发明中所指的数字终端至少需要包括显示装置、音频输入和输出装置、用户输入单元、存储器以及CPU,并且被认为是可以执行能够实现本发明所述系统和系统的应用程序,如网络浏览程序Internet Explorer。\n[0033] 可以理解地,该客户机系统并不仅限于数字终端系统,也可以是手机等其他设备,该领域的技术人员应该能很容易地理解这一点。\n[0034] 客户端系统I 100:客户端系统I代表的是一种访问数字网络140与服务器端系统160进行通信活动的客户端组成方式。它进行通信的目的在于向服务器端系统160请求并接收搜索信息。客户端系统I包括了通过本地网络103连接的组群1和组群2,组群1和组群2同样是两个不同的客户机系统。组群1和组群2可以分布在同一个或不同的本地网络内。组群101、组群102通过本地网络103联结为客户端系统I。\n[0035] 组群:可以是通过个人、部门、子公司、合作伙伴或其他方式进行联合的集合,也可以代表为一个行业,如金融业、制造业。\n[0036] 本地网络103:包括限制在有限地理区域的局域网LAN,以及不受限于有限地理区域的广域网WAN和城域网MAN。\n[0037] 客户端系统II 110:与客户端系统I不同的是,客户端系统II代表的是另一种作为一个可以通过数字网络140与服务器端系统160进行通信活动的客户端形式。客户端系统II代表的是一个单独的客户机系统110。\n[0038] 可以理解地,在另一个实施例中,可能包含客户端系统I和客户端系统II的其中一种或全部客户端系统形式,但客户端系统的组合形式不影响本发明所述系统的实现。\n[0039] 呼叫终端I 120:代表固定电话的呼叫终端形式,如无绳电话、有线电话、视频电话等。\n[0040] 呼叫终端II 130:代表移动电话的呼叫终端形式,如手机、小灵通等。\n[0041] 应该指出的是,利用先进的技术,呼叫终端和客户端系统可以互相实现对方的功能,比如具有上网功能的手机以及装有网络电话系统平台的客户端系统。\n[0042] 数字网络140:有线的或无线的数字网络信息或信号的传输网络,用来传输数字网络的信息。可以理解为但不仅限于局域网LAN、广域网WAN、城域网MAN、虚拟专用网VPN和因特网。客户端系统I、客户端系统II、呼叫终端I、呼叫终端II以及其他网络终端实体可以通过任何一种形式的网络连接到服务器端系统160,但它们不一定是通过同一个网络连接到服务器端系统160上的。\n[0043] 第三方数据源150:可以采用类似于服务器端系统160的一个或多个服务器来实现,它的作用在于查询服务器端系统160之外的可用第三方信息源,如专利数据库,并利用这些信息源提供的相关信息内容通过应用程序170的访问和执行生成关联信息返回给客户端系统I 100、客户端系统II 110、呼叫终端I 120以及呼叫终端II 130。\n[0044] 服务器端系统160:服务器端系统通过一个或多个服务器来实现,可以是数据库服务器161、网络服务器162、应用程序服务器163的其中一个或多个服务器联合,也可以是一个服务器中包含了其中一种或多种服务器的功能。\n[0045] 服务器:用于响应存储在服务器上的计算机程序操作。\n[0046] 数据库服务器161:存储数据库记录180的所有电子信息并执行对数据库记录180的访问。\n[0047] 数据库服务器端系统190:由爬虫端系统I 191、爬虫端系统II 192、爬虫端系统III193组成,爬虫端系统I 191、爬虫端系统II 192、爬虫端系统III193是三个不同的客户机系统,可以是任意数字的客户机系统的组合。在融合搜索模块171中,系统利用网络爬虫(Crawler)也称为“网络蜘蛛”(Spider)或者网络机器人的计算机程序从数字网络140及第三方数据源150中抓取用户搜索的信息,但是由于网络爬虫程序的工作量很大,所以还需要分布式爬虫来支持整个数据的完整和高效性,即需要一定数量的爬虫端系统来完成数据的分布抓取和分布上传。\n[0048] 爬虫端系统:是一种模拟浏览器工作的客户机系统,用于执行数据爬取任务,并将爬取得到的数据和信息上传到数据库服务器的中央数据库。\n[0049] 数据库记录180:存储与服务器端系统160有关的所有用户或客户机系统的各种信息内容和数据,如索引181、搜索结果182、用户学习模型183。这些信息内容和数据包括图3-1、图3-2和图3-3所示出的示例性实施例的数据库记录所包含的字段。\n[0050] 图3-1说明了索引181结构的一个示例,它包含了多个字段。索引181包含的数据有:关键词311、出现关键词的文章编号312、出现次数313、出现频率314。和一般的索引不同的是,本发明为所有数据源中的数据建立了反向索引,方便查询数据库以及提高查询效率。关键词311是指能够代表某篇文章或某条信息核心含义的词语,一条信息可能包含多个关键词,关键词是用户用来搜索信息的依据,也是服务器端系统160从数字网络140和第三方数据源150种搜索信息的依据。出现关键词的文章编号312是指出现某个特定关键词的某些文章的编号,如页码、章节等等,表示的是关键词出现的位置,服务器端系统160通过这个对应关系查找和储存搜索到的信息。出现次数313表示的是服务器端系统160从数字网络140和第三方数据源150种搜索信息时,特定关键词在搜索过程中出现的次数总合。出现频率314是指服务器端系统160从数字网络140和第三方数据源150种搜索信息时,特定关键词在一定的时间段内出现的次数。系统根据关键词出现的次数和频率对搜索得到的信息进行排序,出现次数越多、频率越高的搜索结果,排列越靠前。\n[0051] 图3-2说明了搜索结果182结构的一个示例,它包含了多个字段。本发明所指的搜索结果是指用户从系统返回的信息中采集到系统平台中的用户需要的结果信息。搜索结果182由搜索结果编号321、搜索结果内容322构成。搜索结果编号321是该搜索结果唯一编号,用于和用户学习模型进行关联。搜索结果内容322根据信息类别不同而变化,如人物类别的搜索结果中包含姓名、年龄、出生年月、联系方式、负责项目、掌握的技术等信息,技术类别的搜索结果中包含发明人、技术背景、所属公司/机构、技术先进性等信息。\n[0052] 图3-3说明了用户学习模型183结构的一个示例,它包含了多个字段。用户学习模型183包含的数据有:用户编号331、用户名332、其他注册信息333、历史搜索信息334、历史搜索结果335以及历史采集的信息源336。用户编号331代表的是该用户信息存储在数据库中的唯一编号,便于服务器端系统160对用户学习模型的更新和调用。用户名332是用户登陆该系统的身份验证资料。其他注册信息333是用户在注册或设置为系统注册用户时除了用户名332之外的其他信息,如登陆密码、所属行业、公司名称等。历史搜索信息\n334是用户注册之后进行搜索的关键词句和搜索结果的集合,服务器端系统160利用历史搜索信息334来进行用户行为学习。历史搜索结果335是用户在系统搜索得到的信息中进行挑选并采集到系统平台中的信息。历史采集的信息源336是用户注册为系统用户之后,自行设置的信息源,如某个第三方数据库或网站,系统纪录这些用户设置过的采集点,并作为用户行为学习的依据。\n[0053] 下面再回到图1。\n[0054] 网络服务器162:与像客户端系统I 100、客户端系统II 110、呼叫终端I 120以及呼叫终端II 130这样的客户端系统进行通信,如向客户端系统I 100、客户端系统II \n110、呼叫终端I 120以及呼叫终端II 130发送信息、接收信息,并执行相关联的任务。\n[0055] 应用程序服务器163:根据示例性实施例,应用程序服务器存储、执行诸如应用程序170的计算机程序。\n[0056] 应用程序170:在本说明中,把能够实现本发明所述系统的一种或多种计算机程序统称为应用程序,当然,应用程序中的某些处理可以通过客户端系统I 100、客户端系统II 110、呼叫终端I 120以及呼叫终端II 130来实现。应用程序170包括了以下几个主要模块:融合搜索模块171、用户行为学习模块172、报表导出模块173、呼叫中心模块174以及后台管理模块175。\n[0057] 融合搜索模块171:融合搜索模块是指这样一个应用程序,用户输入关键词句后,系统能够对用户输入的关键词句进行中文分词(在本系统中,采用混合分词的模式来进行中文分词,利用专业词典、普通分词、停词进行联合分词,从而完成正确的分词),把用户输入的关键词句通过各种分词方法来切分成不同的词汇,然后启动网络爬虫程序,从数字网络140和第三方数据源150的各个非结构化网页和结构化网站中爬取关键词句相关的数据,并对数据进行智能分析,去除重复的内容和不需要的信息后,将索引文件181写入数据库服务器161,在对信息进行重排后返回给用户浏览,用户可以对页面上的任意词进行勾选,放入搜索任务,系统就能够对用户选择的关键词句进行再次深化搜索,用户也可以将需要的信息采集到系统平台中,采集的信息存入搜索结果182中,同时更新用户学习模型\n183。\n[0058] 用户行为学习模块172:用户行为学习模块的数据依据是用户学习模型183,用户在搜索信息的过程中,系统自动记录用户搜索过的关键词句、这些关键词句相关的信息以及采集过的搜索结果,同时对用户采集的信息源的设置也进行跟踪记录,仅过机器学习分析后得知用户的搜索习惯和感兴趣的主题,从而使得在搜索的过程中,系统能根据用户学习模型主动将用户可能感兴趣的信息内容推送到用户面前。\n[0059] 报表导出模块173:报表导出模块是指系统能够为用户曾经搜索过的关键词提供报表功能,并能利用知识挖掘功能对搜索结果进行分析,得出初步的报告,用户可以利用该模块将需要的信息和报告导出为html或word格式,方便用户日后脱机浏览。\n[0060] 呼叫中心模块174:在搜索结果182中,很多信息都涉及了可以进行通讯的联系方式,如固定电话号码和手机号码,用户通过客户端系统I 100、客户端系统II 110、呼叫终端I 120以及呼叫终端II 130的用户输入装置,如鼠标、键盘,向系统请求与搜索结果中的某个机构或个人进行通讯,系统启动呼叫中心模块,将该用户与这个机构的固定电话终端或网络电话终端接通,用户利用音频输入输出装置,如耳机和麦克风就可以即时地向感兴趣的机构或个人联系,而被呼叫的公司人员也可以利用固定电话机、手机或者是耳机和麦克风回答。这样,用户不需要在有疑问时,利用固定电话等通讯设备呼叫对方,而是直接在网上完成咨询。VOIP信令方面采用SIP协议信令,语音流采用RTP流,多种语音格式选择。\n信令以及流媒体都采用有效加密。呼叫记录由系统自动保存。\n[0061] 后台管理模块175:用户利用后台管理模块可以对用户进行管理,如修改用户信息;可以维护和管理融合搜索模块171中的信息源,包括搜索接口地址、搜索页数以及搜索引擎名称;也可以对数据进行整理,管理计算信息;为了为用户提供方便的搜索接口和服务,在后台管理模块里能简单的配置多个搜索引擎,提供多搜索引擎服务,并能灵活的配置多个主题,每个主题有不同的关键词库,当用户在索引文件的时候,用户能够从关键词库里提取某些特定关键词的索引数据和索引度,方便用户能够更精准的找到需要的数据。\n[0062] 应当理解,图1只是为了更清楚地说明本发明而示出其中一种示范系统,但并不代表本发明就局限于此范围。\n[0063] 下面来看图2。图2示出示例性实施例的处理过程。其中图中的虚线部分是系统后台执行的步骤或是用户不可见的步骤。\n[0064] 首先用户执行步骤210通过网络登陆到系统平台,由于该平台只能通过注册登陆,所以登陆到系统平台的用户一律默认为注册用户。\n[0065] 然后,步骤211中,用户在搜索语句输入框中输入需要搜索的关键词或语句,并点击搜索按钮,通过执行步骤212来搜索需要的信息,系统自动执行步骤213,判断该用户是否搜索过相关的信息,如果该逻辑判断结果为“是”,即该用户曾经搜索过相关的信息,则系统执行步骤214,调用索引文件以及索引对应的搜索结果,并执行步骤215,更新用户学习模型并将索引对应的搜索结果返回给用户,即步骤220;如果用户没有通过该系统搜索过相关的信息,则系统执行步骤216,为该用户建立用户学习模型的索引,并执行步骤217,通过联合搜索方法,将全网以及第三方数据库中的相关信息,通过去重、整合,返回给用户,并同时执行步骤218,更新索引文件。\n[0066] 接着,用户浏览系统返回的搜索结果,并可以选取网页中的关键词,并进行关键词的追踪搜索,即步骤230,随之,系统执行步骤217及后续步骤以及步骤215,将用户需要的信息通过联合搜索返回给用户,并据此更新用户学习模型。\n[0067] 可以替代地,用户可以选中搜索结果中的通信信息,如手机号码,通过执行步骤\n240,即时呼叫对方,以取得第一时间的沟通,并启发步骤215,更新用户的学习模型。\n[0068] 可以替代地,用户可以将搜索结果中需要的部分,通过拖拽的形式,添加到报告的资源管理器中,即步骤250,用户可以自主选择步骤251,将报告导出为doc格式或者步骤\n252,将报告导出为html格式,与此同时,系统执行步骤215,更新用户的学习模型。\n[0069] 可以替代地,用户可以选中需要的信息,并将该信息添加到监测的信息源中,即步骤260,系统自动执行步骤261,判断该信息源中是否发生了更新,如果受到监测的信息源中有更新,则系统执行步骤262和步骤263,即发送提醒邮件给用户并在用户登录系统时提醒用户浏览已经更新的信息,当用户浏览过提示浏览的信息后,系统执行步骤215,更新用户的学习模型。\n[0070] 当然,可以很容易地看出,该流程并非一定按照如上所述的顺序进行,而是一个不断循环反复的过程,步骤顺序的不同并不影响实现本发明说书的系统,因此本发明也不受限于该示例性实施例所画出的流程图。\n[0071] 下面来看图4-1、图4-2、图4-3、图4-4,这四张图分别展示的是一个实施例中的四个主要步骤的页面截图:用户主界面截图、信息采集用户界面截图、深度循环垂直搜索和呼叫中心用户界面截图以及报告导出用户界面截图。\n[0072] 图4-1示出示例性实施例创建和生成的用户主界面的截图。用户主界面410主要包括以下内容:资源管理器411、搜索词句输入框412、搜索按钮413、搜索结果414以及信息监听窗口415。其中资源管理器411类似于windows操作系统下的资源管理器,用以列出用户已经采集过的搜索结果的数据构成以及各个主题的对应内容,并包括了后台管理、报告导出等功能模块。搜索词句输入框412中,用户通过输入需要查询的关键词句,并点击搜索按钮413,服务器端系统160从数字网络140及第三方数据源150中搜索相关的信息,并启动用户行为学习模块172,将符合用户要求的搜索结果返回给用户浏览。搜索结果414是系统返回给用户的信息,其中包括搜索结果名称,概述以及链接地址等信息,用户可以对每一条搜索结果进行点击展开,从而得到详细的搜索结果全文。信息监听窗口415能够监测到用户采集的信息中发生更新和变化的部分,并将这些信息抓取出来推送给用户,方便用户第一时间浏览,掌握信息动态,信息监听窗口同时也能够根据用户学习模型183的学习结论,将用户可能需要的、感兴趣的信息主动抓取并推送给用户浏览。\n[0073] 图4-2示出示例性实施例创建和生成的信息采集的用户界面截图。信息采集用户界面420包括以下内容:资源管理器421、信息全文423、添加监听信息点422。其中,资源管理器421和图4-1用户主界面截图中的资源管理器411功能相同,类似于windows操作系统下的资源管理器,用以列出用户已经采集过的搜索结果的数据构成以及各个主题的对应内容,并包括了后台管理、报告导出等功能模块。信息全文423是用户点击搜索结果名称后展开的完整信息资料,用户可以通过信息全文423的浏览了解详情。添加监听信息点422是指用户可以对信息点进行选择,并在右键菜单的添加监听点功能将该信息点收入到系统的自动监测的信息点列表中,以便在信息更新或发生变化时,及时捕捉动态,并在第一时间提醒用户信息点的变化。\n[0074] 图4-3示出示例性实施例创建和生成的深度循环垂直搜索和呼叫中心用户界面截图。深度循环垂直搜索和呼叫中心用户界面430主要包括三个内容:追踪按钮431、深度循环垂直搜索433和呼叫中心窗口432。其中追踪按钮431是指用户如果对搜索结果中某个信息点感兴趣并想了解更详细的内容,可以在搜索结果中选取信息点文字,并鼠标右键点击,选取追踪功能选项,即可对选取得信息点进行深度循环垂直搜索,无需在搜索词句输入框中输入关键词,系统自动汇总统计搜索结果里的词汇,统计词频,并对选取得信息点文字进行分词,把词频最高的词汇与选取词汇组成几个向量,代表着下一次搜索的几个方向,供用户选择,并可以和第三方数据源150中的相关数据进行匹配,当用户找到某个方向却是最贴近他的意图,用户就点击“依此追踪”按钮,让系统按照这个方向所代表的向量对全网和线下的知识库内的信息向量进行匹配,从而把更精准的信息返回给用户浏览。而在很多搜索结果和信息中,都包含了如手机号码和固定电话号码的联系方式,系统监测到这些联系方式,并自动转化为可以进行网络呼叫的形式,用户点击联系方式,系统自动弹出呼叫中心窗口432,用户点击呼叫按钮就可以和对方的通讯终端进行连接,并进行语音沟通。\n[0075] 图4-4示出示例性实施例创建和生成的报告导出用户界面截图。报告导出用户界面440包括以下内容:基础分析报告443、doc格式导出按钮441、html格式导出按钮442。\n其中,基础分析报告443是系统根据用户采集的搜索结果根据知识挖掘功能分析形成的基础报告,如技术发展趋势等等。用户点击doc格式导出按钮441即可将系统得出的基础分析报告443导出为word文档。而用户点击html格式导出按钮442即可将系统得出的基础分析报告443导出为网页形式的文件,方便用户脱机浏览。\n[0076] 以上通过对参考附图的详细说明,该领域的技术人员能很容易地了解本发明所述系统的实现原理和机制,参考附图的绘制只是为了更好地说明本发明的方法、系统和计算机程序,而不是规定保护的范围,本发明的保护范围由所附权利要求书界定。除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。
法律信息
- 2019-07-19
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 200810063295.1
申请日: 2008.07.30
授权公告日: 2011.06.15
- 2011-06-15
- 2009-02-25
- 2008-12-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |