著录项信息
专利名称 | 用于呈现基于知识的信息的方法和信息操纵系统 |
申请号 | CN201410469765.X | 申请日期 | 2014-09-15 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2015-03-25 | 公开/公告号 | CN104462056A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/27 | IPC分类号 | G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 国际商业机器公司 | 申请人地址 | 美国纽约阿芒克
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 国际商业机器公司 | 当前权利人 | 国际商业机器公司 |
发明人 | D·K·比荣;K·库马穆拉;A·皮科维斯基;T·文克勒 |
代理机构 | 北京市金杜律师事务所 | 代理人 | 酆迅;陈颖 |
摘要
本发明涉及一种基于深度文档分析的主动知识指导的技术。提供一种用于信息操纵系统呈现基于知识的信息的方式。在该方式中,对文档执行语义分析而该分析产生各种语义内容集合。语义内容集合中的每个语义内容集合对应于文档中的区域。使用可视指示符来可视地高亮文档的区域,这些可视指示符示出语义内容集合经由用户界面对用户的可用性。响应于用户选择、比如使用用户界面的选择或者用户指定的配置设置,使用该界面向用户显示选择的语义内容集合。
1.一种在包括处理器和存储器的信息操纵系统中的用于呈现基于知识的信息的方法,所述方法包括:
由所述信息操纵系统对选择的文档执行语义分析,所述分析产生一个或者多个语义内容集合,其中所述一个或多个语义内容集合中的每个语义内容集合对应于所述选择的文档的区域,所述一个或多个语义内容集合中的至少一个包括外部语义内容;
针对选择的语义内容集合,选择可视指示符,所述可视指示符用来可视地指示所述选择的文档的对应区域,所述可视指示符示出所述选择的语义内容集合的可用性和类型,其中选择可视指示符包括:
标识所述选择的语义内容集合的类型;
取回用户配置设置,其中用户配置设置标识用于所述选择的语义内容集合的类型的可视指示符;
在正在显示所述选择的语义内容集合的用户界面接收来自所述用户的数据改变;以及基于所述接收的数据改变来更新包括所述语义内容集合的知识库。
2.根据权利要求1所述的方法,其中所述可视指示符选自于包括如下的组:在所述选择的文档的对应区域上显示高亮、在所述对应区域邻近显示叠加、在所述对应区域邻近显示注释、在所述对应区域邻近显示信息气泡、在所述对应区域邻近显示标记、在所述对应区域邻近显示一显示层、在所述对应区域邻近显示跨接符以及在所述对应区域邻近显示可选择图标。
3.根据权利要求1所述的方法,其中所述语义内容的所述类型选自于包括如下的组:用于图表或者表的附加信息、比文档内容更新的信息、链接到所述选择的文档的所述区域的语义内容、与所述选择的文档的所述区域有关的语义内容、和形成功能块的有关语义内容。
4.根据权利要求1所述的方法,其中所述方法还包括:
基于标识的可视指示符自动在所述选择的文档的对应区域邻近显示所述语义内容集合以取代在所述用户界面接收用户请求,其中所述标识的可视指示符选自于包括信息气泡、显示层和跨接符的组。
5.根据权利要求1所述的方法,还包括:
向问答(QA)系统发送对于所述语义分析的请求,其中所述执行所述语义分析包括接收来自知识管理器的所述语义分析。
6.一种信息操纵系统,包括:
一个或者多个处理器;
耦合到所述处理器中的至少一个处理器的存储器;
显示器;以及
指令集,存储于所述存储器中并且由所述处理器中的至少一个处理器执行以呈现基于知识的信息,其中所述指令集执行以下动作:
对选择的文档执行语义分析,所述分析产生一个或者多个语义内容集合,其中所述语义内容集合中的每个语义内容集合对应于所述选择的文档的区域,所述一个或多个语义内容集合中的至少一个包括外部语义内容;
针对选择的语义内容集合,选择可视指示符,所述可视指示符用来可视地指示所述选择的文档的对应区域,所述可视指示符示出所述选择的语义内容集合的可用性和类型,其中选择可视指示符包括:
标识所述选择的语义内容集合的类型;
取回用户配置设置,其中用户配置设置标识用于所述选择的语义内容集合的类型的可视指示符;
在正在显示所述选择的语义内容集合的用户界面接收来自所述用户的数据改变;以及基于所述接收的数据改变来更新包括所述语义内容集合的知识库。
7.根据权利要求6所述的信息操纵系统,其中所述可视指示符选自于包括如下的组:在所述选择的文档的对应区域上显示高亮、在所述对应区域邻近显示叠加、在所述对应区域邻近显示注释、在所述对应区域邻近显示信息气泡、在所述对应区域邻近显示标记、在所述对应区域邻近显示一显示层、在所述对应区域邻近显示跨接符以及在所述对应区域邻近显示可选择图标。
8.根据权利要求6所述的信息操纵系统,其中所述语义内容的所述类型选自于包括如下的组:用于图表或者表的附加信息、比文档内容更新的信息、链接到所述选择的文档的所述区域的语义内容、与所述选择的文档的所述区域有关的语义内容、和形成功能块的有关语义内容。
9.根据权利要求8所述的信息操纵系统,其中所述动作还包括:
将所述语义内容集合之一标识为对所述选择的文档的一部分的更新信息,其中在所述选择的文档的所述一部分邻近显示的所述可视指示符指示所述更新信息比所述文档的所述一部分更新。
10.根据权利要求9所述的信息操纵系统,其中所述动作还包括:
基于标识的可视指示符自动在所述选择的文档的对应区域邻近显示所述语义内容集合以取代在所述用户界面接收用户请求,其中所述标识的可视指示符选自于包括信息气泡、显示层和跨接符的组。
11.根据权利要求6所述的信息操纵系统,其中所述动作还包括:
向问答(QA)系统发送对于所述语义分析的请求,其中所述执行所述语义分析包括接收来自知识管理器的所述语义分析。
用于呈现基于知识的信息的方法和信息操纵系统\n技术领域\n[0001] 本申请主要地涉及一种改进的数据处理装置和方法并且更具体地涉及用于通过对文档执行深度文档分析、然后使用各种用户界面技术以向文档的查看者提供与正在查看的文档有关的语义内容的主动知识指导来向用户提供指导的机制。\n背景技术\n[0002] 随着计算网络、比如因特网的使用增加,人们当前被来自各种结构化和非结构化来源的可用于他们的信息量淹没和压倒。然而信息缺口在用户试图拼凑他们可以在搜寻关于各种主题的信息期间找到他们认为相关的信息时大量存在。为了辅助这样的搜索,新近研究已经涉及生成可以取得输入、分析它并且返回指示对该输入的最可能结果的知识管理系统。知识管理系统提供用于搜索具有许多内容来源、例如电子文档的知识库的自动化机制并且关于输入来分析它们以确定结果和关于该结果相对于该输入有多么准确的置信度测量。\n[0003] 一种这样的知识管理系统是来自于纽约阿芒克的国际商业机器公司(IBM)的IBM WatsonTM系统。IBM WatsonTM系统是应用于开域问题回答领域的高级自然语言处理、信息检索、知识表示和推理以及机器学习技术。IBM WatsonTM系统是在IBM的用于假设生成、规模证据收集、分析和打分的DeepQATM技术上构建的。DeepQA取得输入问题、分析它、将问题分解成组成部分、基于分解的问题和答案来源的主要搜索的结果生成一个或者多个假设、基于从证据来源的证据检索来执行假设和证据打分、执行一个或者多个假设的合成并且基于训练的模型执行最终合并和排行以与置信度测量一起输出对输入问题的答案。\n[0004] 历史上已经有两种系统——基于结构化数据和基于文档。传统企业用户界面呈现指向链接的结构化数据的界面;因而屏幕和在屏幕之间的导航反映这些对象的模型和内容。这些系统以被设计为最大化信息量和易用性的方式呈现数据。因而明智地选择信息而使信息密度高并且易用性也高。然而这样的传统系统是封闭式系统并且受限于可用的结构化内容。对照而言,基于文档的系统呈现比结构化数据界面更浅的信息密度、但是可以更开放并且也提供对更多信息的访问。传统的基于文档的系统在与它们的结构化数据对等物比较时一般提供较差用户体验。在传统的基于文档的界面中,信息密度一般比用结构化数据界面更低并且易用性也更低。\n发明内容\n[0005] 提供一种用于信息操纵系统呈现基于知识的信息的方式。在该方式中,对文档执行语义分析而该分析产生各种语义内容集合。语义内容集合中的每个语义内容集合对应于文档中的区域。使用可视指示符来可视地高亮文档的区域,这些可视指示符示出语义内容集合经由用户界面对用户的可用性。响应于用户选择、比如使用用户界面的选择或者用户指定的配置设置,使用该界面向用户显示选择的语义内容集合。\n[0006] 前文是发明内容、因此必然包含细节的简化、概括和省略;因而本领域技术人员将认识发明内容仅为举例说明而未旨在于以任何方式限制。如仅由权利要求限定的本发明的其它方面、发明特征和优点将在以下阐述的非限制具体描述中变得清楚。\n附图说明\n[0007] 可以通过参照附图来更好地理解本发明并且使它的许多目的、特征和优点为本领域技术人员所清楚,其中:\n[0008] 图1描绘包括知识管理器的网络环境,该知识管理器利用知识库;\n[0009] 图2是信息操纵系统的处理器和部件、比如图1中所示处理器和部件的框图;\n[0010] 图3是描绘基于深度文档分析提供主动知识知道的知识管理器的部件图;\n[0011] 图4是示出在基于深度文档分析提供主动知识指导时使用的逻辑的流程图的描绘;\n[0012] 图5是示出用来预备用于主动知识指导的文档的逻辑的流程图的描绘;\n[0013] 图6是示出执行的用于显示语义内容的逻辑的流程图的描绘;\n[0014] 图7是示出用来显示具有语义内容的文档的逻辑的流程图的描绘;并且\n[0015] 图8是示出知识管理器执行的用于执行深度自然语言分析的逻辑的流程图的描绘。\n具体实施方式\n[0016] 所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。\n[0017] 可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。\n[0018] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。\n[0019] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。\n[0020] 可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。\n在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。\n[0021] 下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。\n[0022] 也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。\n[0023] 也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。\n[0024] 图1描绘在计算机网络102中的问/答创建(QA)系统100的一个示例实施例的示意图。在通过完全引用而结合于此的第2011/0125734号美国专利申请公开中描述可以结合这里描述的原理使用的问/答生成的示例。知识管理器100可以包括连接到计算机网络102的计算设备104(包括一个或者多个处理器和一个或者多个存储器并且潜在地包括在本领域中一般已知的任何其它计算设备单元、包括总线、存储设备、通信接口等)。网络102可以包括经由一个或者多个有线和/或无线数据通信链路相互通信和与其它设备或者部件通信的多个计算设备104,其中每个通信链路可以包括有线、路由器、交换机、发射机、接收机等中的一项或者多项。知识管理器100和网络102可以实现用于一个或者多个内容用户的问/答(QA)生成功能。知识管理器100的其它实施例可以与除了这里描绘的部件、系统、子系统和/或设备之外的部件、系统、子系统和/或设备使用。\n[0025] 知识管理器100可以被配置为从各种来源接收输入。例如知识管理器100可以从网络102、电子文档106或者其它数据的语料库、内容创建者108、内容用户和其它可能输入来源接收输入。在一个实施例中,可以通过网络102路由向知识管理器100的输入中的一些或者所有输入。在网络102上的各种计算设备104可以包括用于内容创建者和内容用户的接入点。计算设备104中的一些计算设备可以包括用于数据库的设备,该数据库存储数据语料库。网络102可以在各种实施例中包括本地网络连接和远程连接,从而知识管理器100可以在任何大小、包括本地和全局、例如因特网的环境中操作。此外,知识管理器100用作前端系统,该前端系统可以使从文档、网络可访问来源和/或结构化数据来源提取的或者在文档、网络可访问来源和/或结构化数据来源中表示的多种知识可用。以这一方式,一些过程填充知识管理器而知识管理器也包括用于接收知识请求并且相应地做出响应的输入接口。\n[0026] 在一个实施例中,内容创建者创建在文档106中的内容用于作为数据语料库的一部分与知识管理器100一起使用。文档106可以包括用于在知识管理器100中使用的任何文件、文本、文章或者数据源。内容用户可以经由与网络102的网络连接或者因特网连接访问知识管理器100并且可以向知识管理器100输入可以被在数据语料库中的内容回答的问题。\n如以下进一步描述的那样,在过程对于语义内容评估文档的给定的分节时,该过程可以使用多种惯例以从知识管理器查询它。一个惯例是发送形成好的问题。语义内容是如下内容,该内容基于在表示符(signifier)、比如单词、短语、标志和符号之间的关系以及它们代表什么、它们的含义或者内涵。换而言之,语义内容是比如通过使用自然语言(NL)处理来解释表达式的内容。在一个实施例中,该过程向知识管理器发送形成好的问题(例如自然语言问题等)。知识管理器100可以解释问题并且向内容用户提供包含对问题的一个或者多个答案的响应。在一些实施例中,知识管理器100可以在排行的答案列表中向用户提供响应。\n[0027] 在一些示例实施例中,知识管理器100可以是用下文描述的示例实施例的机制扩TM TM\n充的、从纽约阿芒克的国际商业机器公司(IBM)可用的IBM Watson QA系统。IBM Watson知识管理器系统可以接收输入问题,它然后解析该输入问题以提取问题的主要特征,这些主要特征然后又用来制定应用于数据语料库的查询。基于查询应用于数据语料库,通过在数据语料库中寻找数据语料库的如下部分来生成假设或者对输入问题的候选答案的集合,这些部分具有用于包含对输入问题的有价值响应的一些可能性。\n[0028] IBM WatsonTM QA系统然后使用多种推理算法对输入问题的语言和数据语料库的在应用查询期间找到的部分中的每个部分中使用的语言执行深度分析。可能存在应用的数以百计或者甚至数以千计的推理算法,这些推理算法中的每个推理算法执行不同分析、例如比较并且生成分数。例如一些推理算法可以着眼于匹配在输入问题的语言内的词项和同义词与数据语料库的找到的部分。其它推理算法可以着眼于在语言中的时间或者空间特征,而其它推理算法可以评估数据语料库的部分的来源并且评估它的真实性。\n[0029] 从各种推理算法获得的分数基于该推理算法的具体聚焦领域指示潜在响应被输入问题推断的程度。每个所得分数然后按照统计模型被加权。统计模型捕获推理算法在IBM WatsonTM QA系统的训练时段期间建立在用于特定域的两个相似段落之间的推断时表现多么好。统计模型然后可以用来概括IBM WatsonTM QA系统关于潜在响应、即候选答案被问题推断的置信度而具有的置信度水平。可以对于候选答案中的每个候选答案重复这一过程直至IBM WatsonTM QA系统标识明显比其它候选答案显著地更强的候选答案、因此生成用于输入问题的最终答案或者排行的答案集合。可以例如从IBM公司网站IBM Redbooks等获得关于IBM WatsonTM QA系统的更多信息。例如可以在Yuan等人的“Watson and Healthcare,”IBM developerWorks,2011和“The Era of Cognitive Systems:An Inside Look at IBM Watson and How it Works”by Rob High,IBM Redbooks,2012中找到关于IBM WatsonTM QA系统的信息。\n[0030] 可以利用QA系统100的信息操纵系统的类型范围从小型手持设备、比如手持计算机/移动电话110到大型的大型机系统、比如大型机计算机170。手持计算机110的示例包括个人数字助理(PDA)、个人娱乐设备、比如MP3播放器、便携电视和紧致盘播放器。信息操纵系统的其它示例包括笔或者写字板、计算机120、膝上型或者笔记本计算机130、个人计算机系统150和服务器160。如图所示,各种信息操纵系统可以使用计算机网络100来一起联网。\n可以用来互连各种信息操纵系统的计算机网络102的类型包括局域网(LAN)、无线局域网(WLAN)、因特网、公用交换电话网络(PSTN)、其它无线网络和可以用来互连信息操纵系统的任何其它网络拓扑。信息操纵系统中的许多信息操纵系统包括非易失性数据存储库、比如硬驱动和/或非易失性存储器。图1中所示信息操纵系统中的一些信息操纵系统描绘分离非易失性数据存储库(服务器160利用非易失性数据存储库165,并且大型机计算机170利用非易失性数据存储库175)。非易失性数据存储库可以是在各种信息操纵系统外部或者可以在信息操纵系统内部之一内部的部件。在图2中示出信息操纵系统的示例,该示例示出示例处理器和该处理器公共地访问的各种部件。\n[0031] 图2图示信息操纵系统200、更具体为处理器和公共部件,该信息操纵系统是能够执行这里描述的计算操作的计算机系统的简化示例。信息操纵系统200包括耦合到处理器接口总线212的一个或者多个处理器210。处理器接口总线212将处理器210连接到也称为存储器控制器集线器(MCH)的北桥215。北桥215连接到系统存储器220并且提供用于(多个)处理器210访问系统存储器的装置。图形控制器225也连接到北桥215。在一个实施例中,PCI快速(express)总线218将北桥215连接到图形控制器225。图形控制器225连接到显示设备\n230、比如计算机监视器。\n[0032] 北桥215和南桥235使用总线219来相互连接。在一个实施例中,总线是在北桥215与南桥235之间的每个方向上高速度传送数据的直接媒体接口(DMI)总线。在另一实施例中,外围部件互连(PCI)总线连接北桥和南桥。也称为I/O控制器集线器(ICH)的南桥235是主要实现如下能力的芯片,这些能力在比北桥提供的能力更慢的速度操作。南桥235通常提供用来连接各种部件的各种总线。这些总线例如包括PCI和PCI快速总线、ISA总线、系统管理总线(SM总线或者SMB)和/或低管脚计数(LPC)总线。LPC总线经常连接低带宽设备、比如引导ROM 296和“旧式”I/O设备(使用“超级I/O”芯片)。“旧式”I/O设备(298)可以例如包括串行和并行端口、键盘、鼠标和/或软盘控制器。LPC总线也将南桥235连接到信任平台模块(TPM)295。在南桥235中经常包括的其它部件包括直接存储器访问(DMA)控制器、可编程中断控制器(PIC)和使用总线284将南桥235连接到非易失性存储设备285、比如硬盘驱动的存储设备控制器。\n[0033] 扩展卡255是将可热插设备连接到信息操纵系统的槽。扩展卡255在它使用通用串行总线(USB)和PCI快速总线二者来连接到南桥235时支持PCI快速和USB连通二者。南桥235包括向连接到USB的设备提供USB连通的USB控制器240。这些设备包括摄像头(相机)250、红外线(IR)接收器248、键盘和跟踪板244以及提供无线个人区域网络(PAN)的蓝牙设备246。\nUSB控制器240也向其它杂项USB连接设备242、比如鼠标、可拆卸非易失性存储设备245、调制解调器、网卡、ISDN连接器、传真、打印机、USB集线器和许多其它类型的USB连接设备提供USB连通。尽管示出可拆卸非易失性存储设备245为USB连接设备,但是可以使用诸如火线接口等不同接口来连接可拆卸非易失性存储设备245。\n[0034] 无线局域网(LAN)设备275经由PCI或者PCI快速总线272来连接到南桥235。LAN设备275通常实施空中接口调制技术的IEEE 802.21标准之一,这些技术都使用相同协议以在信息操纵系统200与另一计算机系统或者设备之间无线通信。光存储设备290使用串行ATA(SATA)总线288来连接到南桥235。串行ATA适配器和设备通过高速串行链路通信。串行ATA总线也将南桥235连接到其它形式的存储设备、比如硬盘驱动。音频电路装置260、比如声卡经由总线258连接到南桥235。音频电路装置260也提供功能、比如音频线输入和光学数字音频输入端口262、光学数字输出和耳机插孔264、内部扬声器266以及内部麦克风268。以太网控制器270使用总线、比如PCI或者PCI快速总线来连接到南桥235。以太网控制器270将信息操纵系统200连接到计算机网络、比如局域网(LAN)、因特网以及其它公共和私有计算机网络。\n[0035] 尽管图2示出一个信息操纵系统,但是信息操纵系统可以采用许多形式,在图1中示出这些形式中的一些形式。例如信息操纵系统可以采用桌面型、服务器、便携型、膝上型、笔记本或者其它外形的计算机或者数据处理系统。此外,信息操纵系统可以采用其它外形、比如个人数字助理(PDA)、游戏设备、ATM机、便携电话设备、通信设备或者包括处理器和存储器的其它设备。\n[0036] 图3-8描绘可以在信息操纵系统上执行的用于使用知识管理系统、比如图1中所示知识管理器100来基于深度文档分析提供主动文档知识指导的方式。这里描述的方式通过主动地使深度知识可用作交互层或者其它可视指示符来改善在查看文档时的用户体验,该交互层或者其它可视指示符包含通过文档的深度统计分析而找到的附加知识、推断和关联。在一个实施例中,深度语义分析的找到由与语料库预备相似的过程执行。该方式经由多种用户界面技术向用户呈现推断的知识、因此允许用户与可用知识直接交互、在这样显示的知识内导航、过滤掉不想要的知识注释等。以这一方式,表面文本而不是具有超链接的平坦表面变成协作任务空间,其中计算机和人类用户可以相互呈现关于在文档中的主题的全程度知识。系统通过语义分析和用户而可用的知识的程度可以比表面文本提示的程度更广泛和深入。在以下讨论的图3-8和伴随的具体描述中进一步描述以上讨论的方式,这些图和具体描述提供与使用知识管理器来基于深度文档分析提供主动文档知识指导的一个或者多个实施例有关的进一步细节。\n[0037] 图3是描绘基于深度文档分析提供主动知识指导的知识管理器的部件图。知识管理器104对文档325执行语义分析,该语义分析产生一个或者多个语义内容集合350。如先前描述的那样,知识管理器利用作为大规模信息源的知识库106以找到与文档有关的语义内容。各种语义内容集合对应于文档325的不同区域。提供用户界面,从而可以使用多种可视效果或者技术在显示屏幕上向用户可视地示出或者指示各种语义内容集合。用户然后可以使用在显示屏幕上向用户显示的用户界面来查看或者以别的方式与显示的语义内容工作。\n[0038] 各种效果或者指示符可以包括可视技术、比如在文档的对应区域上显示高亮、在文档上显示语义内容的叠加、在语义内容的全部或者部分的文档上显示注释、在语义内容的全部或者部分的文档上显示邻近信息气泡、在文档上显示与文档的对应区域邻近的向用户提醒语义内容的标记、在文档上显示语义内容的显示层;在语义内容的全部或者部分的文档上显示跨接符以及在对应区域附近显示向用户提醒语义内容的可选择图标。可以在相同屏幕或者屏幕的相同区域上叠加或者可以在分离屏幕区域中示出语义内容。\n[0039] 用来向用户提醒语义内容可用的可视指示符可以基于找到的语义内容的类型。一个易于内容类型是与在文档中的图表或者表格对应的附加信息。另一语义内容类型是比在文档中找到的内容更新的内容而可视指示符向用户通知更新信息可用。另一语义内容类型是链接到文档的区域或者与文档的区域有关的内容、比如章节、讨论等。语义内容也包括形成功能块的任何有关语义内容,该功能块可以被体现为实时代码对象以基于用户与文档和/或语义内容的交互动态执行计算。\n[0040] 用户可以浏览财经文档,并且系统将检测可用的更新近信息,并且将主动地显示更新近信息,该信息例如指示在财经文档中的信用评级过期,并且将基于系统标识的更新信息显示新信用评级。深度分析也可以标识在文档中渲染的表格集合,其中已经分析功能签名,从而识别文档为包含官方市政报表。基于该分类,系统自动识别和分析已知功能块。\n注释用于对收入类别进行求和的熟知功能块。该系统还自动高亮收入计算的来源以及其它链接的单元。该系统也可以提供注解或者其它高亮,该注解或者其它高亮指示在后续归档中修改信息。\n[0041] 在另一示例中,用户在该系统提供的搜索字段中录入‘收入来源’。用户正在查看的财务文档未提到收入来源。然而该系统经由深度问题分析和语义对齐来回答用户的问题。以这一方式,该系统对齐‘收入来源’的语义与在用于收入合成的功能块中的收入组成的名称。\n[0042] 在又一示例中,假设用户的光标被定位于具有找到的知识(例如找到的知识是计算的值,并且该系统‘理解’计算和含义;和/或单元是用于某个其它计算的值的来源)的单元之上。在这一示例中该系统提示什么数据影响单元的值和哪些单元依赖于它的值。此外,如果有更新近信息可用(即单元代表用于FY’2011的运营收入并且有用于FY’2013的更新近信息),则该系统可以向用户主动地显示这样的更新的信息。\n[0043] 在更多另一示例中,通过深度文档分析和理解,该系统可以用在法律文档中的关键实体的推导的列表以及添加的导航辅助、比如内容、链、跨文档比较等的表格扩充文档的呈现。使用这一技术,查看文档的个人不受文档的作者创建的信息、摘要和相互关系限制。\n可以向原文中叠加/嵌入后续数据扩充以使文档更少成为被动信息布局并且取而代之更类似于实时软件对象。\n[0044] 在一个实施例中,用户配置设置用来控制在用户界面上示出的语义内容的类型以及用来向用户显示希望的语义内容的可视指示符或者技术。一些可视指示符、比如叠加、显示层等可以示出语义内容而无需进一步用户干预。其它可视指示符可以示出语义内容的部分,并且如果用户希望看见语义内容的更多部分,则用户可以选择可视指示符。例如信息气泡可以示出语义内容的部分,并且如果用户希望查看语义内容的更多部分,则用户简单地选择信息气泡并且显示语义内容(例如作为叠加、在新窗口中等)。其它可视指示符、比如图标可以指示可用语义内容的可用性和/或类型而未显示实际语义内容的许多部分,其中用户选择可视指示符以查看关联语义内容。例如如果用户正在查看公司财务数据并且更新财务数据可用,则可以与财务数据邻近显示向用户提醒更新数据可用的事实的图标。如果用户正在执行历史分析,则他可能已经了解数据更旧。然而如果用户正在执行当前分析,则更新信息的指示可以更令人感兴趣并且允许用户选择可视指示符并且查看更新财务数据。\n[0045] 图4是示出在基于深度文档分析提供主动知识指导时使用的逻辑的流程图的描绘。处理在400始于用户查看或者请求查看文档235。分析将文档分解成使用知识管理器104来分析的各种分节。分节可以是文档的章节、文档的部分、在文档中的段落或者句子、在文档中的表格、图表和数字(figure)或者文档的任何其它组成部分。\n[0046] 在步骤410,该过程选择文档325的第一分节。在步骤420,该过程向知识管理器104发送对于分析文档的选择的分节的请求用于选择的分节的深度语义内容分析。在步骤425,该过程标识在选择的分节中的任何文档间元数据。文档间元数据是与文档的其它分节有关的元数据。例如内容或者索引的表将具有引用文档的其它区域的条目。此外,表格、图形或者数字可以具有位于文档的另一部分中的文本分节,该文本分节向该表格、图形或者数字提供分析或者其它支持。如果希望,则用户可以让文档间元数据用可视指示符来标识,这些可视指示符提供与元数据有关的内容(例如与数字有关的文本分析或者支持的叠加等)。关于该过程是否标识在选择的分节中的任何文档间元数据进行判决(判决430)。如果标识文档间元数据,则判决430转向“是”分支,其中在步骤440,该过程在存储器区域450中保持文档间元数据和分节标识符。在另一方面,如果未标识文档间元数据(或者如果用户的配置设置指示用户不希望看见在用户界面中的文档间内容),则判决430转向绕过步骤440的“否”分支。\n[0047] 在步骤460,该过程接收知识管理器104执行的对文档的选择的分节执行的语义内容分析。关于知识管理器执行的语义内容分析是否标识与文档的选择的分节有关的任何语义内容进行判决(判决470)。如果标识语义内容,则判决470转向“是”分支,其中在步骤475,该过程在存储器区域480中保持语义内容和对应分节标识符。在另一方面,如果知识管理器\n104未标识语义内容(或者如果用户的配置设置指示用户不希望在用户界面中看见这样的语义内容),则判决470转向绕过步骤475的“否”分支。\n[0048] 关于在文档中是否有该过程将分析的更多分节进行判决(判决490)。如果有将分析的更多分节,则判决490转向“是”分支,该分支循环回到如以上描述的那样选择和处理文档的下一分节。这一循环继续直至已经处理文档325的所有分节,在该点,判决490转向“否”分支,其中在预定义的过程495,该过程为用户准备文档(对于处理细节见图5和对应文本)。\n[0049] 图5是示出用来预备用于主动知识指导的文档的逻辑的流程图的描绘。处理始于\n500,其中在步骤505,该过程从数据存储库510取回用户配置设置。用户配置设置具有默认值并且可以被用户更新以指示用于在用户界面上显示的元数据和语义内容的类型以及应当如何在用户界面上向用户呈现这样的数据。\n[0050] 在步骤515,该过程选择文档的第一分节以预备它用于在用户界面上显示。基于用户配置设置关于用户是否希望看见文档内可视指示符进行判决(判决520)。如果用户希望看见文档内可视指示符,则判决520转向“是”分支以处理对于文档的选择的分节而找到的任何文档内元数据。在步骤525,该过程取回与文档的选择的分节有关的任何文档内元数据。该元数据从存储器区域450被取回,并且先前由图4中所示出的处理存储在存储器区域中。关于对于文档的选择的分节是否找到任何文档内元数据进行判决(判决530)。如果对于文档的选择的分节找到文档内元数据,则判决530转向“是”分支,其中在步骤540,在与其中显示文档的选择的分节的显示区域邻近的用户界面上渲染文档内可视指示符。使用的可视指示符是根据用户的配置设置。例如对于内容或者索引条目的表格,用户可以已经设置配置设置以与用户选择的条目邻近显示图标以导航或者“跳转”到在文档中的分节。类似地,用户可以已经设置配置设置以提供用于在文档内的内容的气泡或者叠加,该气泡或者叠加提供与表格、图形或者数字有关的支持或者信息。用户可以读取在气泡或者叠加中的有关内容或者可以选择气泡或者叠加以导航(跳转)到文档的支持分节。回到判决530,如果对于选择的分节未找到文档内元数据,则判决530转向绕过步骤540的“否”分支。也回到判决\n520,如果用户的配置设置指示用户不希望看见文档内可视指示符,则判决520转向绕过步骤520至540的“否”分支。\n[0051] 基于用户配置设置关于用户是否希望看见与文档有关的语义内容进行判决(判决\n550)。如果用户希望看见与文档有关的语义内容,则判决550转向“是”分支以处理知识管理器对于文档的选择的部分而找到的任何语义内容。关于对于文档的选择的分节是否找到任何语义内容进行判决(判决555)。如果知识管理器对于文档的选择的分节找到语义内容,则判决555转向“是”分支,其中在预定义的过程570,该过程根据用户的配置设置显示语义内容(对于处理细节见图6和对应文本)。在另一方面,如果对于文档的选择的分节未找到语义内容,则判决560转向绕过预定义的过程570的“否”分支。回到判决550,如果用户的配置设置指示用户不希望看见与文档有关的语义内容,则判决550转向绕过步骤555至570的“否”分支。\n[0052] 关于在文档中是否有将处理的更多分节进行判决(判决580)。如果有将处理的更多分节,则判决580转向“是”分支,该分支循环回到如以上描述的那样选择和处理文档的下一分节。这一循环继续直至已经处理文档的所有分节,在该点,判决580转向“否”分支,其中在预定义过程590,该过程在用户界面上显示文档用于用户查看和交互(对于处理细节见图\n6和对应文本)。\n[0053] 图6是示出执行的用于显示语义内容的逻辑的流程图的描绘。处理始于600,其中在步骤605,该过程标识被找到语义内容的文档分节类型。在步骤610,该过程基于找到的语义内容类型和文档分节类型标识用于与用户界面使用的显示技术或者可视指示符。从判决\n620到步骤670的随后处理是基于可以作为如果用户未指示可视指示符偏好则使用的默认值而使用的示例用户配置设置。可以基于用户的在用户配置设置中指定的偏好来改变在步骤625、635、645、655和665中使用的可视指示符。此外,用户可以具有偏好,这些偏好指示将在用户界面上禁止(未示出)的特定语义内容类型。\n[0054] 以下是图6中所示用于各种语义内容类型和文档分节类型的示例可视指示符的描述。关于找到的语义内容是否提供与在文档中的图表、数字或者表格有关的附加信息进行判决(判决620)。如果语义内容提供与在文档中的图表、数字或者表格有关的附加信息,则判决620转向“是”分支,其中在步骤625,该过程在文档中的图表/表格/数字中插入控件,该控件在该控件被用户选择时向用户通知附加信息可用。处理然后在695返回到调用例程(见图5)。在另一方面,如果语义内容未提供与在文档中的图表、数字或者表格有关的附加信息,则判决620转向“否”分支用于进一步处理。\n[0055] 关于找到的语义内容是否提供比在文档中找到的信息更新的信息进行判决(判决\n630)。例如在财务报告中,语义内容可以是比在文档中提供的数字更新的新发布的财务数字。如果语义内容提供比在文档中找到的信息更新的信息,则判决630转向“是”分支,其中在步骤635,该过程插入可视指示符提醒、比如图标或者叠加,该可视指示符提醒向用户通知在语义内容中可用的更新内容而该更新的内容经由可视指示符可用。处理然后在695返回到调用例程(见图5)。在另一方面,如果语义内容未提供比在文档中找到的信息更新的信息,则判决630转向“否”分支用于进一步处理。\n[0056] 关于找到的语义内容是否为链接到文档分节的内容进行判决(判决640)。语义内容链接的示例可以是在语义内容中找到的与在文档中找到的文本对应的图表、表格或者数字。如果语义内容是链接到文档分节的内容,则判决640转向“是”分支,其中在步骤645,该过程在文档显示中插入可视指示符链接,该可视指示符链接通知语义内容并且允许用户经由可视指示符导航到或者查看语义内容。处理然后在695返回到调用例程(见图5)。在另一方面,如果语义内容不是链接到文档的内容,则判决640转向“否”分支用于进一步处理。\n[0057] 关于语义内容是否与文档的分节有关进行判决(判决650)。例如与文档的区域相关的有关归档、文章、研究等。如果语义内容与文档的分节有关,则判决650转向“是”分支,其中在步骤655,该过程插入可视指示符提醒、比如高亮或者信息气泡,该可视指示符提醒向用户通知在语义内容中可用的有关信息而有关内容经由可视指示符可用于用户。处理然后在695返回到调用例程(见图5)。在另一方面,如果语义内容未与文档的分节有关,则判决\n650转向“否”分支用于进一步处理。\n[0058] 关于在文档中或者在语义内容中的数据、比如表格和/或数字是否形成功能块进行判决(判决660)。例如知识管理器执行的深度分析可以找到在文档中渲染的表格集合,其中已经分析功能签名,从而识别文档为包含官方市政报表。基于该分类,识别和分析已知功能块。可视指示符可以注释和示出用于收入类别的求和的功能块。如果找到这样的功能块,则判决660转向“是”分支,其中在步骤665,该过程插入基于用户与在文档和/或有关语义内容中包括的数字的交互来执行动态计算的实时代码对象。处理然后在695回到调用例程(见图5)。在另一方面,如果尚未标识功能块,则判决660转向“否”分支用于进一步处理。\n[0059] 在步骤670,如果语义内容未与先前描述的语义内容类型中的任何语义内容类型匹配,则在用户界面中插入可视指示符、比如提示、链接、叠加、气泡、层、标记、跨接符、窗口等以向用户提醒语义内容并且允许用户查看这样的内容。处理然后在695回到调用例程(见图5)。\n[0060] 图7是示出用来显示具有语义内容的文档的逻辑的流程图的描绘。处理始于700,其中在步骤705,该过程从与正在其上显示文档和各种可视指示符的文档用户界面对接的用户接收用户输入。关于用户是否希望退出该过程并且停止使用用户界面来查看文档进行判决(判决710)。如果用户不会退出,则判决710转向“否”分支以处理用户的输入。用户的输入继续如以下描述的那样被处理直至用户的输入是退出该过程,在该点,判决710转向“是”分支并且处理在795结束。\n[0061] 关于用户的输入是否为选择与文档图标、表格或者数字关联的用来显示关于该图表、表格或者数字的附加信息的可视指示符进行判决。如果用户的输入是选择这样的可视指示符,则判决720转向“是”分支,其中在步骤725,该过程显示叠加、层、标记、跨接符或者窗口等,该叠加、层、标记、跨接符或者窗口等显示与图表、表格或者数字有关的附加语义内容。用来显示语义内容的技术是基于用户的配置设置。处理然后循环回到步骤705以接收下一用户输入。在另一方面,如果用户的输入不是选择与文档图表、表格或者数字有关的可视指示符,则判决720转向“否”分支用于进一步处理。\n[0062] 关于用户的输入是否为选择可视指示符进行判决,该可视指示符向用户通知可用于文档的更新内容(判决730)。如果用户的输入是选择向用户通知可用于文档的更新内容的可视指示符,则判决730转向“是”分支,其中在步骤735,该过程显示叠加、层、标记、跨接符或者窗口等,该叠加、层、标记、跨接符或者窗口等显示与文档有关的新语义内容。用来显示更新语义内容的该技术是基于用户的配置设置。处理然后循环回到步骤705以接收下一用户输入。在另一方面,如果用户的输入不是选择向用户通知可用于文档的更新内容的可视指示符,则判决730转向“否”分支用于进一步处理。\n[0063] 关于用户的输入是否为选择指向与文档有关的内容的链接进行判决(判决740)。\n如果用户的输入是选择指向与文档有关的内容的链接,则判决740转向“是”分支,其中关于链接是否指向在文档内的内容或者指向知识管理器标识的外部语义内容进行判决(判决\n745)。如果链接指向文档内元数据,则判决745转向“是”分支,其中在步骤750,文档的正在显示的部分跳转到链接引用的部分(例如索引或者内容表格条目等引用的页面)。在另一方面,如果链接指向知识管理器标识的外部语义内容,则判决745转向“否”分支,其中在步骤\n755,该过程显示叠加、层、标记、跨接符或者窗口等,该叠加、层、标记、跨接符或者窗口等显示与文档的被用户选择的部分有关的语义内容。用来显示语义内容的技术是基于用户的配置设置。处理然后循环回到步骤705以接收下一用户输入。回到判决740,如果用户的输入不是选择指向与文档有关的内容的链接,则判决740转向“否”分支用于进一步处理。\n[0064] 关于用户的输入是否为选择指向知识管理器找到的与文档有关的外部语义内容的链接进行判决(判决760)。如果用户的输入是选择指向知识管理器找到的外部语义内容的链接,则判决760转向“是”分支,其中在步骤765,该过程显示叠加、层、标记、跨接符或者窗口等,该叠加、层、标记、跨接符或者窗口等显示与文档的被用户选择的部分有关的外部语义内容。用来显示语义内容的技术是基于用户的配置设置。处理然后循环回到步骤705以接收下一用户输入。在另一方面,如果用户的输入不是选择指向外部语义内容的链接,则判决760转向“否”分支用于进一步处理。\n[0065] 关于用户的输入是否为选择与在文档中或者在知识管理器找到的语义内容中的功能块有关的实时代码对象进行判决(判决770)。如果用户的选择是选择实时代码对象,则判决770转向“是”分支,其中在步骤775,该过程基于用户的与用户界面和在文档和/或语义内容中找到的数据的一个或者多个功能块的交互动态执行计算。用来显示计算的技术是基于用户的配置设置。处理然后循环回到步骤705以接收下一用户输入。在另一方面,如果用户的输入不是选择实时代码对象,则判决770转向“否”分支用于进一步处理。\n[0066] 关于用户的输入是否为在用户界面中找到的搜索字段中录入问题进行判决(判决\n780)。如果用户的输入是在用户界面中找到的搜索字段中录入问题,则判决780转向“是”分支,其中在预定义过程785,知识管理器基于用户的问题执行深度自然语言(NL)分析(对于处理细节见图8和对应文本)。处理然后回到步骤705以接收下一用户输入。在另一方面,如果用户的输入不是在搜索字段中录入问题,则判决770转向“否”分支,其中在步骤790,处理某个其它类型的用户输入、比如编辑用户的配置设置或者更新在知识库106中的文档或者关联等。更新知识库106可以依赖于在知识管理器与用户之间正在交换的知识。在公司评级改变的情况下,用户(例如财务分析师等)可以供应关于改变原因的附加信息。任何种类的输入技术可以这里用来更新知识管理器。可以在步骤790收集并且向知识管理器发送文本、添加的链接等的输入用于向知识库106更新。例如在法律设置中,系统可以取回相关案例,并且人类用户可以去除或者重新评级呈现的案例。处理然后循环回到步骤705以接收下一用户输入。\n[0067] 图8是示出知识管理器执行的用于服务于对于语义内容的请求的逻辑的流程图的描绘。在一个实施例中,该处理始于800,其中在步骤810,该过程在用户界面的录入字段接收用户输入的自然语言问题。在步骤820,该过程向知识管理器104发送自然语言问题用于利用扩展知识库106的深度语义分析。注意知识库106包括文档和其它内容的大规模阵列并且也包括文档内容325以及知识管理器在预备文档用于显示时先前标识的语义内容480。\n[0068] 在步骤830,该过程从知识管理器104接收响应。该响应可以是对自然语言问题的答案并且可以提供在文档325中找到的内容(例如语义内容等)、先前标识的语义内容480或者在知识库106内找到的其它内容。在步骤840,在用户界面上向用户显示接收的答案和/或从知识管理器接收的内容。用来显示答案和/或内容的技术基于用户的配置设置。处理随后在895返回到调用历程(见图7)。\n[0069] 附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。\n[0070] 尽管已经示出和描述本发明的具体实施例,但是本领域技术人员将清楚,基于这里的教导可以进行改变和修改而未脱离本发明和它的更广义方面。因此,所附权利要求将在它们的范围内包含如在本发明的真实精神实质和范围内的所有这样的改变和修改。另外也将理解本发明仅由所附权利要求限定。本领域技术人员将理解,如果旨在于引入的权利要求要素的具体数目,则将在权利要求中明确记载这样的意图,并且在无这样的记载时无这样的限制存在。对于非限制例子,作为辅助理解,所附权利要求包含使用引导短语“至少一个”和“一个或者多个”以引入权利要求要素。然而不应理解使用这样的短语意味着不定冠词“一个/一种”引入权利要求要素使包含这样的引入的权利要求要素的任何特定权利要求限于包含仅一个这样的要素的发明、即使在相同权利要求包括引导短语“一个或者多个”或者“至少一个”和不定冠词、比如“一个/一种”;这对于在权利要求中使用定冠词同样成立。
法律信息
- 2018-02-09
- 2015-04-22
实质审查的生效
IPC(主分类): G06F 17/27
专利申请号: 201410469765.X
申请日: 2014.09.15
- 2015-03-25
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-06-01
|
2010-11-26
| | |
2
| |
2011-09-28
|
2010-03-24
| | |
3
| |
2007-07-25
|
2007-01-24
| | |
4
| |
2011-04-20
|
2009-09-22
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |