著录项信息
专利名称 | 基于本体的自动自助式用户支持 |
申请号 | CN201280024761.X | 申请日期 | 2012-05-17 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2014-01-29 | 公开/公告号 | CN103548023A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
|
申请人 | 国际商业机器公司 | 申请人地址 | 美国纽约
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 国际商业机器公司 | 当前权利人 | 国际商业机器公司 |
发明人 | P·C·伯伊勒;H·贾瓦赫里;E·I·罗饶;P·A·亚马莫托 |
代理机构 | 北京市中咨律师事务所 | 代理人 | 于静;张亚非 |
摘要
本发明的实施例涉及基于关于特定领域信息的本体的分析的自助式用户支持应用程序。一示例性实施例涉及一种用于响应于用户查询提供信息的系统,该系统可包含:自然语言分析器,其用于识别来自该用户查询的相关术语;及本体分析器,其用于使所述相关术语相匹配于与该用户查询相关的信息的本体中的概念。该系统可包括:查询处理器,其用于基于所述匹配的查询术语及本体概念细化该用户查询;及搜寻引擎,其用于自可用存放库识别与该用户查询有关的信息。
1.一种用于提供与用户查询相关的信息的系统,其包含:
自然语言处理器,其用于:
接收来自用户的用户查询,所述接收的用户查询是以自由文本格式表示的;
执行自然语言分析以生成与所接收的用户查询相关的子串;
本体分析器,其用于在所述自然语言处理器执行自然语言分析之后,执行本体分析,以输出特定领域信息的本体的术语,并进一步输出成对的所述术语之间的关系,所述输出的术语被限制为匹配由所述执行自然语言分析生成的相关子串;
查询处理器,其用于:
在所述本体分析器执行本体分析之后,执行查询分析以根据所述输出的术语和术语之间的关系分析所述用户查询,所述执行查询分析包括确定所述用户查询是否更适合于服务而非信息搜寻;
如果所述确定确定所述用户查询更适合于服务而非信息搜寻,则向用户识别将由用户执行的服务动作;
如果所述确定确定所述用户查询并非更适合于服务而非信息搜寻,则基于所述输出的术语和术语之间的关系细化所述用户查询,基于细化的用户查询生成搜索查询;
搜寻引擎,其用于基于所述搜索查询启动搜索,并将所述搜索的结果提供给用户。
2.如权利要求1所述的系统,其中所述确定确定所述用户查询更适合于服务而非信息搜寻。
3.如权利要求1所述的系统,其中所述确定确定所述用户查询并非更适合于服务而非信息搜寻。
4.如权利要求3所述的系统,其中,所述查询处理器还用于,在所述确定之前:
在基于所述输出的术语和术语之间的关系细化用户查询之后,确定所述输出的术语和术语之间的关系不够特定以实现对所述用户查询中的所请求信息的搜寻;
向用户呈现与不够特定的所述输出的术语和术语之间的关系有关的问题;
从用户接收响应于所述呈现的问题的有关所述输出的术语和术语之间的关系的特定性的澄清;以及
基于所接收的澄清,修改所述用户查询,以使得细化的查询足够具体以实现对所述细化的用户查询中的所请求信息的搜寻,其中所述细化用户查询包括细化修改的用户查询。
5.如权利要求3所述的系统,其中,所述查询处理器还用于,在所述确定之前:
确定由于所述用户查询不包括使得与所述用户查询相关的领域的专家能够对用户查询中对信息的请求做出响应的足够信息,所述用户查询不够完整;
向用户呈现与不够完整的所述用户查询有关的问题;
从用户接收响应于所述呈现的问题的所述用户查询中缺失的信息;以及基于所接收的缺失的信息,修改所述用户查询,以使所述用户查询足够完整,从而使得领域的专家能够对用户查询中对信息的请求做出响应,其中所述细化用户查询包括细化修改的用户查询。
6.如权利要求1所述的系统,其中,所述本体由包含节点和连接节点的边的树来表示,其中每个节点与本体的术语相关联,从而树的节点包括与相关子串匹配的所述输出的术语,且其中连接相邻节点的每个边表示所述相邻节点分别关联的术语之间的关系。
7.如权利要求1所述的系统,其中,所述执行本体分析包括:
识别与所述生成的子串中的所选子串匹配的所述本体的多个术语;
响应于所述识别多个术语,向用户呈现问题,以帮助用户从所述多个术语中选择术语;
在所述向用户呈现问题之后,从用户接收所述多个术语中与所选子串最匹配的所选术语。
8.如权利要求1所述的系统,其中,所述执行本体分析包括用所述输出的术语中的术语注释所述生成的子串中的子串。
9.如权利要求1所述的系统,其中,所述执行自然语言分析包括将语言学类别划分给所述用户查询的不同词,其中每个语言学类别特定于每个语言学类别被划分给的词,且其中通过执行自然语言分析生成子串包括利用划分给用户查询的不同词的语言学类别。
10.如权利要求9所述的系统,其中被划分给第一、第二和第三词的语言学类别分别是名词、动词和形容词。
11.如权利要求1所述的系统,其中,所述执行自然语言分析包括执行构词分析以确定包括引理的单个词,所述引理特定于所述用户查询的多个词中的每个词,且其中所述生成的子串包括特定于所述用户查询的多个词中的每个词的引理。
12.一种用于提供与用户查询相关的信息的计算机实施方法,该方法包含:
接收来自用户的用户查询,所述接收的用户查询是以自由文本格式表示的;
执行自然语言分析以生成与所接收的用户查询相关的子串;
在所述执行自然语言分析之后,执行本体分析,以输出特定领域信息的本体的术语,并进一步输出成对的所述术语之间的关系,所述输出的术语被限制为匹配由所述执行自然语言分析生成的相关子串;
在所述执行本体分析之后,执行查询分析,以根据所述输出的术语和术语之间的关系分析所述用户查询,所述执行查询分析包括确定所述用户查询是否更适合于服务而非信息搜寻;
如果所述确定确定所述用户查询更适合于服务而非信息搜寻,则向用户识别将由用户执行的服务动作;
如果所述确定确定所述用户查询并非更适合于服务而非信息搜寻,则基于所述输出的术语和术语之间的关系细化所述用户查询,基于细化的用户查询生成搜索查询;
基于所述搜索查询启动搜索,并将所述搜索的结果提供给用户。
13.如权利要求12所述的方法,其中所述确定确定所述用户查询更适合于服务而非信息搜寻。
14.如权利要求12所述的方法,其中所述确定确定所述用户查询并非更适合于服务而非信息搜寻。
15.如权利要求14所述的方法,其中,所述执行查询分析包括,在所述确定之前:
在基于所述输出的术语和术语之间的关系细化用户查询之后,确定所述输出的术语和术语之间的关系不够特定以实现对所述用户查询中的所请求信息的搜寻;
向用户呈现与不够特定的所述输出的术语和术语之间的关系有关的问题;
从用户接收响应于所述呈现的问题的有关所述输出的术语和术语之间的关系的特定性的澄清;以及
基于所接收的澄清,修改所述用户查询,以使得细化的查询足够具体以实现对所述细化的用户查询中的所请求信息的搜寻,其中所述细化用户查询包括细化修改的用户查询。
16.如权利要求14所述的方法,其中,所述执行查询分析包括,在所述确定之前:
确定由于所述用户查询不包括使得与所述用户查询相关的领域的专家能够对用户查询中对信息的请求做出响应的足够信息,所述用户查询不够完整;
向用户呈现与不够完整的所述用户查询有关的问题;
从用户接收响应于所述呈现的问题的所述用户查询中缺失的信息;以及基于所接收的缺失的信息,修改所述用户查询,以使所述用户查询足够完整,从而使得领域的专家能够对用户查询中对信息的请求做出响应,其中所述细化用户查询包括细化修改的用户查询。
17.如权利要求12所述的方法,其中,所述本体由包含节点和连接节点的边的树来表示,其中每个节点与本体的术语相关联,从而树的节点包括与相关子串匹配的所述输出的术语,且其中连接相邻节点的每个边表示所述相邻节点分别关联的术语之间的关系。
18.如权利要求12所述的方法,其中,所述执行本体分析包括:
识别与所述生成的子串中的所选子串匹配的所述本体的多个术语;
响应于所述识别多个术语,向用户呈现问题,以帮助用户从所述多个术语中选择术语;
在所述向用户呈现问题之后,从用户接收所述多个术语中与所选子串最匹配的所选术语。
19.如权利要求12所述的方法,其中,所述执行本体分析包括用所述输出的术语中的术语注释所述生成的子串中的子串。
20.如权利要求12所述的方法,其中,所述执行自然语言分析包括将语言学类别划分给所述用户查询的不同词,其中每个语言学类别特定于每个语言学类别被划分给的词,且其中通过执行自然语言分析生成子串包括利用划分给用户查询的不同词的语言学类别。
21.如权利要求20所述的方法,其中被划分给第一、第二和第三词的语言学类别分别是名词、动词和形容词。
22.如权利要求12所述的方法,其中,所述执行自然语言分析包括执行构词分析以确定包括引理的单个词,所述引理特定于所述用户查询的多个词中的每个词,且其中所述生成的子串包括特定于所述用户查询的多个词中的每个词的引理。
基于本体的自动自助式用户支持\n技术领域\n[0001] 本发明的实施例大体上涉及计算机软件,更具体地,涉及基于特定领域信息的本体的自动自助式用户支持。\n背景技术\n[0002] 自动自助式软件应用程序通常由商业企业部署以就关于商业企业的产品或服务的询问及难题支持客户。这种应用程序可与客服中心公用程序整合以使对实时支持职员的需要减至最小。自助式支持应用程序可使用形式类别来描述预期询问及难题可能出现的领域,诸如关于计算机产品或金融服务的领域。自助式支持应用程序时常假设,询问及难题类别为熟知的且可易于被用户解译。应用程序可进一步假设,形式类别具有通用定义。然而,这种定义时常视基础后端支持系统而定。此外,多数用户将偏好使用自由形式文字以自己的术语来描述其难题或解释其需要。用户术语可能并不与由用户支持系统保存的形式难题类别或描述一致。\n[0003] 举例而言,用户可以陈述式“当我在已使用程序MNO启动备份之后执行程序XYZ时,我的膝上型计算机出现故障”的形式来解释难题。然而,用户的公司后端技术支持系统通常使用极特定术语(例如,膝上型/桌上型、操作系统、CPU类型、应用程序、程序、驱动程序(driver)、存储、备份/恢复等)来分类。因此,当自助式应用程序的用户接口基于并不与用户的术语匹配的系统中心(system-centric)术语时,自助式应用程序为较低效率。\n[0004] 此外,即使用户知晓特定系统中心术语,用户仍可能不能阐述其难题至可预期令人满意的结果的程度,除非用户明了构成问题的完整描述的事项。此情形归因于如下事实:\n用户并不知晓支持系统使用的特定领域,且并不熟悉此领域中的术语、属性及关系。\n[0005] 因此,需要用于帮助用户阐述自助式询问且有效地处理这种自助式用户询问的经改良的系统及程序。\n发明内容\n[0006] 本发明的示例性实施例涉及自助式用户支持应用程序,所述应用程序基于关于领域相关信息的本体的分析。本发明的一方面涉及一种用于提供关于用户查询的信息的系统。该用户查询可系关于该用户在使用产品或服务方面的经验的难题、关于产品或服务的问题,或其它客户/用户需要。该系统可包含:自然语言处理器,其用于识别该用户查询中的相关术语;及本体分析器,其用于使所述相关术语相匹配于与该用户查询相关的本体中的概念。该系统可进一步包括:查询处理器,其用于使用所述匹配相关术语及本体概念细化该用户查询;及搜寻引擎,其用于自一数据库识别与该经细化的用户查询有关的信息。\n[0007] 本发明的另一方面涉及一种用于提供关于用户查询的信息的计算机实施方法。该方法可包含:分析该用户查询以识别来自该用户查询的相关术语;使所述相关术语相匹配于与该用户查询相关的本体中的概念;基于所述匹配相关术语及本体概念细化该查询;及在数据库中搜寻与该经细化的用户查询有关的信息。\n[0008] 本发明的又一方面涉及一种用于提供关于用户查询的信息的计算机程序产品。该计算机程序产品包含计算机可读存储媒体,该计算机可读存储媒体具有由此体现的计算机可读程序代码且该计算机可读程序代码经配置以:分析该用户查询以识别来自该用户查询的相关术语,且使所述相关术语相匹配于与该用户查询相关的本体中的概念。该程序代码可经进一步配置以基于所述匹配相关术语及所述本体概念细化该用户查询,且在数据库中搜寻与该经细化的用户查询有关的信息。\n[0009] 下文参看附图在具体实施方式章节中描述本发明的所述示例性实施例的细节(关于其结构及操作两者),在所述附图中,类似标号指代类似部分。发明内容章节既不旨在识别所主张主题的的关键特征,也不旨在用以限制所主张主题的的范围。\n附图说明\n[0010] 图1说明示例性用户支持配置的方块图,本发明的方面可以该配置提供。\n[0011] 图2说明用于提供本发明的方面的可用于基于计算机的用户支持系统(诸如图1中的支持配置)中的代表性计算机系统的方块图。\n[0012] 图3说明根据本发明的一实施例的用于基于特定领域信息的本体接收及分析用户查询并传回与用户查询有关的信息的自助式支持系统的方块图。\n[0013] 图4更详细地说明根据本发明的一实施例的用于基于特定领域信息的本体接收及分析用户查询并传回与用户查询有关的信息的另一自助式支持系统。\n[0014] 图5说明用于键入可由本发明的一自助式支持系统的一实施例处理的用户查询的示例性用户接口菜单。\n[0015] 图6至图8说明一自助式支持系统可呈现给用户以获得关于用户查询的更多细节以便有效地处理查询并识别相关结果的额外示例性用户接口菜单。\n[0016] 图9为根据本发明的一实施例的用于基于特定领域信息的本体接收及分析用户查询并传回与用户查询有关的信息的程序的流程图。\n[0017] 图10为根据本发明的一实施例的自然语言处理器可遵循的用于分析用户查询以提取相关术语及参数并将所述术语及参数提供至本体分析器的程序的流程图。\n[0018] 图11为根据本发明的一实施例的本体分析器可遵循的用于使来自用户查询的相关术语与特定领域信息的本体匹配以产生适合于搜寻引擎的搜寻查询的程序的流程图。\n[0019] 图12为根据本发明的一实施例的查询细化程序的流程图,该查询细化程序判定用户查询的完整性及特定性,通过用户问题及答案来进一步细化查询且判定后继动作。\n具体实施方式\n[0020] 本发明的示例性实施例涉及基于特定领域信息的自助式用户支持应用。作为实例,本发明的实施例可适用于信息技术(IT)、金融服务、卫生保健、公共部门信息、法律服务、教育及产品营销中的客户支持系统。实施例可作为独立产品信息或服务支持系统提供,或与客服中心支持应用整合。实施例允许客户或用户以自由文字形式键入难题或需要。举例而言,在金融服务环境中,客户可键入呈“如何建立自银行账户至经纪人账户的转帐?”的形式的询问。\n[0021] 实施例可接收一用户查询,识别来自该用户查询的相关术语及细节,且在必要时基于知识驱动型理解及来自本体的所充分利用的智慧产生特定上下文的用户问题。查询可用对呈现给用户的额外问题的用户答案来细化。此情形为可基于问题及答案重新处理查询的反复程序。实施例可使用提取自用户查询的相关术语及细节来分析特定领域信息的本体并产生一搜寻查询。实施例可使用该搜寻查询自可用信息存放库识别与用户查询相关的信息或建议相关后继动作,诸如可用工具或辅助程序。通过本发明的实施例识别的信息可包括文件标题、文件的多个部分、用户指南、网页、工具、程序,及至与用户查询有关的文件的链接。\n[0022] 参看图1,其说明示例性计算机配置的方块图,本发明的方面可以该配置提供。计算机配置10可包括用于存取服务器13从而经由网络14接收用户支持的多个客户端计算机\n11至12。服务器13可托管用于关于产品信息或服务难题向客户提供帮助并提供客户询问的答案的自助式用户支持应用程序15。\n[0023] 图2说明用于提供本发明的方面的可用于用户支持配置(诸如图1中的配置10)中的代表性计算机系统的方块图。数据处理系统200可包括处理器单元211、存储器单元212、永久存储装置213、通信单元214、输入/输出单元215、显示器216及系统总线217。计算机程序通常存储于永久存储装置213中,直至需要执行计算机程序,此时将程序带至存储器单元\n212中,使得程序可直接由处理器单元211存取。处理器211通过将处理器211提供至存储器\n212的地址与一读取及/或写入的请求一起使用来选择存储器212的一部分进行读取及/或写入。通常,一地址处的已编码指令的读取及解译使处理器211提取后续地址或某一其它地址处的后续指令。\n[0024] 图3说明根据本发明的一示例性实施例的用于基于特定领域信息的本体接收一用户查询、分析该查询并传回与该用户查询有关的信息的自助式支持系统300的方块图。作为实例,领域可涉及金融服务或IT产品的客户支持。系统300可为在服务器13上操作的软件应用程序,且可包含用户接口系统302及查询逻辑系统303。用户接口系统302允许用户301键入(例如)关于所支持的产品或服务的难题、用户需要或询问。用户的难题、需要或询问可呈用户查询陈述式304的形式。\n[0025] 一旦用户查询陈述式304已由查询逻辑系统303分析并处理,查询逻辑系统303即可将查询逻辑系统303识别为与用户查询有关的文件或其它信息311传回至用户301。所识别的信息311可经由用户接口系统302传回。下文参看图5至图8来描述用户接口系统302可呈现给用户301的示例性用户接口菜单。\n[0026] 用户接口系统302可向用户呈现如由查询逻辑系统303产生的关于用户查询304的额外问题。用户接口系统302也可在用户查询的处理期间将用户答案转递至查询逻辑系统\n303。查询逻辑系统303的功能可为在用户查询304的用户的自由形式描述与基于本体的使用的固定后端类别的间进行桥接,所述本体经分析以阐明用户查询陈述式。桥接程序可包括用户查询304的使用特定领域本体的歧义消除、扩增及扩展,以改良用户查询的特定性及完整性。查询逻辑系统303可对比知识库、工具、程序或可支持用户的自助式请求的资产来评价所得用户查询。所得查询可基于针对用户的问题及用户答案由查询处理器来进一步细化。\n[0027] 本体为形式上表示技术支持领域(例如,银行业、卫生保健、计算机产品等)中的概念及关联关系的数据结构。本体不仅可用以定义领域并提供共享词汇表,而且可用以提供领域中的数据的性质。在本发明的实施例中,本体最初可由领域及本体专员准备。如下文参看图4中的本体编辑器409及本体建立器410以及图11中的本体分析程序所描述,查询逻辑系统303可经由额外用户输入的文本采掘(text mining)及本体匹配随时间来细化并扩展本体。\n[0028] 本体可包含本体模型及知识存储。本体模型可呈含有主要领域概念的Web本体语言(OWL)档案的形式,所述概念为相对静态的。知识存储可呈资源描述格式(RDF)并与OWL档案一致。作为领域使用的实例,本体模型可捕获“完全(perfect)”或“完整(complete)”查询的四个主要要素,所述要素可包括关于以下各个的信息:(1)用户的需要或难题是什么(例如,情形、征兆);(2)需要或难题出现的地方(例如,受影响组件);(3)在何环境中(例如,受影响产品);及(4)改变的事项(例如,导致问题的用户活动)。\n[0029] 查询逻辑系统303可推导用户查询中的语意意义且相对于领域表示来分析语意意义。查询逻辑系统303可向用户呈现一系列问题,直至可产生将传回合理量的结果的搜寻查询。查询逻辑系统303可经由本体的结构的问题而向用户进一步揭示本体的结构,且基于用户对问题的答案来细化用户查询。细化并非自动的,而是涉及用户。细化允许混合式主动互动(mixed-initiative interaction),其中用户通过回答问题或提供额外信息而有助于经细化查询的阐述。搜寻查询可用以执行元搜寻(meta-search),其中搜寻查询可经由多个搜寻引擎发送至单一或多个异质后端数据库、知识存储及可用工具。查询逻辑系统303可以信息的统一但通过查询输入分类并筛选的清单传回相关结果。\n[0030] 在本发明的一示例性实施例中,查询逻辑系统303可包含自然语言处理器305、本体分析器306、查询处理器307及搜寻引擎308。自然语言处理器305可分析由用户键入的查询以自用户查询提取关键细节。查询细节可包括(例如)用户难题的类型、用户在难题发生时正在进行何操作、难题出现所在的环境、受影响的产品组件,及由于难题而已改变的条件。来自自然语言处理器305的输出可呈相关子串(例如,关键术语)及关于相关子串的注释的形式。下文参看图4及图10来详细描述自然语言处理器305。\n[0031] 本体分析器306可自自然语言处理器305接收相关串及注释,从而分析与用户查询相关的特定领域信息的本体并识别本体中与用户的难题或需要匹配的概念及关系。下文参看图3至图4及图11来详细描述本体分析器306。查询逻辑系统303可进一步包含用于依据完整性及特定性细化用户查询的查询处理器307。作为用户查询细化程序的部分,查询处理器\n307可产生用户接口系统302可向用户提问的关于用户的难题或需要的额外问题,且处理用户对这种问题的答案。下文参看图4及图12来描述关于用户问题的产生及用户答案的处理的细节。\n[0032] 查询处理器307可进一步判定后继用户服务动作且向用户呈现这种服务动作,诸如建议用户打开难题记录或信息请求。作为查询细化程序的输出,查询处理器307可产生更准确地描述用户的难题或需要的更特定术语、短语及额外信息(若缺失)。查询处理器307可接着将这种术语、短语及额外信息提供至搜寻引擎308。下文参看图4及图12来进一步描述查询处理器307。\n[0033] 搜寻引擎308可自产品及服务数据的数据库309、因特网及内部网络310以及信息的其它可用存放库来识别与用户查询304有关的信息。查询逻辑系统303可经由用户接口系统302将所识别的信息传回至用户301。搜寻引擎308可包含数据搜寻或数据分析程序,诸如GoogleTM搜寻引擎或IBM DB2Intelligent MinerTM。\n[0034] 图4更详细地说明用于基于特定领域信息的本体接收及分析用户查询并将相关信息传回至用户的查询逻辑系统400的一示例性实施例。查询逻辑系统400可实施为多个层,其中每一层对一组相关处理任务负责。举例而言,自然语言处理层402可对分析采用自然语言(例如,英语)的用户查询负责。语言处理层402可包括自然语言处理器403,其用于将用户查询打断为关于难题的词汇基元(token)或关键词,诸如“故障(failed)”、“程序(program)”、“启动(start up)”、“悬置(hang)”等。自然语言处理器403的实例可为IBM LanguageWareTM自然语言处理器。自然语言处理器403可将关键词进一步分析为更易于由计算机应用程序利用的形式表示。\n[0035] 在本发明的一实施例中,自然语言处理器403可执行用户对难题或需要的描述的语汇分析。自然语言处理器403最初可使用打断规则字典(break-rules dictionary)将描述分析成段落、句子及词汇基元。自然语言处理器403可在一个或多个字典中查找词汇基元以找出关于词语的更多信息,例如,词语的词性(POS)。所述字典可包括含有所选择语言中的所有词语的标准语言学字典及含有来自特定知识领域的词语的自定义字典两者。\n[0036] 此外,自然语言处理器403可执行其它类型的分析以判定正在处理的文字的本质、形式及意义。举例而言,自然语言处理器403可将一语言识别应用于文字的主体以判定撰写文字所采用的语言。语汇分析可用以识别词语及词语的属性,以及判定每一词语的词性(POS)。语意分析可用以经由使用相关语法结构的程序理解语言的文法结构型样来判定词语及短语的上下文意义。语意分析为分析的后的自然语言处理的阶段,其涉及提取句子的意义的独立于上下文的方面,包括句子中所提及的实体的语意角色及量化信息(诸如,基数、反复及相依性)。\n[0037] 作为自然语言处理的部分,自然语言处理器403可进一步包括用于拼字检查、POS歧义消除、正规化(也即,判定词语的引理或典型形式,其也被称为“构词分析\n(morphological analysis)”)及称代解析(anaphoraresolution)的功能。正规化为判定在文字中找到的词语或术语的单串表示的程序。对于词尾变化(inflectional variance)(run、running、runs等)的正规化,此情形传统上被称作引理(lemma)、引用(citation)形式或典型(canonical)形式。词性(POS)为词语的语言学类别,诸如名词(the run)、动词(to run)、形容词(runny honey)等。POS歧义消除为将正确POS指派给词语的程序,且词语意思(语意)歧义消除为在词语具有许多相异意义时识别词语的哪一意思用于任一给定句子中的程序。\n[0038] 自然语言处理器403可查阅字典404来获得用户键入的不熟悉术语的意义。自然语言处理器403可为了同义字、反义字等而查找同义词典405,且为了表达而查找专门字典\n406。专门字典为包括词语以及公用表达的语言词汇表。专门字典为词素的语言详细目录。\n专门字典不仅包括词语及短语的条目,而且包括语汇关系、语法自变量结构及语法关系。在由自然语言处理器403进行的用户查询的处理期间,自然语言处理层402可自用户查询提取关键子串并将所述子串提供给本体层407。本体层407可使这种子串与相关于用户的需要或难题的特定领域信息的本体匹配。\n[0039] 作为实例,用户可输入查询为“Instollation problem on UNIX”。自然语言处理层402可执行以下任务:\n[0040] -识别文字的语言为英语。\n[0041] -辨识出“installation”的错误拼写(Instollation)。\n[0042] -判定“installation”的典型形式(install)。\n[0043] -辨识技术支持领域术语(UNIX)。\n[0044] -事件的语意辨识(Installation problem)。\n[0045] 一旦自然语言处理完成,查询逻辑系统400的本体层407即可开始相对于相关领域本体分析用户查询。以增加搜寻结果的关联性为目标,查询逻辑系统400可基于本体层407自本体识别的概念及关系反复地细化用户查询。\n[0046] 本体层407可包括本体概念匹配器408,其用于检查本体中的术语及关系,并使术语及关系与提取自用户查询的子串匹配。可将本体可视化为树结构,其中树中的每一节点与一术语相关联,且两个节点之间的连接表示与所连接节点相关联的术语之间的关系。基于本体的分析,本体概念匹配器408可提供与提取自用户查询的相关子串匹配的来自本体的一组术语及其关系。匹配的术语及关系可被转递至查询处理层416以由查询逻辑系统400继续处理。\n[0047] 本体概念匹配器408可使提取自用户查询的词汇基元与本体中的每一概念(例如,本体结构中的节点)以及与概念相关联的属性及关系匹配。属性可包括概念的子组件、前缀语及同义字。若词汇基元与本体中的概念之间存在匹配,则自然语言处理层402可用匹配概念及其关联柱对词汇基元进行注释。关联柱可包括反映“完全”查询的要求的情形、活动、产品、IT组件等。\n[0048] 若本体概念匹配器408识别词汇基元与本体概念之间的部分匹配,则自然语言处理层402可对匹配词汇基元进行注释,且在必要时,查询逻辑系统400可确认与用户的部分本体匹配。在本体概念匹配器408识别与词汇基元匹配的多个本体概念的状况下,查询逻辑系统400可向用户提问以经由针对用户的问题来阐明并选择最佳本体匹配。用户可基于匹配词汇基元及本体概念的上下文、柱及描述来选定正确词语。\n[0049] 本体层407可进一步包含本体编辑器409及本体建立器410。本体编辑器409允许本体专员编辑并建立针对特定领域的本体。实例本体编辑器为开放原始码Protege编辑器。使用Protege编辑器,本体专员可以RDF及OWL指令码语言来编辑并建立本体。本体建立器410允许本体得以用查询逻辑系统400在处理用户查询时可识别的额外术语及关系来更新。本体建立器410因此扩展本体,且基于实际用户需要及难题以及响应于用户查询识别的信息依据完整性及准确度随时间来细化本体的内容。\n[0050] 一旦本体匹配程序完成,查询逻辑系统400即可将匹配的本体概念转递至查询处理层416以评价用户查询对处理而言是否足够完整且特定,或是否需要额外用户输入的细化。查询处理层416可包括术语检查程序411,其用于判定提取自用户查询的关键术语的特定性。对于用户查询的每一部分,术语检查程序411可判定传回的本体匹配对于搜寻是否足够特定。若本体匹配并不足够特定,则查询处理层416可向用户提问额外问题以改良本体匹配的特定性。\n[0051] 查询处理层416可包括完整性检查程序412以评价用户查询对处理而言是否足够完整。完整性检查程序412可判定“完全”查询的每一部分是否得到满足。在一示例性实施例中,完整性可意谓着查询逻辑系统400具有足够信息以允许领域中的专家对用户做出响应。\n举例而言,查询逻辑系统400可需要关于以下各个的信息:a)用户正设法进行的操作,b)用户所遭遇的难题,及c)用户正使用的产品或服务。将需要难题描述的所有三个方面以满足完整性。对于任何缺失要素,以满足完全查询的每一部分为目标,查询处理层416可向用户提问另外问题。\n[0052] 查询处理层416可包括用户问题及答案处理器413,其用于产生用户问题并获得关于用户的难题或需要的额外细节。如上文所描述,自用户问题及答案获得的信息被用以细化用户查询。在一示例性实施例中,问题可寻址将帮助系统更好地“理解”难题的区域,诸如“难题为何事项?”、“难题出现于何处?”、“在何环境中?”及“何事项改变?”。问题及答案处理器413可能并非一直提问所有问题。问题及答案处理器413可视用户查询的特定性及细微性(granularity)的水平来判定提问哪些问题,以允许查询逻辑系统400合理地传回相关结果。结果可包括来自对各种领域中的用户的需要或难题的搜寻的合适文件,或相关后继动作(诸如,适用工具及服务)。\n[0053] 在一实例实施例中,用户问题及答案处理器413可组合领域本体中的信息与用户的特定难题或需要,以解释可能已引起用户的难题的条件并改良用户的信任及关系。举例而言,响应于客户的关于金融交易的难题,问题及答案处理器413可告知客户新近系统升级、通过电话向客户提供帮助,且向客户提供可能有价值的激励。\n[0054] 问题及答案处理器413可进一步定制问题以显示适合于用户情形的特定词语。问题可包括经取代词语以允许系统在与用户有关的语境(context)中互动。举例而言,用户在用户查询中可陈述“笔记本型计算机未能启动”。在产生针对用户的问题中,问题及答案处理器413可用词语“笔记本型(notebook)”取代其问题存放库中的词语“膝上型(laptop)”。\n经由针对用户的问题的细化,问题及答案处理器413可向用户揭示本体结构,由此允许用户更多地学习查询逻辑系统400正使用的特定领域。基于用户的答案,问题及答案处理器413可产生额外用户问题以进一步细化用户查询。\n[0055] 用户问题及答案互动因此为用于通过用户输入来细化用户查询的反复程序。问题及答案处理器413可捕获用户查询的有效要素,但可提问其它问题且基于特定领域本体提供答案建议,直至用户查询逼近“完全”查询。查询逻辑系统400正向用户提供学习经验以更好地阐述问题,同时用户正潜在地将随时间添加的额外但尚未捕获的特定领域知识提供给领域的形式表示(本体)。具体而言,问题及答案处理器413细化并最佳化用户的自由形式文字键入,其目的为以足够特定性及完整性描述用户的需要或难题。问题及答案处理器413充分利用来自本体的概念及关系来判定问题及向用户呈现问题的顺序。\n[0056] 查询处理层416可进一步包括先前查询检查程序414以判定用户查询是否类似于先前已由查询逻辑系统400处理的查询。先前经处置的查询及其解决方案可保存于查询逻辑系统400可存取的知识存放库中。举例而言,用户查询可系关于计算机的由特定程序的安装引起的启动故障,且此难题先前已由查询逻辑系统400处理并存储于数据库中。先前查询检查程序414可在存放库中查找关于此特定难题的信息,且以用于解决难题的经识别程序响应用户而不用重新处理用户查询。\n[0057] 查询处理层416可包含其它服务415,诸如,用以判定用户的后继动作或请求用户建立难题报告、购买请求或在线程序/活动的功能。其它服务415可判定用户查询更适合于服务而非搜寻。用户服务可包括分析系统记录文件、编目征兆(cataloging symptom),或检查销售或支持功能中任一者的产品、型号、发行版本等的兼容性。\n[0058] 一旦查询处理层416已检查用户查询的完整性及特定性且在必要时细化用户查询,则查询处理层416可将关于用户的需要或难题的相关关键术语及关系发送至搜寻层\n419。搜寻层419可包括能够存取相关信息源418(诸如,产品文件的数据库)的搜寻引擎或数据分析程序417。在公众领域及私密领域两者中,搜寻引擎或数据分析程序417也可存取因特网或公司内部网络以搜寻与查询有关的信息。搜寻层419可使用用于对与用户查询的关键术语最佳匹配的信息源排序并传回一组最佳匹配结果的结果排序公用程序。搜寻层419可接着经由用户接口302将最佳匹配结果传回至用户。\n[0059] 图5说明根据本发明的一实施例的用以允许用户键入关于产品或服务的用户查询或问题的自助式支持系统(例如,系统300)的示例性用户屏幕。用户屏幕501可包括用户可键入问题或描述服务需要或难题所在的用户接口组件502。在选择提交按钮503后,自助式支持系统300即可显示如图6中所展示的后继屏幕,该后继屏幕可向用户提示关于用户查询的额外信息。举例而言,若用户已在用户接口组件502中键入“改变磁盘驱动器”,则支持系统300可要求用户选择磁盘驱动器针对逻辑磁盘区或物理磁盘区,如图6中的用户选择604所说明。此外,用户接口302可显示一用户接口组件,其中用户并非必须选择系统选择中的一者,而是可键入用户自己的术语。这种术语可接着用于由本体建立器410来扩展本体。\n[0060] 支持系统300可通过呈现其它用户屏幕而继续向用户提示关于用户的需要或难题的额外细节,直至支持系统300可判定用户查询的描述对数据搜寻而言足够完整且特定。举例而言,在磁盘驱动器改变情境下,支持系统300可要求用户指定磁盘驱动器改变的类型,如图7中的用户问题705所说明。如参看图4所描述,一旦查询逻辑系统400具有用户的需要或难题的合理完整描述,查询逻辑系统400的组件即可处理用户查询。来自针对与用户查询有关的信息的搜寻的结果可作为图8中的文件清单806向用户显示。\n[0061] 图9为根据本发明的一实施例的用于基于特定领域本体接收及分析用户查询并传回与用户查询有关的信息的程序的流程图。程序可在步骤901处开始,在步骤901处,用户以自由文字形式(诸如,短语“改变磁盘驱动器”)键入查询或问题。在步骤902处,诸如查询逻辑系统400的自然语言处理层402的自然语言处理器可自查询提取关于用户的需要或难题的关键术语,例如“改变”及“磁盘驱动器”。\n[0062] 在步骤903处,诸如查询逻辑系统400中的本体层407的本体分析器可分析相关领域本体且使所提取的关键术语与本体中的概念及关系匹配。若查询逻辑系统400判定用户查询对于搜寻而言不够完整或特定,则根据步骤904,查询处理层416可产生关于用户的需要或难题的额外问题。在步骤905处,查询处理层416可基于用户对这种问题的答案而进一步细化用户查询,以使得用户查询对于搜寻而言更完整且特定。如自步骤905返回至步骤\n902的循环所展示,查询处理层416可重新处理经细化的用户查询。\n[0063] 在步骤906处,查询逻辑系统400中的查询处理层416可基于经细化的用户查询产生包括搜寻术语、概念及注释的搜寻查询。在步骤907处,查询逻辑系统400可将搜寻查询提供至搜寻层419,从而使用搜寻查询识别与用户的难题或需要有关的信息。搜寻层419可使用搜寻引擎或数据分析程序417来搜寻产品及服务信息的存放库418。除在步骤908处向用户呈现搜寻结果外,根据步骤909,查询逻辑系统400可请求关于所得信息的关联性的用户回馈。\n[0064] 图10为自然语言处理层402可遵循的用于分析用户查询以提取关于用户的需要或难题的相关术语及细节并将所述相关术语及所述细节提供至本体层407的示例性程序的流程图。自然语言处理层402可通过判定用户查询的语言(例如,英语)而于步骤101处开始。在步骤102处,自然语言处理层402可分析用户查询以自查询提取动词及名词。动词通常涉及用户对执行感兴趣的动作,且名词通常对应于所涉及的对象(诸如,特定产品、情形或技术组件)。自然语言处理层402可忽略陈述式中的连接词语,例如“关于(about)”、“在……中(in)”及“通过(by)”(步骤103)。根据步骤104,自然语言处理层402可对用户查询执行其它任务,诸如,文字(text)分段、词汇基元化(tokenization)、歧义消除、拼字检查及正规化。\n先前参看图4描述了这种任务。\n[0065] 在步骤105处,自然语言处理层402可识别用户查询中的实体(例如,关键术语)及关系(例如,“故障(failed)”、“在…之后(after)”及“安装(installation)”)。若用户查询中存在自然语言处理层402不能辨识的术语,则在步骤106处,自然语言处理层402可查阅字典、同义词典或专门字典以帮助判定术语的意义及用户的意图。一旦自然语言处理层402已自用户查询提取相关术语,根据步骤107,自然语言处理层402即可将这种术语转递至本体分析器(诸如,本体层407),从而分析与用户查询相关的特定领域本体并使术语与本体中的概念匹配。\n[0066] 图11为本体层407可遵循的用于使来自用户查询的相关术语与特定领域本体中的概念及关系匹配的示例性程序的流程图。程序可在步骤111处开始,在步骤111处,本体概念匹配器408使提取自用户查询的词汇基元与本体中的每一概念(例如,本体结构中的节点)以及与概念相关联的属性及关系匹配。属性可包括概念的子组件、前缀语及同义字。根据步骤112,若词汇基元与本体中的概念的间存在匹配,则自然语言处理层402可用匹配概念及其关联柱对词汇基元进行注释。关联柱可包括反映“完全”查询的要求的情形、活动、产品、IT组件等。\n[0067] 根据步骤113,若本体概念匹配器408识别词汇基元与本体概念的间的部分匹配,则自然语言处理层402可对匹配词汇基元进行注释,且在必要时,查询逻辑系统400可确认与用户的部分本体匹配。在步骤114处,在本体概念匹配器408识别与词汇基元匹配的多个本体概念的状况下,查询逻辑系统400可向用户提问以经由针对用户的问题来阐明并选择最佳本体匹配。根据步骤115,用户可基于匹配词汇基元及本体概念的上下文、柱及描述来选定正确词语。\n[0068] 以增加搜寻结果的关联性为目标,查询逻辑系统400可对提取自用户查询的每一词汇基元执行图11中所说明的程序,且可基于来自本体的概念及关系反复地细化用户查询。基于本体的分析,本体概念匹配器408可输出与提取自用户查询的相关子串匹配的来自本体的一组术语及其关系。在步骤116处,本体层407可为查询处理层416提供匹配的术语及关系以由查询逻辑系统400继续处理。\n[0069] 如上文参看图4所描述,本体层407可包含本体建立器410,根据步骤117,本体建立器410用于用查询逻辑系统400在处理用户查询时识别的术语及关系来更新领域本体。本体建立器410因此扩展本体,且基于实际用户需要及难题以及响应于用户查询识别的信息依据完整性及准确度随时间来细化本体的内容。一旦本体匹配程序完成,查询逻辑系统400即可将匹配的本体概念转递至查询处理层416以在必要时用额外用户输入细化查询。\n[0070] 图12为查询处理层416可遵循的用以判定用户查询的完整性及特定性的示例性查询细化程序的流程图。程序可用额外用户问题及答案来细化查询且判定后继用户动作。查询逻辑系统400中的查询处理层416可在步骤121处开始以判定如自本体概念匹配器408传回的针对用户查询的本体匹配对于相关信息的搜寻而言是否足够特定。如先前参看图4所描述,若匹配并不足够特定,则问题及答案处理器413可产生额外问题并向用户提问所述问题以阐明用户的需要或难题。\n[0071] 根据步骤122,查询处理层416可进一步判定用户查询对于处理而言是否足够完整。举例而言,查询逻辑系统400的完整性检查程序412可判定“完全”查询的每一部分是否存在于用户查询中。对于任何缺失关键描述符,在步骤123处,以满足“完全”查询的每一部分为目标,查询逻辑系统400可向用户提问额外问题。在步骤124处,查询处理层416可用用户响应于问题供应的额外信息来细化关键描述符的特定性及完整性。\n[0072] 在步骤125处,查询处理层416可基于提取自用户查询的信息断定:用户查询更适合于服务而非信息搜寻(例如,由缺陷引起的产品更换)。在该状况下,查询逻辑系统400可将用户导引至服务处置系统而非继续信息搜寻。此外,若查询处理层416判定需要用户动作以准确地判定用户的需要或难题或相关信息,则在步骤126处,查询处理层416可阐述后继动作并向用户呈现所述动作。\n[0073] 在查询处理层416判定用户查询描述符足够完整且特定的状况下,在步骤127处,查询处理层416可将描述符转递至查询逻辑系统400中的搜寻层419。搜寻层419可使用搜寻引擎或数据分析程序417来搜寻信息源418,诸如数据库、内部网络或因特网。搜寻引擎或数据分析程序417可自源418识别与用户查询相关的信息,且经由用户接口302将经识别信息传回至用户。\n[0074] 上文所描述的主题仅经由说明来提供且不应被解释为限制性的。本领域技术人员可进行所描述组件及操作的各种修改及取代而不偏离在以下权利要求中所界定的本发明的精神及范围,权利要求的范围应与最广泛解译一致以涵盖这种修改及等效结构。本领域技术人员应了解,本文中所描述的系统、方法及程序可体现于可程序化计算机、计算机可执行软件或数字电路中。软件可存储于计算机可读媒体上。举例而言,计算机可读媒体可包括软盘、RAM、ROM、硬盘、可移除媒体、闪存、“存储器棒(memorystick)”、光学媒体、磁光媒体、CD-ROM等等。\n[0075] 因而,本发明的方面可采用完全硬件实施例、完全软件实施例(包括固件、常驻软件、微码等)或组合软体方面与硬体方面的实施例的形式,所述实施例在本文中均可通称为“电路”、“模块”或“系统”。此外,本发明的方面可采用体现于一个或多个计算机可读媒体中的计算机程序产品的形式,该一个或多个计算机可读媒体具有体现于其上的计算机可读程序代码。\n[0076] 可利用一个或多个计算机可读媒体的任何组合。计算机可读媒体可为计算机可读信号媒体或计算机可读存储媒体。举例而言,计算机可读存储媒体可为(但不限于)电子、磁性、光学、电磁、红外线或半导体系统、装置或器件,或前述各个的任何合适组合。计算机可读存储媒体的较具体实例(非详尽清单)将包括以下各个:具有一个或多条导线的电连接件、便携型计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携型光盘只读存储器(CD-ROM)、光学存储器件、磁性存储器件,或前述各个的任何合适组合。在本文件的上下文中,计算机可读存储媒体可为可含有或存储供指令执行系统、装置或器件使用或结合指令执行系统、装置或器件使用的程序的任何有形媒体。\n[0077] 计算机可读信号媒体可包括传播数据信号,该经传播的数据信号具有体现于其中(例如,在基频中或作为载波的部分)的计算机可读程序代码。此传播信号可采用各种形式中任一个,包括(但不限于)电磁、光学或其任何合适组合。计算机可读信号媒体可为并非计算机可读存储媒体且可传达、传播或传送供指令执行系统、装置或器件使用或结合指令执行系统、装置或器件使用的程序的任何计算机可读媒体。\n[0078] 可使用任何适当媒体来传输体现于计算机可读媒体上的程序代码,适当媒体包括(但不限于)无线、有线、光纤缆线、RF等或前述各个的任何合适组合。\n[0079] 可以一种或多种程序设计语言的任何组合来撰写用于进行本发明的方面的操作的计算机程序码,该一种或多种程序设计语言包括诸如Java、Smalltalk、C++或其类似者的面向对象程序设计语言及诸如“C”程序设计语言或类似程序设计语言的传统程序性程序设计语言。程序代码可完全在用户的计算机上执行、部分地在用户的计算机上执行、作为独立软件包而执行、部分地在用户的计算机上执行且部分地在远程计算机上执行,或完全在远程计算机或服务器上执行。在完全在远程计算机或服务器上执行的情境中,远程计算机可经由任何类型的网络(包括局域网络(LAN)或广域网络(WAN))连接至用户的计算机,或可形成至外部计算机(例如,使用因特网服务提供者经由因特网)的连接。\n[0080] 上文参看根据本发明的实施例的方法、装置(系统)及计算机程序产品的流程图说明及/或方块图来描述本发明的方面。应理解,可通过计算机程序指令来实施所述流程图说明及/或方块图的每一方块及所述流程图说明及/或方块图中的方块的组合。可将这种计算机程序指令提供至通用计算机、专用计算机或其它可程序化数据处理装置的处理器以产生一机器,以使得经由计算机或其它可程序化数据处理装置的处理器执行的指令产生用于实施在该或所述流程图及/或方块图方块中所指定的功能/动作的构件。\n[0081] 也可将这种计算机程序指令存储于一计算机可读媒体中,其可指导计算机、其它可程序化数据处理装置或其它器件以特定方式发挥作用,以使得存储于该计算机可读媒体中的指令产生一制品,该制品包括实施该或所述流程图及/或方块图方块中所指定的功能/动作的指令。\n[0082] 也可将所述计算机程序指令加载至一计算机、其它可程序化数据处理装置或其它器件上,以使一系列操作步骤在该计算机、其它可程序化装置或所述其它器件上执行以产生一计算机实施程序,以使得在该计算机或其它可程序化装置上执行的指令提供用于实施该或所述流程图及/或方块图方块中所指定的功能/动作的程序。\n[0083] 上文所描述的诸图中的流程图及方块图说明根据本发明的各种实施例的系统、方法及计算机程序产品的可能实施的架构、功能性及操作。就此而言,流程图或方块图中的每一方块可表示程序代码的一模块、区段或部分,其包含用于实施指定逻辑功能的一个或多个可执行指令。也应注意,在一些替代实施中,区块中所提到的功能可不以诸图中所提到的次序发生。举例而言,取决于所涉及的功能性,连续展示的两个区块实际上可实质上同时执行,或所述区块有时可以相反次序执行。也应注意,可通过执行指定功能或动作的基于专用硬件的系统或专用硬件及计算机指令的组合来实施方块图及/或流程图说明的每一方块及方块图及/或流程图说明中的方块的组合。
法律信息
- 2017-09-29
- 2014-03-12
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201280024761.X
申请日: 2012.05.17
- 2014-01-29
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |