著录项信息
专利名称 | 电子设备及其语句处理方法 |
申请号 | CN201410843793.3 | 申请日期 | 2014-12-30 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2016-07-27 | 公开/公告号 | CN105808520A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/27 | IPC分类号 | G;0;6;F;1;7;/;2;7查看分类表>
|
申请人 | 联想(北京)有限公司 | 申请人地址 | 北京市海淀区上地西路6号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 联想(北京)有限公司 | 当前权利人 | 联想(北京)有限公司 |
发明人 | 卓雷;赵凯;葛安生 |
代理机构 | 北京市柳沈律师事务所 | 代理人 | 安之斐 |
摘要
本发明提供一种电子设备及其语句处理方法,能够仅针对在获得输入语句的属性的处理中贡献度大的关键词,生成用于获得输入语句的属性的规律。该语句处理方法包括:存储N个训练语句,其中对N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性;根据对部分词组标定的属性,将N个训练语句划分为M个训练语句集合;针对通过对训练语句进行分词处理而获得的各个单词,判断是否存在同一单词在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词,并且将该特定单词确定为关键词;针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成规律。由此能够在不影响所获得的属性的准确度的前提下,提高处理效率、节省计算资源。
1.一种电子设备,包括:
存储单元,其配置来存储N个训练语句,其中对所述N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性;
处理单元,其配置来根据对所述部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合,针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词,若存在所述特定单词,则将该特定单词确定为关键词,所述处理单元针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律,
其中,所述规律表示所述关键词、所述关键词的对象和属性之间的对应关系,其中N大于M,M大于等于2。
2.如权利要求1所述的电子设备,其中,
所述属性是第1属性或第2属性,
所述处理单元将所述N个训练语句划分为第1训练语句集合和第2训练语句集合,在所述第1训练语句集合中的各个训练语句中对部分词组标定了第1属性,在所述第2训练语句集合中的各个训练语句中对部分词组标定了第2属性。
3.如权利要求2所述的电子设备,其中,
针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在所述第1训练语句集合中的占比和在所述第2训练语句集合中的占比,判断是否存在在所述第1训练语句集合中的占比和在所述第2训练语句集合中的占比之间的差值大于第一阈值的特定单词;
若存在所述特定单词,则所述处理单元将该特定单词确定为关键词。
4.如权利要求1所述的电子设备,还包括:
输入单元,其配置来输入输入语句,
所述处理单元判断所述输入语句中是否存在所述关键词,在存在所述关键词的情况下,进一步基于针对该关键词生成的规律,获得所述输入语句的属性。
5.如权利要求4所述的电子设备,其中,
所述处理单元对针对所述关键词生成的各个规律,赋予权重,
所述处理单元在所述输入语句满足多个规律的情况下,获得与在所述多个规律中权重高的规律对应的属性。
6.一种语句处理方法,应用于电子设备,所述语句处理方法包括:
存储N个训练语句,其中对所述N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性;
根据对所述部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合;
针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词;
若存在所述特定单词,则将该特定单词确定为关键词;
针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律,
其中,所述规律表示所述关键词、所述关键词的对象和属性之间的对应关系,其中N大于M,M大于等于2。
7.如权利要求6所述的语句处理方法,其中,
所述属性是第1属性或第2属性,
在根据对所述部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合的步骤中,
将所述N个训练语句划分为第1训练语句集合和第2训练语句集合,在所述第1训练语句集合中的各个训练语句中对部分词组标定了第1属性,在所述第2训练语句集合中的各个训练语句中对部分词组标定了第2属性。
8.如权利要求7所述的语句处理方法,其中,
针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词的步骤中,
针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在所述第1训练语句集合中的占比和在所述第2训练语句集合中的占比,判断是否存在在所述第1训练语句集合中的占比和在所述第2训练语句集合中的占比之间的差值大于第一阈值的特定单词。
9.如权利要求6所述的语句处理方法,还包括:
输入输入语句;
判断所述输入语句中是否存在所述关键词,在存在所述关键词的情况下,进一步基于针对该关键词生成的规律,获得所述输入语句的属性。
10.如权利要求9所述的语句处理方法,包括:
对针对所述关键词生成的各个规律,赋予权重,
在判断所述输入语句中是否存在所述关键词,在存在所述关键词的情况下,进一步基于针对该关键词生成的规律,获得所述输入语句的属性的步骤中,
在所述输入语句满足多个规律的情况下,获得与在所述多个规律中权重高的规律对应的属性。
电子设备及其语句处理方法\n技术领域\n[0001] 本发明涉及电子设备以及该电子设备中的语句处理方法。\n背景技术\n[0002] 在现有技术的语句分类方法中,利用多个训练语句(在各个训练语句中的部分词组标定了该部分词组的属性),生成用于获得输入语句的属性的规律,从而通过所生成的规律来获得输入语句的属性。在生成所述规律的处理中,针对通过对所述训练语句进行分词处理而获得的各个单词,基于各个训练语句中的部分词组和对该部分词组标定的属性来生成规律。\n[0003] 但是,若针对通过对所述训练语句进行分词处理而获得的各个单词生成规律,规律的生成处理所需的计算量明显地增加,降低执行效率和浪费计算资源。并且,利用如此生成的规律来获得输入语句的属性时,由于所生成的规律多,因此获得输入语句的属性所需的计算量也变大,降低执行效率和浪费计算资源。\n[0004] 另一方面,如果仅针对通过对所述训练语句进行分词处理而获得的部分单词生成规律,虽然能够降低规律的生成处理所需的计算量,但是对属性判断的准确度带来影响。\n发明内容\n[0005] 本发明鉴于上述问题而完成,其目的在于提供一种电子设备及其语句处理方法,能够仅针对在获得输入语句的属性的处理中贡献度大的关键词,生成用于获得输入语句的属性的规律,由此能够在不影响所获得的属性的准确度的前提下,提高处理效率、节省计算资源。\n[0006] 根据本发明的一个方面,提供一种电子设备。所述电子设备包括:存储单元,其配置来存储N个训练语句,其中对所述N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性;处理单元,其配置来根据对所述部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合,针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词,若存在所述特定单词,则将该特定单词确定为关键词,所述处理单元针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律。其中,所述规律表示所述关键词、所述关键词的对象和属性之间的对应关系,N大于M,M大于等于2。\n[0007] 根据本发明的另一方面,提供一种应用于电子设备的语句处理方法。所述语句处理方法包括:存储N个训练语句,其中对所述N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性;根据对所述部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合;针对通过对所述训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词;若存在所述特定单词,则将该特定单词确定为关键词;针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律。其中,所述规律表示所述关键词、所述关键词的对象和属性之间的对应关系,N大于M,M大于等于2。\n[0008] 根据本发明的电子设备及其语句处理方法,能够仅针对在获得输入语句的属性的处理中贡献度大的关键词,生成用于获得输入语句的属性的规律,由此能够在不影响所获得的属性的准确度的前提下,提高处理效率、节省计算资源。\n附图说明\n[0009] 图1是表示本发明的实施方式的电子设备的功能框图。\n[0010] 图2是表示本发明的实施方式的电子设备的语句处理方法的流程图。\n具体实施方式\n[0011] 下面,参照附图来说明本发明的实施方式。提供以下参照附图的描述,以帮助对由权利要求及其等价物所限定的本发明的示例实施方式的理解。其包括帮助理解的各种具体细节,但它们只能被看作是示例性的。因此,本领域技术人员将认识到,可对这里描述的实施方式进行各种改变和修改,而不脱离本发明的范围和精神。而且,为了使说明书更加清楚简洁,将省略对本领域熟知功能和构造的详细描述。\n[0012] 参照图1来说明本发明的实施方式的电子设备。图1是表示本发明的实施方式的电子设备的功能框图。\n[0013] 如图1所示,电子设备1包括存储单元11、处理单元12。其中,电子设备1例如为手机、平板电脑、摄像机、照相机、个人计算机、服务器等的具有运算能力的电子设备。\n[0014] 存储单元11配置来存储N个训练语句,其中对N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性。其中,N是大于0的整数。\n[0015] 例如,在存储单元11中存储有训练语句“这个产品关注很久了,运行速度比想象中快”,并且对该训练语句的部分词组“运行速度比想象中快”标定了属性“好评”。再如,在存储单元11中存储有训练语句“十一活动购买的,但是降价很快”,并且对该训练语句的部分词组“降价很快”标定了属性“差评”。\n[0016] 其中,上述的部分词组和对该部分词组标定的属性是人为设置的。例如,使用者视认训练语句的内容,并在该训练语句中选择部分词组,并且对该部分词组标定属性。\n[0017] 在现有技术中,如上所述,针对通过对训练语句进行分词处理而获得的各个单词,基于各个训练语句中的部分词组和对该部分词组标定的属性来生成用于获得输入语句的属性的规律。\n[0018] 在本发明的实施方式的处理单元12中,针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律。其中,规律表示关键词、关键词的对象和属性之间的对应关系。其中,处理单元12能够以电子硬件、计算机软件或者二者的结合来实现。并且软件模块可以置于任意形式的计算机存储介质中。\n[0019] 例如,处理单元12针对关键词,统计在部分词组中出现某个对象时对该部分词组标定的属性为特定属性的次数,在所统计出的次数超过阈值时,生成表示关键词、该某个对象、特定属性的对应关系的规律。此外,处理单元12针对关键词生成规律时,也可以应用其他的模式学习方法,从而生成用于获得输入语句的属性的规律。\n[0020] 例如,针对关键词“快”,基于上述的训练语句中的部分词组和对该部分词组标定的属性,例如生成表示关键词“快”、关键词的对象“运行速度”和属性“好评”之间的对应关系的规律,再如生成表示关键词“快”、关键词的对象“降价”和属性“差评”之间的对应关系的规律。\n[0021] 下面,具体说明本发明的实施方式中的确定关键词的处理。\n[0022] 处理单元12根据对各个训练语句中的部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合,其中N大于M,M大于等于2。\n[0023] 具体地,在上述例子中,属性是“好评”(第1属性)或“差评”(第2属性)。处理单元12将N个训练语句划分为第1训练语句集合和第2训练语句集合。在第1训练语句集合中的各个训练语句中对部分词组标定了第1属性,在第2训练语句集合中的各个训练语句中对部分词组标定了第2属性。\n[0024] 其中,本发明的实施方式中的属性不限定于两种,也可以是两种以上。因此,根据属性的种类的数目,能够适当地设定训练语句集合的数目M。\n[0025] 例如,在某个训练语句中对部分词组标定了第1属性的情况下,将该某个训练语句划分到第1训练语句集合,相反在某个训练语句中对部分词组标定了第2属性的情况下,将该某个训练语句划分到第2训练语句集合。\n[0026] 此外,在一个训练语句中对多个部分词组标定了属性的情况下,也可以根据多个部分词组标定的属性,适当地划分到M个训练语句集合中的其中一个训练语句集合。例如,在对多个部分词组都标定了第1属性的情况下,将该训练语句划分到由对部分词组标定了第1属性的训练语句构成的第1训练语句集合,在对多个部分词组标定了不同的属性的情况下,可以根据所标定的属性的优先级、标定的不同属性的数目,例如将该训练语句划分到由对部分词组标定了优先级高的属性的训练语句构成的训练语句集合,或者将该训练语句划分到由对部分词组标定了标定的属性的数目多的属性的训练语句构成的训练语句集合。\n[0027] 此外,训练语句集合并不限定于与各个属性的种类一一对应,例如也可以设为某个训练语句集合与两个或两个以上的属性相对应。例如,属性包括第1属性、第2属性、第3属性的情况下,在第1训练语句集合的各个训练语句中对部分词组标定了第1属性或第3属性(与第1属性和第3属性的两个属性相对应),在第2训练语句集合的各个训练语句中对部分词组标定了第2属性(与第2属性相对应)。\n[0028] 然后,处理单元12针对通过对训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词,若存在特定单词,则将该特定单词确定为关键词。\n[0029] 在本发明的实施方式中,如上所述,仅针对关键词生成用于获得输入语句的属性的规律,因此为了不影响所获得的属性的准确度,在通过对训练语句进行分词处理而获得的各个单词中,将能够体现不同属性的单词选作关键词。能够体现不同属性的单词在各个训练语句集合中的统计结果呈现出一定的特性(例如,在不同的训练语句集合中的占比差别大、在不同的训练语句集合中的出现次数差别大),因此在本发明的实施方式中,将在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词选作关键词。\n[0030] 具体地,在上述例子中,关于训练语句“这个产品关注很久了,运行速度比想象中快”的各个单词,例如单词“快”相对于单词“产品”、“很久”、“比想象中”、“运行速度”等,更能够体现属性“好评”。换句话说,单词“快”在将该训练语句中的部分词组“运行速度比想象中快”判断为“好评”的处理中,贡献度比较大。再如,关于训练语句“十一活动购买的,但是降价很快”的各个单词,例如单词“快”相对于单词“十一活动”、“购买”、“很”等(也包括否定词),更能够体现属性“差评”。换句话说,单词“快”在将该训练语句中的部分词组“降价很快”判断为“差评”的处理中,贡献度比较大。\n[0031] 如上所述,能够体现不同属性的单词在各个训练语句集合中的统计结果之间呈现出一定的特性。例如,关于上述单词“快”,在由对部分词组标定了“好评”的训练语句构成的第1训练语句集合中出现的概率比在由对部分词组标定了“差评”的训练语句构成的第2训练语句集合中出现的概率大。\n[0032] 优选为,处理单元12针对通过对训练语句进行分词处理而获得的各个单词,分别计算同一单词在第1训练语句集合中的占比和在第2训练语句集合中的占比,判断是否存在在第1训练语句集合中的占比和在第2训练语句集合中的占比之间的差值大于第一阈值的特定单词,若存在特定单词,则处理单元12将该特定单词确定为关键词。\n[0033] 此外,处理单元12也可以仅针对在通过对部分词组进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词,若存在特定单词,则将该特定单词确定为关键词。由此,能够减少关键词的候选对象,用于确定关键词的处理的计算量减少,能够减少计算时间。\n[0034] 由此,处理单元12能够在通过对训练语句进行分词处理而获得的单词中,确定出一个或多个关键词。并且,处理单元12在针对所确定的关键词生成规律的结果,对所确定的各个关键词能够分别生成一个或多个规律。例如,处理单元12将所生成的规律形成为规律表,在该规律表中,以关键词为单位(索引)关联针对该关键词生成的一个或多个规律。\n[0035] 在通过如上所述的方法针对关键词生成规律之后,本发明的实施方式的电子设备\n1能够利用所生成的规律来获得输入语句的属性。\n[0036] 具体地,图1所示的电子设备1还可以包括输入单元13。输入单元13配置来输入输入语句。其中,输入单元13可以由键盘、鼠标、触摸显示屏等接受用户操作的输入构件构成,也可以由经由网络从其他设备接收输入语句的通信构件构成,其构成方式不受限定。\n[0037] 在从输入单元13输入了输入语句的情况下,处理单元12判断输入语句是否符合上述生成的规律。\n[0038] 具体地,处理单元12判断输入语句中是否存在关键词,在存在关键词的情况下,进一步基于针对该关键词生成的规律,获得输入语句的属性。\n[0039] 例如,针对关键词“快”,假设生成了表示关键词“快”、关键词的对象“运行速度”和属性“好评”之间的对应关系的规律,并且还生成了其他的规律。对于其他的关键词,同样生成了一个或多个规律。处理单元12判断输入语句中是否存在多个关键词中的其中一个关键词,例如输入语句为“体验很好,运行速度一如既往地快”的情况下,判断为存在关键词“快”。然后,处理单元12基于表示关键词“快”、关键词的对象“运行速度”和属性“好评”之间的对应关系的规律,若在该输入语句中该关键词的对象为“运行速度”(即符合规律),则能够获得与该概率对应的属性“好评”。\n[0040] 此外,存在从输入单元13输入的输入语句符合多个规律的情况。在多个规律相对应的属性都相同的情况下,处理单元12获得该相同的属性即可。在多个规律相对应的属性不相同的情况下,处理单元12根据规律的优先级,确定输入语句的属性。\n[0041] 具体地,处理单元12对针对关键词生成的各个规律,赋予权重。例如,处理单元12根据所生成的规律在N个训练语句的部分词组中出现的次数,适当地赋予各个规律的权重。\n然后,处理单元12在输入语句满足多个规律的情况下,获得与在多个规律中权重高的规律对应的属性。\n[0042] 通过如上所述的方法来确定在获得输入语句的属性的处理中贡献度大的关键词,并且仅仅针对所确定的关键词,生成用于获得输入语句的属性的规律(换句话说,不针对在获得输入语句的属性的处理中贡献度小的单词,生成规律),由此能够在不影响所获得的属性的准确度的前提下,提高生成规律的处理中的处理效率、节省计算资源。\n[0043] 下面,参照图2来说明本发明的实施方式的应用于电子设备的语句处理方法。图2是表示本发明的实施方式的电子设备的语句处理方法的流程图。\n[0044] 图2的流程图所示的语句处理方法能够应用于图1所示的电子设备1。如图1所示,电子设备1包括存储单元11、处理单元12。\n[0045] 在步骤S1中,存储单元11存储N个训练语句,其中对N个训练语句的各个训练语句中的部分词组标定了该部分词组的属性。其中,N是大于0的整数。其中,上述的部分词组和对该部分词组标定的属性是人为设置的。例如,使用者视认训练语句的内容,并在该训练语句中选择部分词组,并且对该部分词组标定属性。\n[0046] 在步骤S2中,处理单元12根据对各个训练语句中的部分词组标定的属性,将所述N个训练语句划分为M个训练语句集合,其中N大于M,M大于等于2。\n[0047] 具体地,属性是“好评”(第1属性)或“差评”(第2属性)。处理单元12将N个训练语句划分为第1训练语句集合和第2训练语句集合。在第1训练语句集合中的各个训练语句中对部分词组标定了第1属性,在第2训练语句集合中的各个训练语句中对部分词组标定了第2属性。\n[0048] 其中,本发明的实施方式中的属性不限定于两种,也可以是两种以上。因此,根据属性的种类的数目,能够适当地设定训练语句集合的数目M。此外,在一个训练语句中对多个部分词组标定了属性的情况下,也可以根据多个部分词组标定的属性,适当地划分到M个训练语句集合中的其中一个训练语句集合。此外,训练语句集合并不限定于与各个属性的种类一一对应,例如也可以设为某个训练语句集合与两个或两个以上的属性相对应。\n[0049] 在步骤S3中,处理单元12针对通过对训练语句进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词。\n[0050] 优选为,在步骤S3中,处理单元12针对通过对训练语句进行分词处理而获得的各个单词,分别计算同一单词在第1训练语句集合中的占比和在第2训练语句集合中的占比,判断是否存在在第1训练语句集合中的占比和在第2训练语句集合中的占比之间的差值大于第一阈值的特定单词。\n[0051] 此外,处理单元12也可以仅针对在通过对部分词组进行分词处理而获得的各个单词,分别计算同一单词在各个训练语句集合中的统计结果,并且判断是否存在在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词。由此,能够减少关键词的候选对象,用于确定关键词的处理的计算量减少,能够减少计算时间。\n[0052] 在步骤S4中,若在步骤S3判断的结果存在特定单词,则将该特定单词确定为关键词。\n[0053] 如上所述,在各个训练语句集合中的统计结果之间的关系满足规定的条件的特定单词能够体现不同的属性。换句话说,在获得输入语句的属性的处理中,如上确定的关键词相对于其他的单词贡献度大。\n[0054] 在步骤S5中,处理单元12针对所确定的关键词,基于各个训练语句中的部分词组、和对该部分词组标定的属性,生成用于获得输入语句的属性的规律。其中,规律表示关键词、关键词的对象和属性之间的对应关系。\n[0055] 例如,处理单元12针对关键词,统计在部分词组中出现某个对象时对该部分词组标定的属性为特定属性的次数,在所统计出的次数超过阈值时,生成表示关键词、该某个对象、特定属性的对应关系的规律。此外,处理单元12针对关键词生成规律时,也可以应用其他的模式学习方法,从而生成用于获得输入语句的属性的规律。\n[0056] 由此,处理单元12能够在通过对训练语句进行分词处理而获得的单词中,确定出一个或多个关键词。并且,处理单元12在针对所确定的关键词生成规律的结果,对所确定的各个关键词能够分别生成一个或多个规律。例如,处理单元12将所生成的规律形成为规律表,在该规律表中,以关键词为单位(索引)关联针对该关键词生成的一个或多个规律。\n[0057] 通过如上所述的方法来确定在获得输入语句的属性的处理中贡献度大的关键词,并且仅仅针对所确定的关键词,生成用于获得输入语句的属性的规律(换句话说,不针对在获得输入语句的属性的处理中贡献度小的单词,生成规律),由此能够在不影响所获得的属性的准确度的前提下,提高生成规律的处理中的处理效率、节省计算资源。\n[0058] 在通过如上所述的方法针对关键词生成规律之后,本发明的实施方式的语句处理方法能够利用所生成的规律来获得输入语句的属性。具体地,由输入单元13输入输入语句,在从输入单元13输入了输入语句的情况下,处理单元12判断输入语句是否符合上述生成的规律。例如,处理单元12判断输入语句中是否存在关键词,在存在关键词的情况下,进一步基于针对该关键词生成的规律,获得输入语句的属性。\n[0059] 此外,存在从输入单元13输入的输入语句符合多个规律的情况。在多个规律相对应的属性都相同的情况下,处理单元12获得该相同的属性即可。在多个规律相对应的属性不相同的情况下,处理单元12根据规律的优先级,确定输入语句的属性。\n[0060] 具体地,在本发明的实施方式的语句处理方法中,处理单元12对针对关键词生成的各个规律,赋予权重。例如,处理单元12根据所生成的规律在N个训练语句的部分词组中出现的次数,适当地赋予各个规律的权重。\n[0061] 然后,处理单元12在基于规律来获得输入语句的属性的处理中,在输入语句满足多个规律的情况下,获得与在多个规律中权重高的规律对应的属性。\n[0062] 本领域普通技术人员可以意识到,结合在本发明的实施方式描述的各个单元和步骤,能够以电子硬件、计算机软件或者二者的结合来实现。并且软件模块可以置于任意形式的计算机存储介质中。为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。\n[0063] 在上面详细描述了本发明的各个实施方式。然而,本领域技术人员应该理解,在不脱离本发明的原理和精神的情况下,可对这些实施方式进行各种修改,组合或子组合,并且这样的修改应落入本发明的范围内。
法律信息
- 2018-12-14
- 2016-08-24
实质审查的生效
IPC(主分类): G06F 17/27
专利申请号: 201410843793.3
申请日: 2014.12.30
- 2016-07-27
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-09-24
|
2007-03-19
| | |
2
| |
2011-03-09
|
2010-11-16
| | |
3
| | 暂无 |
2002-03-07
| | |
4
| |
2009-12-16
|
2008-12-04
| | |
5
| |
2007-07-25
|
2007-01-24
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |