著录项信息
专利名称 | 一种基于协同神经网络的语义角色标注方法 |
申请号 | CN201210111557.3 | 申请日期 | 2012-04-13 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2012-09-12 | 公开/公告号 | CN102662931A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/27 | IPC分类号 | G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 厦门大学 | 申请人地址 | 广东省深圳市南山区粤海街道高新南环路留学生创业大厦1510室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 深圳云译科技有限公司 | 当前权利人 | 深圳云译科技有限公司 |
发明人 | 陈毅东;黄哲煌;史晓东;周昌乐 |
代理机构 | 厦门南强之路专利事务所(普通合伙) | 代理人 | 马应森 |
摘要
一种基于协同神经网络的语义角色标注方法,涉及语义角色标注、模式识别和协同神经网络领域,涉及将协同神经网络原理引入到浅层语义分析的方法。从训练语料和测试语料中抽取特征,并构造相应的语义特征向量;对语义特征向量进行核变换,并在此基础上构造原型模式和待测试模式;构造序参量,对每个依存成分求若干个侯选角色;构建谓词库,对每个谓词对应的所有依存成分的候选角色进行组合,得到各个谓词的角色链;优化网络参数,进行协同神经网络的动力学演化,从而得到最优角色链,并输出标注模式。首次将协同神经网络原理引入到语义角色标注中,该方法广泛适应于各种自然语言处理任务中。具有较好的应用前景和应用价值。
1.一种基于协同神经网络的语义角色标注方法,其特征在于包括以下步骤:
1)从训练语料和测试语料中抽取特征,并构造相应的语义特征向量;
2)对语义特征向量进行核变换,并在此基础上构造原型模式和待测试模式;
3)构造序参量,对每个依存成分求若干个侯选角色;
4)构建谓词库,对每个谓词对应的所有依存成分的候选角色进行组合,得到各个谓词的角色链;
5)优化网络参数,进行协同神经网络的动力学演化,从而得到最优角色链,并输出标注模式。
2.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤1)中,所述抽取特征包括基本特征和扩展特征,所述基本特征包括谓词及词性、谓词语态、当前关系、路径、关系子类框架、中心词及位置6类特征;所述扩展特征包括句法路径、句法路径长度、句法部分路径长度、关系路径、关系部分路径、句法部分路径、谓词兄弟的依存关系链、谓词+句法路径、谓词关系、谓词的句法子类框架、谓词+中心词、谓词兄弟的中心词链、中心词词性、中心词+词性、中心词当前关系15类特征。
3.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤2)中,所述对语义特征向量进行核变换的具体方法如下:采用的混合核函数定义为:
其中λi为系数,且 ki(x,y)根据语义特征组合的需要选择定
义为:多项式核函数、高斯核函数、卷积核函数,通过核函数映射对已有特征进行了组合或者分解,将低维特征空间映射到高维特征空间,降低原型向量之间的相关程度。
4.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤2)中,所述构造原型模式采用数学平均值方法构造原型模式,具体步骤为:
(1)每个类别分别选取若干个有代表性的训练样本;
(2)对每个类别分别计算原型模式。
5.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤3)中,所述对每个依存成分求若干个侯选角色的具体步骤包括:
(1)对原型模式和待测试模式构造序参量;
(2)将序参量按大小顺序排序,得到相应的的候选角色。
6.如权利要求5所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤(1)中,所述构造序参量的方法采用伪逆法、距离法或内积法,具体步骤如下:
设原型模式vk(k=1,2…)、测试模式ql(l=1,2…)和伴随模式 (k=1,2…),则vk和ql之间的序参量ξlk为:
若采用伪逆法,则 (l=1,2…,k=1,2…);
若采用距离法,则ξlk=||vk-ql||,(l=1,2…,k=1,2…);
若采用内积法,则 (l=1,2…,k=1,2…)。
7.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤4)中,所述谓词的角色链的获取方法是从每个依存成分各取一个可能角色,通过组合算法构成链。
8.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤5)中,所述优化网络参数的方法采用基于量子微粒群算法的参数优化,将对训练样本的识别率作为适应度,在参数空间中搜索注意参数(λk,B,C)的最优解,λk(k=1,2…),B,C为协同神经网络的注意参数。
9.如权利要求1所述的一种基于协同神经网络的语义角色标注方法,其特征在于在步骤5)中,所述进行协同神经网络的动力学演化采用的动力学演化方程为:
式中ξk为序参量,λk(k=1,2…),B,C为协同神经网络的注意参数。
一种基于协同神经网络的语义角色标注方法\n技术领域\n[0001] 本发明涉及语义角色标注、模式识别和协同神经网络领域,涉及将协同神经网络原理引入到浅层语义分析的方法,尤其涉及一种基于协同神经网络的语义角色标注方法。\n背景技术\n[0002] 作为自然语言处理的一个主要研究方向,语义分析能够将自然语言转化为计算机能够理解的形式化语言,从而做到人与计算机之间的相互理解。对句子进行正确的语义分析,一直是从事自然语言理解研究的学者们追求的主要目标。但受语义的复杂性所限,目前的语义分析主要是集中在角色标注等方面。语义角色标注不对整个句子进行详细的语义分析,它只标注与句子中谓词有关的成分的语义角色,如施事、受事、与事、时间和地点等。近年来,语义角色标注受到了越来越多的学者的关注,广泛于应用于信息抽取、信息检索、机器翻译等领域。随着自然语言中底层技术的逐渐成熟,如分词、句法分析等都为语义角色标注的发展打下了重要基础。语义角色标注的基本标注单元主要有词、短语和句法成分。从整体效果看,以句法成分为标注单元的语义角色标注要优于以词和短语为标注单元的方法。\n[0003] 语义角色标注一般分为4个步骤。首先,进行预处理,过滤掉不可能成为语义角色的句法成分,预处理的任务即判断成分与目标动词之间是否具有语义角色关系,其可看作是一个二元分类问题;其次,识别出谓词的可能语义角色;接着,为句法成分进行具体角色的分类;最后,进行后处理,得到合理的角色组合。其中,分类问题主要是采用机器学习技术进行处理。\n[0004] 目前,主流的语义角色标注研究主要集中于使用各种机器学习技术,利用多种语言学特征,进行了语义角色的识别和分类。在角色分类过程中,无论是采用基于特征向量的方法,还是基于树核函数的方法,目的都是尽可能描述和计算两个对象之间的相似度。\n[0005] 根据是否使用相关的角色信息,可以将标注模型分为局部模型和全局模型。目前,多数基于句法成分的语义角色标注系统是采用局部模型,直接对各个句法成分的角色进行分类。局部模型没有考虑到成分角色的依赖关系,各个成分的角色标注过程相互独立。全局模型则在局部推导的基础上,考虑角色间的依赖关系,通过相关约束条件,从而得到较合理的角色组合。全局模型可分为两种:(1)在后处理步骤考虑语义角色全局信息,如利用角色间的约束条件,利用贪心策略保留约束的语义角色。(2)在分类的过程中考虑语义角色全局信息,如利用最大熵马尔科夫模型进行序列标注,此方法可得到更多的上下文信息。但会出现标注偏置问题而影响最终的性能。\n[0006] 实际上,语义角色的确定依赖于与之同谓词的其它结点的角色,是一个协同互动、相互制约的一个过程。如果将这个问题从整体上考虑进而研究一体化的语义标注将有可能取得更好的效果,值得我们深入研究。\n[0007] 考虑到同一文本语境中各歧义实体之间通过语义协同互动而最终突显出该语境整体语义的这一特点,我们可以采用哈肯教授提出的协同神经网络处理语义标注问题。把语义标注过程看成是语境整体语义的形成过程:语境中各歧义实体被加入到集合中,它们的不同语义参与竞争,最终具有最强初始支撑的序参量赢得胜利,驱使系统呈现原先缺少的特征,并最终突显出整个语境的整体语义,在此过程中各歧义实体的意义也得以确定。\n[0008] 协同神经网络方法的优点之一是有较强的抗噪声和抗缺损能力,因而采用这种方法来实现语义标注将可以较好地处理语义标注时上下文信息不完整的模糊匹配的问题。协同模式识别方法目前已经被成功用在人脸识别、自动控制等领域,语义标注问题本质上也可以考虑为一个模式识别问题,因此也完全有可能采用此方法加以解决。本发明将协同神经网络用于语义角色标注。\n[0009] 中国专利CN101446942公开一种自然语言句子的语义角色标注方法,采用联合学习模型,同时实现中文句法分析和语义角色标注。通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。\n发明内容\n[0010] 本发明的目的在于针对现有的利用机器学习算法进行的语义角色标注系统所存在的问题和缺点,提供可使语义标注有更高的标注性能的一种基于协同神经网络的语义角色标注方法。\n[0011] 本发明包括以下步骤:\n[0012] 1)从训练语料和测试语料中抽取特征,并构造相应的语义特征向量;\n[0013] 2)对语义特征向量进行核变换,并在此基础上构造原型模式和待测试模式;\n[0014] 3)构造序参量,对每个依存成分求若干个侯选角色;\n[0015] 4)构建谓词库,对每个谓词对应的所有依存成分的候选角色进行组合,得到各个谓词的角色链;\n[0016] 5)优化网络参数,进行协同神经网络的动力学演化,从而得到最优角色链,并输出标注模式。\n[0017] 在步骤1)中,所述抽取特征包括基本特征和扩展特征,所述基本特征包括谓词及词性、谓词语态、当前关系、路径、关系子类框架、中心词及位置等6类特征;所述扩展特征包括句法路径、句法路径长度、句法部分路径长度、关系路径、关系部分路径、句法部分路径、谓词兄弟的依存关系链、谓词+句法路径、谓词关系、谓词的句法子类框架、谓词+中心词、谓词兄弟的中心词链、中心词词性、中心词+词性、中心词当前关系等15类特征;所述扩展特征加到基本特征中可形成更丰富有效的扩展特征空间。\n[0018] 在步骤2)中,所述对语义特征向量进行核变换的具体方法如下:采用的混合核函数可定义为: 其中λi为系数,且 ki(x,y)可根据语义特征组\n合的需要选择定义为:多项式核函数、高斯核函数、卷积核函数等,通过核函数映射对已有特征进行了组合或者分解,将低维特征空间映射到高维特征空间,降低原型向量之间的相关程度,从而提高网络的识别率;\n[0019] 所述构造原型模式可采用数学平均值方法构造原型模式,具体步骤为:\n[0020] (1)每个类别分别选取若干个有代表性的训练样本;\n[0021] (2)对每个类别分别计算原型模式。\n[0022] 与单原型模式的选择算法相比,该算法可有效地提高原型特征向量的可分性。\n[0023] 在步骤3)中,所述对每个依存成分求若干个侯选角色的具体步骤包括:\n[0024] (1)对原型模式和待测试模式构造序参量;\n[0025] (2)将序参量按大小顺序排序,得到相应的的候选角色。\n[0026] 由语义特征所构造的原型向量产生相应的序参量,序参量代表输入模型对原型模式的系数,输入模式与原型模式越接近,系数越大,序参量可视为若干特征相互比较下的综合评价。序参量的构造对于整个网络的识别性能有重要影响;\n[0027] 在步骤(1)中,所述构造序参量的方法可采用伪逆法、距离法或内积法,具体步骤如下:\n[0028] 设原型模式vk(k=1,2…)、测试模式ql(l=1,2…)和伴随模式 (k=1,2…),则vk和ql之间的序参量ξlk为:\n[0029] 若采用伪逆法,则 (l=1,2…,k=1,2…);\n[0030] 若采用距离法,则ξlk=||vk-ql||,(l=1,2…,k=1,2…);\n[0031] 若采用内积法,则 (l=1,2…,k=1,2…)。\n[0032] 在步骤4)中,所述谓词的角色链的获取方法是从每个依存成分各取一个可能角色,通过组合算法构成链。\n[0033] 在步骤5)中,所述优化网络参数的方法可采用基于量子微粒群算法的参数优化,将对训练样本的识别率作为适应度,在参数空间中搜索注意参数(λk,B,C)的最优解,λk(k=1,2…),B,C为协同神经网络的注意参数;\n[0034] 所述进行协同神经网络的动力学演化采用的动力学演化方程为:\n[0035] \n[0036] 式中ξk为序参量,λk(k=1,2…),B,C为协同神经网络的注意参数。\n[0037] 本发明的优点在于:\n[0038] 本发明提供的基于协同神经网络的语义角色标注方法,把语义标注过程看成是语境整体语义的形成过程,不同语义参与竞争,最终突显出整个语境的整体语义。该方法充分考虑到各个成分的角色之间的相互依赖性,可以获得较高的标注性能。\n[0039] 本发明首次将协同神经网络原理引入到语义角色标注中,该方法广泛适应于各种自然语言处理任务中。具有较好的应用前景和应用价值。\n附图说明\n[0040] 图1是一个句子的结构示意图,谓词含有5个待标注依存成分。\n[0041] 图2为序参量演化过程,最优的语义角色链最终被识别出来。在图2中,横坐标为迭代次数,纵坐标为序参量值;ξ(1)指表1中角色链1的序参量,ξ(5)指表1中角色链5的序参量。\n[0042] 图3为本发明的系统框架和工作流程图。\n具体实施方式\n[0043] 下面结合附图及实施方式对本发明作进一步说明:\n[0044] 序参量构造最终是由原型模式决定,所以原型模式的选择对协同神经网络的识别有着决定性的影响,也是其协同算法具有优异性能表现的基础。传统的Haken协同神经网络要求模式之间保持不相关性,但在实际处理中是不容易做到的,特别是对语义标注这种特征丰富、模式较为复杂的情形,随着越来越多的特征的加入,特征之间的相互影响越来越严重,于是我们考虑转变模式的特征空间来降低模式之间的相关性,通过基于核的方法来对特征进行了组合或分解,将低维空间映射到高维特征空间,从而将在低维空间不容易区别的问题在高维空间加以解决。\n[0045] 本发明将核方法应用到协同神经网络,提出基于混合核函数的原型向量学习算法。通过核函数映射对已有特征向量进行了组合或者分解,将低维特征空间映射到高维特征空间,降低了原型向量之间的相关程度,提高了模式的可分性。\n[0046] 算法1:核变换的原型模式和待测试模式学习算法\n[0047] 设有n个样本向量(x1,x2…xn),\n[0048] 1)在输入空间中构造向量集{y1,y2,…yn}.其中,yk=[,,…],则yk与xk一一对应。\n[0049] 2)经过非线性变换Φ映射到特征空间,对应的向量集为{z1,z2,…zn},其中,[0050] \n[0051] 这里采用的混合核函数定义为:\n[0052] \n[0053] 其中λi为系数,且 ki(x,y)可根据语义特征组合的需要选择定义为:多项式核函数、高斯核函数、卷积核函数等。通过核函数映射对已有特征进行了组合或者分解,将低维特征空间映射到高维特征空间,降低了原型向量之间的相关程度,从而提高网络的识别率。\n[0054] 序参量是输入模式和原型模式之间的相似程度。输入模式越接近原型模式,相应的序参量就越大,在竞争中获胜的可能性也就越大,所以构造序参量的好坏将很大程序上影响到识别的准确性。可采用伪逆法、距离法和内积法构造序参量。\n[0055] 竞争子网的实质是一个序参量动力学迭代过程,这个过程已经证明是收敛的。语义角色标注过程对应于一个动力学过程;协同神经网络认为模式识别过程可以理解为若干序参量的竞争过程,属于这个子系统的序参量在竞争中取胜,最后支配并使其进入这个特定的有序状态。协同神经网络序参量的势函数为:\n[0056] \n[0057] 其中,ξk满足初始化条件: 这里 为伴随向量,q(0)为原始输入。\n[0058] 从式(1)可看出,参数(λk,B,C)共同决定了协同神经网络的分类识别性能,同时对它们进行研究才能有效地提高识别性能,但目前仍没有成熟的理论来控制该参数。协同神经网络的网络参数优化是一种全局性的行为。本发明提出了一种基于量子微粒群算法的参数优化方法,将对训练样本的识别率作为适应度,在参数空间中搜索参数(λk,B,C)的最优解。\n[0059] 基于以上的思路,本发明提出了基于协同神经网络原理的语义角色标注方法。\n[0060] 算法2:基于协同神经网络原理的语义角色标注算法\n[0061] 1)从语料抽取特征,对特征样本进行核变换,构造原型模式vk(k=1,2…)、待测试模式ql(l=1,2…)和伴随模式 (k=1,2…)。\n[0062] 2)分别用三种方法求vk和ql之间的序参量ξlk:\n[0063] 伪逆法: (l=1,2…,k=1,2…)\n[0064] 距离法:ξlk=||vk-ql||,(l=1,2…,k=1,2…)\n[0065] 内积法: (l=1,2…,k=1,2…)\n[0066] 3)求ql(l=1,2…)的前N个最优侯选角色(Rl1,Rl2,…RN)\n[0067] 其中,N为自然数,如可取为5。\n[0068] 4)对ql(l=1,2…)的所有候选角色进行组合,得到谓词的角色链,并计算相应的角色链概率矩阵。\n[0069] 5)利用量子微粒群算法设置注意参数B,C和λk(k=1,2…),进行协同神经网络的动力学演化,从而得到最优角色链。\n[0070] 如图1所示的句子结构,谓词含有5个依存成分。首先求出各个依存成分的若干个侯选角色,并对所有候选角色进行组合,得到谓词的角色链。并如表1所示求出所有可能的角色链及相应的归一化概率。最后进行序参量演化,得到最优角色链。\n[0071] 表1为图1所示句子结构的每个依存成分的相应可能角色链、归一化概率及参数的设置。\n[0072] \n[0073] 序参量演化过程如图2所示。可以看出刚开始时,角色1的序参量初始值并不是最大的(角色5最大)。但通过竞争,它最终赢得了胜利。同时这个竞争过程的收敛速度比较快,在第63次迭代中趋于稳定。\n[0074] 图3为系统框架和工作流程图。\n[0075] 以上实施例仅用于说明本发明的技术方案而非限制。尽管参照实施对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等替换,都不脱离本发明技术方案的思想和范围,均应涵盖在本发明的权利要求范围当中。
法律信息
- 2018-08-03
专利权的转移
登记生效日: 2018.07.16
专利权人由厦门大学资产经营有限公司变更为深圳云译科技有限公司
地址由361000 福建省厦门市厦门大学大南2号楼变更为518000 广东省深圳市南山区粤海街道高新南环路留学生创业大厦1510室
- 2018-05-15
专利权的转移
登记生效日: 2018.04.26
专利权人由厦门大学变更为厦门大学资产经营有限公司
地址由361005 福建省厦门市思明南路422号变更为361000 福建省厦门市厦门大学大南2号楼
- 2015-03-25
- 2012-11-07
实质审查的生效
IPC(主分类): G06F 17/27
专利申请号: 201210111557.3
申请日: 2012.04.13
- 2012-09-12
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-12-08
|
2010-08-09
| | |
2
| |
2009-06-03
|
2008-12-10
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |