著录项信息
专利名称 | 基于圆周统计的蛋白质折叠的表征方法及系统 |
申请号 | CN201310683271.7 | 申请日期 | 2013-12-12 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-04-09 | 公开/公告号 | CN103714264A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F19/16 | IPC分类号 | G;0;6;F;1;9;/;1;6查看分类表>
|
申请人 | 深圳先进技术研究院 | 申请人地址 | 广东省深圳市南山区西丽大学城学苑大道1068号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 深圳先进技术研究院 | 当前权利人 | 深圳先进技术研究院 |
发明人 | 魏彦杰;张慧玲;彭丰斌;孟金涛;冯圣中 |
代理机构 | 深圳市科进知识产权代理事务所(普通合伙) | 代理人 | 沈祖锋;郝明琴 |
摘要
本发明涉及生物信息学技术领域,特别涉及一种基于圆周统计的蛋白质折叠的表征方法及系统。本发明的方法基于圆周统计对蛋白质折叠进行表征,高效、准确,即可以更快研究蛋白质的折叠,也可以更准确描述蛋白质动态变化,从而研究相关神经退行性疾病的机理。
基于圆周统计的蛋白质折叠的表征方法及系统\n【技术领域】\n[0001] 本发明涉及生物信息学技术领域,特别涉及一种基于圆周统计的蛋白质折叠的表征方法及系统。\n【背景技术】\n[0002] 神经退行性疾病给人类造成了巨大的社会和经济负担。比较常见的神经退行性疾病有老年痴呆、帕金森氏病、小脑萎缩症、多聚谷氨酰胺疾病等。美国500多万老年痴呆症患者每年的花费是1830亿美元;而中国的老年痴呆症患者也在500-600万之间。研究发现蛋白质折叠的研究对探索神经退行性疾病的致病机理意义重大;而且因有助于蛋白质分子药物的设计,蛋白质折叠研究对“折叠病”的预防和治疗也将起到重大的帮助作用。\n[0003] 传统的蛋白质折叠的研究是基于笛卡尔坐标系;用该坐标系表示蛋白需要更多的变量;用角度坐标系来表示和研究蛋白质折叠也比较常用,但是由于角度周期性的特点,该方法的研究受到一些局限,效率和准确率均较低。因此,提出一种新的方法研究蛋白质折叠,提供效率及准确性,即可以更快研究蛋白质的折叠,也可以更准确描述蛋白质动态变化,从而研究相关神经退行性疾病的机理,成为亟待解决的问题。\n【发明内容】\n[0004] 本发明的目的在于针对现有技术的上述缺陷,提供一种基于圆周统计的蛋白质折叠的表征方法,解决现有技术中蛋白质折叠研究效率和准确率较低的技术问题。\n[0005] 本发明的目的可通过以下技术措施来实现:\n[0006] 一种基于圆周统计的蛋白质折叠的表征方法,包括如下步骤:\n[0007] 步骤1:建立第一圆周统计模型,用角度方差V(a)=1-R(a)表征热动力学涨落;建立第二圆周统计模型,用角度协方差 表征热动力学涨落;\n[0008] 步骤2:用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中两侧链之间的氢键、两主链之间的氢键及两侧链之间的二硫键进行热动力学涨落分析;\n[0009] 步骤3:将待研究蛋白的能量力场分割为侧链与主链的相互作用能量Es-b、不同侧链之间的相互作用能量Es-s、不同主链之间的相互作用能量Eb-b;分析主链上第m个氨基酸残基和第n个氨基酸残基之间的侧链相互作用能量 的涨落,当涨落值大于预设链相互作用能量热涨落阈值时,对第m个氨基酸残基和第n个氨基酸残基进行标记;\n[0010] 步骤4:分别用第一圆周统计模型和第二圆周统计模型分析不同侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征。\n[0011] 优选地,在步骤1之前还包括如下步骤:\n[0012] 导入一条待研究蛋白质序列的构型,给出氨基酸残基个数,识别主链及侧链,并分别对主链和侧链进行编号,分别设定氢键热涨落、链相互作用能量热涨落及二面角相互作用热涨落的阈值。\n[0013] 优选地,所述方法还包括如下步骤:\n[0014] 将待研究蛋白质的侧链分类亲水侧链和疏水侧链,并分别对亲水侧链和疏水侧链进行标记,分别用第一圆周统计模型和第二圆周统计模型分析不同亲水侧链之间的二面角相互作用热涨落、亲水侧链与疏水侧链之间的二面角相互作用热涨落、不同疏水侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征。\n[0015] 优选地,所述方法还包括:用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中不同亲水侧链之间的二面角相互作用、亲水侧链与疏水侧链之间的二面角相互作用、不同疏水侧链之间的二面角相互作用进行热动力学涨落分析。\n[0016] 优选地,所述步骤3还包括:\n[0017] 对待研究蛋白质序列上每个氨基酸残基进行编号,分析不同氨基酸残基之间的不同侧链、不同主链或侧链和主链之间的相互作用能量涨落。\n[0018] 本发明还提供了一种基于圆周统计的蛋白质折叠的表征系统,包括:\n[0019] 模型建立模块,用于建立第一圆周统计模型和第二圆周统计模型,所述第一圆周统计模型用角度方差V(a)=1-R(a)表征热动力学涨落;所述第二圆周统计模型用角度协方差 表征热动力学涨落;\n[0020] 化学键热涨落分析模块,用于用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中两侧链之间的氢键、两主链之间的氢键及两侧链之间的二硫键进行热动力学涨落分析;\n[0021] 能量热涨落分析模块,用于将待研究蛋白的能量力场分割为侧链与主链的相互作用能量Es-b、不同侧链之间的相互作用能量Es-s、不同主链之间的相互作用能量Eb-b;以及[0022] 分析主链上第m个氨基酸残基和第n个氨基酸残基之间的侧链相互作用能量的涨落,当涨落值大于预设链相互作用能量热涨落阈值时,对第m个氨基酸残基和第n个氨基酸残基进行标记;\n[0023] 二面角相互作用热涨落分析模块,用于分别用第一圆周统计模型和第二圆周统计模型分析不同侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;以及\n[0024] 当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征。\n[0025] 优选地,所述系统还包括:\n[0026] 预处理模块,用于导入一条待研究蛋白质序列的构型,给出氨基酸残基个数,识别主链及侧链,并分别对主链和侧链进行编号,分别设定氢键或二硫键热涨落、链相互作用能量热涨落及二面角相互作用热涨落的阈值。\n[0027] 优选地,所述二面角相互作用热涨落分析模块还用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中不同亲水侧链之间的二面角相互作用、亲水侧链与疏水侧链之间的二面角相互作用、不同疏水侧链之间的二面角相互作用进行热动力学涨落分析。\n[0028] 本发明的有益效果在于,本发明的方法基于圆周统计对蛋白质折叠进行表征,高效、准确,即可以更快研究蛋白质的折叠,也可以更准确描述蛋白质动态变化,从而研究相关神经退行性疾病的机理。\n【附图说明】\n[0029] 图1是本发明实施例的基于圆周统计的蛋白质折叠的表征方法的流程图;\n[0030] 图2是本发明实施例的基于圆周统计的蛋白质折叠的表征系统的结构框图。\n【具体实施方式】\n[0031] 为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。\n[0032] 本发明利用圆周统计对蛋白质折叠进行表征,高效、准确,即可以更快研究蛋白质的折叠,也可以更准确描述蛋白质动态变化,从而研究相关神经退行性疾病的机理。\n[0033] 本发明实施例还提供了一种基于圆周统计的蛋白质折叠的表征方法,如图1所示,包括如下步骤:\n[0034] 步骤S101,预处理步骤:\n[0035] 导入一条待研究蛋白质序列的构型,给出氨基酸残基个数,识别主链及侧链,并分别对主链和侧链进行编号,分别设定氢键热涨落、链相互作用能量热涨落及二面角相互作用热涨落的阈值;\n[0036] 步骤S102,建立两种圆周统计模型:\n[0037] 建立第一圆周统计模型,用角度方差V(a)=1-R(a)表征热动力学涨落;建立第二圆周统计模型,用角度协方差 表征热动力学涨落;\n[0038] 相比于线性统计学,圆周统计学更适用于解决蛋白质折叠表征的技术问题。但是圆周统计方差和协方差的数学模型在蛋白质折叠研究中还存在不一致性,具体分析如下:\n圆周统计中角度α可以用二维向量表示为 角度方差可以用来研究蛋白质折叠过程中物理量的热动力学涨落,其公式为:\n[0039] v(a)=1-R(a) (E1.1)\n[0040] 其中R2(a)=2+2<1,尖括号表示平均值。圆周统计的协方差可以表示两个角度在蛋白质折叠过程中的相互影响,其数学模型表示为:\n[0041]\n[0042] 由此导出的方差为:\n[0043]\n[0044] 两个方差的公式E1.1和E1.3不一致,因此圆周统计方差和协方差之间在研究蛋白质的二面角时存在不一致性,圆周统计的协方差和方差之间不存在线性统计中的对应关系。\n[0045] 目前蛋白质侧链的研究方法都仅局限于某一个特性,并没有从多角度系统地分析每个侧链、侧链与侧链之间作用、侧链与主链之间作用对蛋白质折叠的影响。\n[0046] 本实施例所提供的方法解决侧链物理量(氢键、能量、二面角等)的热动力学涨落和涨落关联分析问题等,并系统分析侧链氢键、侧链能量、侧链两面角涨落等在蛋白质误叠和聚集中的作用。\n[0047] 步骤S103:化学键的热力学涨落分析:\n[0048] 用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中两侧链之间的氢键、两主链之间的氢键及两侧链之间的二硫键进行热动力学涨落分析;\n[0049] 具体地,本实施例的方法将用混合方法研究氢键:氢键既要满足结合能条件,又要满足氢键原子之间的几何关系。通过计算蛋白质折叠过程中的氢键数目,本实施例将分析氢键的热动力学涨落对蛋白质折叠的影响。\n[0050] 步骤S104:侧链的相互作用能力分析:\n[0051] 将待研究蛋白的能量力场分割为侧链与主链的相互作用能量Es-b、不同侧链之间的相互作用能量Es-s、不同主链之间的相互作用能量Eb-b;分析主链上第m个氨基酸残基和第n个氨基酸残基之间的侧链相互作用能量 的涨落,当涨落值大于预设链相互作用能量热涨落阈值时,对第m个氨基酸残基和第n个氨基酸残基进行标记;\n[0052] 步骤S105:二面角相互作用热涨落分析:\n[0053] 分别用第一圆周统计模型和第二圆周统计模型分析不同侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征。\n[0054] 具体地,步骤S105还将待研究蛋白质的侧链分类亲水侧链和疏水侧链,并分别对亲水侧链和疏水侧链进行标记,分别用第一圆周统计模型和第二圆周统计模型分析不同亲水侧链之间的二面角相互作用热涨落、亲水侧链与疏水侧链之间的二面角相互作用热涨落、不同疏水侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征。\n[0055] 表1氨基酸化学性质分类\n[0056]\n氨基和羟基数目不同 中性,酸性,碱性氨基酸\n氨基酸极性 非极性,极性氨基酸\n亲水性/疏水性 亲水氨基酸,疏水氨基酸\n电荷 正电/负电/中性氨基酸\n芳香族 芳香族/非芳香族氨基酸\n侧链可否形成氢键 (不)可形成氢键氨基酸\n[0057] 用圆周统计方法研究侧链物理量的热动力学涨落和涨落关联。圆周统计的协方差和方差之间不存在线性统计中的对应关系;本专利将研究圆周统计方差和协方差研究物理量涨落和涨落关联时存在的不一致性问题。本专利将用两种不同的圆周统计模型研究蛋白质侧链。对于角度α,第一种模型中方差和协方差可表示为:\n[0058] Vd(a)=1-R2(a) (E3.4)\n[0059]\n[0060] 第二种模型中方差和协方差可表示为:\n[0061]\n[0062]\n[0063] 其中 可从平均方向 推出。方差(E3.4)可以更好揭\n示涨落较小时的情况,而方差Vd(a)=1-R(a)可更好处理涨落较大时的情况,因此我们也将用Vd(a)=1-R(a)研究热动力学涨落。我们将分析这两种模型在研究蛋白质物理量的热动力学涨落时的区别,揭示它们和蛋白质折叠的物理意义之间的关系,从而建立适合蛋白质折叠研究的圆周统计方法。\n[0064] 进一步地,所述方法还包括:用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中不同亲水侧链之间的二面角相互作用、亲水侧链与疏水侧链之间的二面角相互作用、不同疏水侧链之间的二面角相互作用进行热动力学涨落分析。\n[0065] 进一步地,所述步骤S104还包括:对待研究蛋白质序列上每个氨基酸残基进行编号,分析不同氨基酸残基之间的不同侧链、不同主链或侧链和主链之间的相互作用能量涨落。\n[0066] 与上述方法相对应地,本发明实施例还提供了一种基于圆周统计的蛋白质折叠的表征系统,如图2所示,包括:预处理模块100、模型建立模块200、化学键热涨落分析模块\n300、能量热涨落分析模块400和二面角相互作用热涨落分析模块500。\n[0067] 其中,预处理模块100导入一条待研究蛋白质序列的构型,给出氨基酸残基个数,识别主链及侧链,并分别对主链和侧链进行编号,分别设定氢键或二硫键热涨落、链相互作用能量热涨落及二面角相互作用热涨落的阈值。\n[0068] 模型建立模块200建立第一圆周统计模型和第二圆周统计模型,所述第一圆周统计模型用角度方差V(a)=1-R(a)表征热动力学涨落;所述第二圆周统计模型用角度协方差表征热动力学涨落;\n[0069] 化学键热涨落分析模块300用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中两侧链之间的氢键、两主链之间的氢键及两侧链之间的二硫键进行热动力学涨落分析;\n[0070] 能量热涨落分析模块400将待研究蛋白的能量力场分割为侧链与主链的相互作用能量Es-b、不同侧链之间的相互作用能量Es-s、不同主链之间的相互作用能量Eb-b;以及[0071] 分析主链上第m个氨基酸残基和第n个氨基酸残基之间的侧链相互作用能量的涨落,当涨落值大于预设链相互作用能量热涨落阈值时,对第m个氨基酸残基和第n个氨基酸残基进行标记;\n[0072] 二面角相互作用热涨落分析模块500分别用第一圆周统计模型和第二圆周统计模型分析不同侧链之间的二面角相互作用热涨落;当涨落值大于预设二面角相互作用热涨落阈值时,采用第一圆周统计模型表征;\n[0073] 当涨落值小于预设二面角相互作用热涨落阈值时,采用第二圆周统计模型表征;\n以及\n[0074] 用第一圆周统计模型或第二圆周统计模型对待研究蛋白质序列构型中不同亲水侧链之间的二面角相互作用、亲水侧链与疏水侧链之间的二面角相互作用、不同疏水侧链之间的二面角相互作用进行热动力学涨落分析。\n[0075] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
法律信息
- 2017-05-10
- 2014-05-07
实质审查的生效
IPC(主分类): G06F 19/16
专利申请号: 201310683271.7
申请日: 2013.12.12
- 2014-04-09
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-08-06
|
2008-02-27
| | |
2
| |
2007-12-05
|
2007-06-01
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |