加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种新的融合遗传信息的蛋白质训练集非平衡问题的解决方法

发明专利无效专利
  • 申请号:
    CN201510382703.X
  • IPC分类号:G06F19/24
  • 申请日期:
    2015-07-03
  • 申请人:
    景德镇陶瓷学院
著录项信息
专利名称一种新的融合遗传信息的蛋白质训练集非平衡问题的解决方法
申请号CN201510382703.X申请日期2015-07-03
法律状态权利终止申报国家暂无
公开/公告日2015-09-09公开/公告号CN104899478A
优先权暂无优先权号暂无
主分类号G06F19/24IPC分类号G;0;6;F;1;9;/;2;4查看分类表>
申请人景德镇陶瓷学院申请人地址
江西省景德镇市珠山区新厂陶阳南路27号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人景德镇陶瓷大学当前权利人景德镇陶瓷大学
发明人肖绚;刘子
代理机构暂无代理人暂无
摘要
本发明提供一种新的融合遗传信息的蛋白质训练集非平衡问题的解决方法,将蛋白质P序列中的保守区氨基酸不变,非保守区域氨基酸按照其PSSM矩阵突变为其它氨基酸概率的大小依次转换成其它氨基酸,这样就可以得到20条含有蛋白质P遗传信息的虚拟蛋白质,对非平衡的数据集中数量少的子集进行扩大,使得非平衡数据集变为平衡数据集,有利于训练相关预测器,可提高预测器的预测成功率。本发明与现有解决非平衡数据方法不同,能融合蛋白质进化信息,直接从序列上进行扩展,而不是在描述序列信息的离散数字模型中进行插值,具有明显的生物学意义,所以能明显提高相关预测器的预测成功率,具有广阔的运用空间。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供