加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于字典学习的氨基酸序列特征提取方法

发明专利有效专利
  • 申请号:
    CN202110143746.8
  • IPC分类号:G16B30/00;G06K9/62;G16B40/00
  • 申请日期:
    2021-02-02
  • 申请人:
    杭州电子科技大学
著录项信息
专利名称一种基于字典学习的氨基酸序列特征提取方法
申请号CN202110143746.8申请日期2021-02-02
法律状态实质审查申报国家中国
公开/公告日2021-06-04公开/公告号CN112908418A
优先权暂无优先权号暂无
主分类号G16B30/00IPC分类号G;1;6;B;3;0;/;0;0;;;G;0;6;K;9;/;6;2;;;G;1;6;B;4;0;/;0;0查看分类表>
申请人杭州电子科技大学申请人地址
浙江省杭州市下沙高教园区2号大街 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人杭州电子科技大学当前权利人杭州电子科技大学
发明人葛瑞泉;黄润根;王普;贾刚勇;程雨夏;徐岗
代理机构杭州君度专利代理事务所(特殊普通合伙)代理人杨舟涛
摘要
本发明公开了一种基于字典学习的氨基酸序列特征提取方法。本发明首先给定一种AAindex,每条氨基酸肽序列数据都可用P=R1R2......RL表示,通过给定的AAindex,可将上述序列编码成PE=E1E2......EL。其中Ei为氨基酸残基的Ri的属性值;接着,对肽序列使用n‑gram模型分解成单词并分割成不同长度的片段,之后对同一长度的片段聚类生成字典;最后将样本基于欧氏距离的词频学习字典的特征构成样本特征矩阵。本发明能够有效的对氨基酸序列进行特征提取,实现降维,得到氨基酸中潜在的规律,特征选择的结果对样本类别判定具有重要意义,有效提高样本类别判定的准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供