加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于近似查询的长序列数据降维方法

发明专利无效专利
  • 申请号:
    CN200710303987.4
  • IPC分类号:G06F17/30
  • 申请日期:
    2007-12-24
  • 申请人:
    北京大学
著录项信息
专利名称用于近似查询的长序列数据降维方法
申请号CN200710303987.4申请日期2007-12-24
法律状态撤回申报国家中国
公开/公告日2008-06-11公开/公告号CN101196921
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人北京大学申请人地址
北京市海淀区中关村 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京大学当前权利人北京大学
发明人宋国杰;谢昆青
代理机构北京市商泰律师事务所代理人毛燕生
摘要
一种面向近似性查询的长序列数据降维方法,包括利用序列嵌入技术把序列数据转化为嵌入树,并抽取出多集集合;根据嵌入树和多集集合提取出相应的多集主成份,并在此基础上提出了基于距离收敛的序列数据降维原理;基于降维性质的基础上,构造出了面向序列近似查询的索引结构,SEM-tree,并基于该索引结构基础上,利用序列距离双边界(最大上界和最小下界)原理,提出了高效的面向长序列数据的近似性查询方法。本发明可以广泛的应用于面向长序列数据的近似查询应用中,如从海量的互联网文本数据中通过相似性搜索找到查找的目标,从大规模基因数据中对基因片段进行的相似性查询与分析等。本发明而且预见能够取得明显的经济效益和社会效益。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供