加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于查询接口连接图的深层网页数据源分类管理方法

发明专利无效专利
  • 申请号:
    CN200810024251.8
  • IPC分类号:G06F17/30
  • 申请日期:
    2008-05-16
  • 申请人:
    崔志明;赵朋朋;方巍
著录项信息
专利名称基于查询接口连接图的深层网页数据源分类管理方法
申请号CN200810024251.8申请日期2008-05-16
法律状态权利终止申报国家中国
公开/公告日2008-12-10公开/公告号CN101320370
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人崔志明;赵朋朋;方巍申请人地址
江苏省苏州市沧浪区解放新村5幢403室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人束兰当前权利人束兰
发明人崔志明;赵朋朋;方巍
代理机构苏州创元专利商标事务所有限公司代理人陶海锋
摘要
本发明公开了一种基于查询接口连接图的深层网页数据源分类管理方法,包括下列步骤:(1)获取深层网页查询接口表单集合;(2)自动抽取步骤(1)获取的查询接口表单的特征值,所述特征值包括表单标签的名称以及属性值;(3)构造表单特征向量;(4)在步骤(3)获得的向量集合中,对每个向量之间通过相似性比较获得关于标签、属性值、标签与属性值组合的关联邻接矩阵;(5)构造查询接口表单集合的连接图,可用关联邻接矩阵表示;(6)利用聚类方法对带权无向图进行聚类;(7)获得深层网页数据源聚类结果。本发明通过有效构造深层网页数据源查询接口连接图,结合图挖掘技术,提高了大规模深层网页数据源自动分类管理的性能。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供