路标网共为您找到相关结果1个
基于查询接口连接图的深层网页数据源分类管理方法
发明专利无效专利摘要:本发明公开了一种基于查询接口连接图的深层网页数据源分类管理方法,包括下列步骤:(1)获取深层网页查询接口表单集合;(2)自动抽取步骤(1)获取的查询接口表单的特征值,所述特征值包括表单标签的名称以及属性值;(3)构造表单特征向量;(4)在步骤(3)获得的向量集合中,对每个向量之间通过相似性比较获得关于标签、属性值、标签与属性值组合的关联邻接矩阵;(5)构造查询接口表单集合的连接图,可用关联邻接矩阵表示;(6)利用聚类方法对带权无向图进行聚类;(7)获得深层网页数据源聚类结果。本发明通过有效构造深层网页数据源查询接口连接图,结合图挖掘技术,提高了大规模深层网页数据源自动分类管理的性能。
*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供