加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于支撑向量机的Web划分方法

发明专利无效专利
  • 申请号:
    CN201110232192.5
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-08-15
  • 申请人:
    哈尔滨工业大学
著录项信息
专利名称一种基于支撑向量机的Web划分方法
申请号CN201110232192.5申请日期2011-08-15
法律状态撤回申报国家中国
公开/公告日2011-11-23公开/公告号CN102254040A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人哈尔滨工业大学申请人地址
黑龙江省哈尔滨市南岗区西大直街92号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人哈尔滨工业大学当前权利人哈尔滨工业大学
发明人张伟哲;张宏莉;何慧;邸文晨;魏一帆
代理机构暂无代理人暂无
摘要
本发明提供了一种基于支撑向量机的Web划分方法,本发明的方法:将所有Web站点划分为N组;取K=1,2,3…N,对每个K的值,选取其中第1~K-1,K+1~N组Web站点样本,进行对LibSvm训练初始化;进行LibSVM训练;存储训练好的SVM模型;选取第K组Web站点样本,进行Web划分测试;Web划分测试结果保存。本发明SVM泛化能力强,在处理噪音较大数据时能够很好容错和分类。通过网络坐标系统建立的坐标准确率在80%左右,SVM可以解决非线性分类问题,SVM分类个数固定,避免网站没有爬虫爬取的极端情况,用分类算法克服了聚类算法中划分集合个数的不确定性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供