加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

获取网页关键字的方法及其应用系统

发明专利有效专利
  • 申请号:
    CN200610112462.8
  • IPC分类号:H04L12/58;G06F17/30
  • 申请日期:
    2006-08-18
  • 申请人:
    北京金山软件有限公司
著录项信息
专利名称获取网页关键字的方法及其应用系统
申请号CN200610112462.8申请日期2006-08-18
法律状态暂无申报国家中国
公开/公告日2007-02-07公开/公告号CN1909522
优先权暂无优先权号暂无
主分类号H04L12/58IPC分类号H;0;4;L;1;2;/;5;8;;;G;0;6;F;1;7;/;3;0查看分类表>
申请人北京金山软件有限公司申请人地址
北京市海淀区小营西路33号金山软件大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京金山办公软件股份有限公司当前权利人北京金山办公软件股份有限公司
发明人田野;陈亮;李晶
代理机构北京集佳知识产权代理有限公司代理人逯长明
摘要
本发明公开了一种获取网页关键字的方法及其应用系统,所述方法通过对网页标题进行分词,获取网页标题词根,根据各网页标题词根在网页中出现的次数,选择出现次数多的至少一个网页标题词根作为所述网页的关键字。采用该方法可以实现快速、准确的获取网页关键字,并且该方法适用于各种类型的网站,比如,网页数量非常庞大的综合性网站或网页信息由用户发布的论坛等网站。将本发明提供的获取关键字的方法应用于网页爬抓系统,对爬抓到的网页进行分析,获取爬抓网页关键字,并将所述爬抓网页及其关键字存入数据库,根据用户需要为其提供更多可供查询的网页。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供