加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于自动分类技术的特定信息搜索方法

发明专利无效专利
  • 申请号:
    CN200810036369.2
  • IPC分类号:G06F17/30
  • 申请日期:
    2008-04-21
  • 申请人:
    上海大学
著录项信息
专利名称基于自动分类技术的特定信息搜索方法
申请号CN200810036369.2申请日期2008-04-21
法律状态撤回申报国家中国
公开/公告日2008-09-10公开/公告号CN101261629
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人上海大学申请人地址
上海市宝山区上大路99号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人上海大学当前权利人上海大学
发明人孟浩华;曾雪强;李国正
代理机构上海上大专利事务所代理人何文欣
摘要
本发明涉及一种基于自动分类技术的特定信息搜索方法。它是首先通过网络蜘蛛收集一些典型的网页构成训练文档集合,再对训练集合中的网页进行人工标注领域相关网页或领域非相关网页,然后利用机器学习算法在训练集合上进行建模并得到网页自动分类器;接着,再通过网络蜘蛛大量收集该领域相关网页,利用前面建立的自动分类器判别网页是否该领域相关网页,并建立基于倒排表的全文索引库将这些相关网页保存下来;最后,提供一个检索接口,方便用户从全文索引库中查询出该领域相关网页;具体操作包含以下三个模块:分类器训练模块、网页采集及索引模块和信息检索模块。本发明的方法相对于通用搜索方法来说,搜索命中率较高,重复信息较少,而且相关信息排列较靠前。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供