加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种文档分类方法及装置

发明专利有效专利
  • 申请号:
    CN201210273212.8
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-08-02
  • 申请人:
    北京百度网讯科技有限公司
著录项信息
专利名称一种文档分类方法及装置
申请号CN201210273212.8申请日期2012-08-02
法律状态授权申报国家中国
公开/公告日2014-02-12公开/公告号CN103577462A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人北京百度网讯科技有限公司申请人地址
北京市海淀区上地十街10号百度大厦2层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京百度网讯科技有限公司当前权利人北京百度网讯科技有限公司
发明人徐兴军
代理机构北京鸿德海业知识产权代理事务所(普通合伙)代理人袁媛
摘要
本发明公开了一种文档分类方法及装置。一种文档分类方法包括以下步骤:提取目标文档的特征文本,利用所述特征文本构成搜索条件;利用所述搜索条件进行搜索,得到相应的搜索结果;计算所述目标文档与搜索结果的文本相似度;根据计算得到的文本相似度以及搜索结果的分类信息,得到所述目标文档的分类结果。本发明方案基于文本之间的相似性,利用已有的文档分类信息对新文档进行分类,由于文本内容相似的文档属于相同分类的概率很大,因此通过对与当前文本内容相似的文本所属类别进行统计,可以得到置信度较高的分类结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供