加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于关键词的垃圾文档过滤方法和装置

发明专利无效专利
  • 申请号:
    CN201210563248.X
  • IPC分类号:G06F17/30;G06F17/28
  • 申请日期:
    2012-12-21
  • 申请人:
    北京二六三企业通信有限公司
著录项信息
专利名称基于关键词的垃圾文档过滤方法和装置
申请号CN201210563248.X申请日期2012-12-21
法律状态撤回申报国家暂无
公开/公告日2013-04-24公开/公告号CN103064928A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;8查看分类表>
申请人北京二六三企业通信有限公司申请人地址
北京市朝阳区和平里东土城路14号建达大厦17层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京二六三企业通信有限公司当前权利人北京二六三企业通信有限公司
发明人黄福昌;田飞;李雪明
代理机构北京同立钧成知识产权代理有限公司代理人臧建明
摘要
本发明提供一种基于关键词的垃圾文档过滤方法和装置。其中,垃圾文档过滤方法包括:获取待检查的中文文档,将中文文档中的中文字符转换成拼音字符,得到拼音文档,根据中文关键词对应的拼音,对拼音文档进行匹配,若拼音文档中的拼音字符与中文关键词对应的拼音匹配,则将待检查的中文文档确定为垃圾文档。由于一个拼音关键词可对应多个中文关键词,减少关键词的数量,从而提高关键词匹配效率;而且拼音关键词还可以与中文关键词同音的没有列举出来的其他中文关键词进行对应,从而提高了垃圾文档识别率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供