加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文本内容过滤方法和系统

发明专利无效专利
  • 申请号:
    CN200610113592.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2006-10-08
  • 申请人:
    中国科学院软件研究所
著录项信息
专利名称文本内容过滤方法和系统
申请号CN200610113592.3申请日期2006-10-08
法律状态权利终止申报国家中国
公开/公告日2008-04-09公开/公告号CN101158948
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中国科学院软件研究所申请人地址
北京市海淀区中关村南四街4号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院软件研究所当前权利人中国科学院软件研究所
发明人应凌云;苏璞睿;冯登国
代理机构北京君尚知识产权代理事务所代理人冯艺东
摘要
一种文本内容过滤方法,包括步骤:1)解析用户配置信息,提取出其中的有效过滤规则;2)根据所述的有效过滤规则,对被过滤文本信息进行分析和检测;3)对步骤2)的分析结果进行精确关键字匹配检测,输出检测结果;4)对步骤2)的分析结果进行模糊关键字匹配检测,输出检测结果;5)对步骤2)和4)的分析检测结果进行文本主题检测,确定被过滤文本内容的主题,输出检测结果。本发明在提供细粒度的精确关键字过滤支持、有限的模糊关键字过滤支持和基于主题的粗粒度过滤支持的同时,通过分离重组三种过滤方式的文本内容扫描前端,只需要对被过滤文本做一次全文扫描,可以大大降低文本过滤所需处理时间。

专利服务由北京酷爱智慧知识产权代理公司提供