加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文本中不良文字信息的过滤方法及过滤系统

发明专利无效专利
  • 申请号:
    CN201511027950.4
  • IPC分类号:G06F17/27
  • 申请日期:
    2015-12-31
  • 申请人:
    武汉鸿瑞达信息技术有限公司
著录项信息
专利名称文本中不良文字信息的过滤方法及过滤系统
申请号CN201511027950.4申请日期2015-12-31
法律状态驳回申报国家中国
公开/公告日2016-04-06公开/公告号CN105468584A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人武汉鸿瑞达信息技术有限公司申请人地址
湖北省武汉市东湖新技术开发区光谷大道35号银久科技产业园一期4幢3层3号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人武汉鸿瑞达信息技术有限公司当前权利人武汉鸿瑞达信息技术有限公司
发明人高玉环;喻西香;朱山;朱光喜
代理机构北京汇信合知识产权代理有限公司代理人夏静洁
摘要
本发明涉及文本处理技术领域,具体涉及文本中不良文字信息的过滤方法及过滤系统。该过滤方法包括:步骤1,提取待过滤文本;步骤2,利用词典中词条长度动态确定最大匹配算法中词长Maxlen的值,通过Mexlen对待过滤文本进行分词;步骤3,循环判断分词后的每个词汇是否为敏感词汇,如果是敏感词汇,采用非敏感词汇替换敏感词汇后,输出替换敏感词汇后的文本。本发明解决了分词过程中MaxLen初始值不变所带来的长词被切分错误和时间长、效率低的问题。随后对分词后的词串进行敏感判断,并根据判断结果输出文本。由于采用了改进的分词方式,因此提高了整体过滤速度和过滤准确度。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供