加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种大规模关键词匹配方法

发明专利无效专利
  • 申请号:
    CN200710122231.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2007-09-24
  • 申请人:
    北京启明星辰信息技术有限公司
著录项信息
专利名称一种大规模关键词匹配方法
申请号CN200710122231.X申请日期2007-09-24
法律状态权利终止申报国家暂无
公开/公告日2009-04-01公开/公告号CN101398820
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人北京启明星辰信息技术有限公司申请人地址
北京市海淀区东北旺西路8号中关村软件园21号启明星辰大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京启明星辰信息技术股份有限公司当前权利人北京启明星辰信息技术股份有限公司
发明人叶润国;周涛;华东明;孙海波;骆拥政;焦玉峰
代理机构北京市商泰律师事务所代理人毛燕生
摘要
一种大规模关键词匹配方法。包括预处理阶段和模式匹配阶段。预处理阶段包括关键词特征串裁剪、基于关键词特征串集合的多个简单布隆过滤器(BloomFilter)的构造,基于关键词特征串集合的哈希表构造;模式匹配阶段包括:利用先前构造的简单布隆过滤器序列实现当前窗口中文本串不与任何关键词特征串匹配的快速判定;在判定失败情况下执行与候选关键词的精确匹配;文本扫描过程中,可以利用递归算法快速计算出当前文本相对于各简单布隆过滤器的当前散列值。本发明充分利用了待匹配文本与关键词匹配成功概率异常低的特点,利用了递归散列算法高效的特点,可实现大规模关键词场景下的高速匹配,非常适合病毒检测等在线病毒扫描应用。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供