加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种用于文本或网络内容分析的多关键词匹配方法

发明专利有效专利
  • 申请号:
    CN200610000801.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2006-01-13
  • 申请人:
    清华大学
著录项信息
专利名称一种用于文本或网络内容分析的多关键词匹配方法
申请号CN200610000801.3申请日期2006-01-13
法律状态授权申报国家中国
公开/公告日2006-07-12公开/公告号CN1801152
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人清华大学申请人地址
北京市海淀区清华园 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人清华大学当前权利人清华大学
发明人余建明;李军
代理机构北京清亦华知识产权代理事务所代理人罗文群
摘要
本发明涉及一种用于文本或网络内容分析的多关键词匹配方法,属于文本或网络内容处理技术领域。首先根据待匹配的关键词,建立以状态为节点的有限状态自动机,并记录关键词中的字符;根据字符对上述有限状态自动机进行转换,得到以字符为节点的有限状态自动机,节点总数为m+1,m为上述关键词中的字符数;将待匹配的文本或网络数据流作为以字符为节点的有限状态自动机的输入,与关键词进行匹配。本发明方法与已有的AC方法相比,没有引入任何附加计算。当关键词集合中所出现的字符数量少于最大可能字符数时,可以大大降低内存空间消耗。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供