加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

信息文本过滤方法及系统

发明专利有效专利
  • 申请号:
    CN201310205069.3
  • IPC分类号:G06F17/30;G06F17/27
  • 申请日期:
    2013-05-29
  • 申请人:
    中国电信股份有限公司
著录项信息
专利名称信息文本过滤方法及系统
申请号CN201310205069.3申请日期2013-05-29
法律状态授权申报国家中国
公开/公告日2014-12-17公开/公告号CN104216876A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
申请人中国电信股份有限公司申请人地址
北京市西城区金融大街31号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国电信股份有限公司当前权利人中国电信股份有限公司
发明人刘东鑫;刘国荣;沈军
代理机构中国国际贸易促进委员会专利商标事务所代理人颜镝
摘要
本发明涉及一种信息文本过滤方法及系统,方法包括:对待审核的信息文本进行预处理,获得对应的多个词语;调入语义扩展参数表,根据多个词语和语义扩展参数表将待审核的信息文本从词语空间映射到确定的主题空间;调入分类器参数,根据分类器参数对待审核的信息文本进行统计语义分析,给出对应的类别标签,并存入训练样本库。本发明通过对待审核的信息文本进行预处理、词语空间到主题空间的映射和统计语义分析,可以获得待审核的信息文本对应的类别标签,在获得了类别标签后,将类别标签连同待审核的信息文本一并存入训练样本库,自动对已审核的训练集进行扩充,实现训练样本的快速自适应学习,进而提升信息文本过滤的实用性和识别精度。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供