加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于逻辑和统计技术的数据元识别方法

发明专利有效专利
  • 申请号:
    CN201310330181.X
  • IPC分类号:G06F17/30;G06F17/27
  • 申请日期:
    2013-07-31
  • 申请人:
    克拉玛依红有软件有限责任公司
著录项信息
专利名称一种基于逻辑和统计技术的数据元识别方法
申请号CN201310330181.X申请日期2013-07-31
法律状态暂无申报国家暂无
公开/公告日2015-02-11公开/公告号CN104346379A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
申请人克拉玛依红有软件有限责任公司申请人地址
新疆维吾尔自治区克拉玛依市长征路22号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人红有软件股份有限公司当前权利人红有软件股份有限公司
发明人谭远华;朱平;杨雪
代理机构北京市盛峰律师事务所代理人赵建刚
摘要
本发明涉及数据识别技术领域,具体公开了一种基于逻辑和统计技术的数据元识别方法;包括:客户端提交待测试语料的数据处理请求,用计算机统计数据元库中数据的长度特征以及数据元结构的词法规则,根据数据的长度特征对数据进行分类,分别总结不同分类下的数据元结构的词法规则,用词法分析工具对待测试语料中的数据进行分词及词性标注处理,并用长度特征和词法规则从测试语料中抽取出候选数据元;统计候选数据元在测试语料中的分布情况,将候选数据元逐步划分到数据元和非数据元两个类别;分别用过滤子串算法、短语搭配检验并结合词汇活跃度进行过滤,再计算领域相关度,再将短语按领域相关度从大到小排序。本发明解决了数据元识别自动化的问题。

专利服务由北京酷爱智慧知识产权代理公司提供