加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于信息增益改进贝叶斯词义消歧方法

发明专利无效专利
  • 申请号:
    CN200810058518.5
  • IPC分类号:G06F17/27
  • 申请日期:
    2008-06-12
  • 申请人:
    昆明理工大学
著录项信息
专利名称基于信息增益改进贝叶斯词义消歧方法
申请号CN200810058518.5申请日期2008-06-12
法律状态驳回申报国家中国
公开/公告日2008-10-29公开/公告号CN101295294
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人昆明理工大学申请人地址
云南省昆明市五华区学府路253号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人昆明理工大学当前权利人昆明理工大学
发明人余正涛;邓宾;韩露;郭剑毅;车文刚
代理机构昆明正原专利代理有限责任公司代理人金耀生
摘要
本发明提出了一种基于信息增益改进贝叶斯词义消歧方法。该方法采用“知网”(HowNet)作为消歧资源,通过知网中的义项来描述和区分词在上下文中的词义,利用人民日报标注语料库,对歧义词进行词义义项标注,构建了词义消歧语料库。采用信息增益方法对语料进行统计,计算出歧义词上下文不同位置信息增益值,根据信息增益值选取影响岐义词前后6个位置词构建词义消歧特征向量,采用贝叶斯算法,通过信息增益为特征向量12维特征赋予不同的权重值,构建了改进贝叶斯词义消歧模型。对10个汉语常用歧义词进行消歧测试实验,结果证明该方法有效,其中封闭测试正确率达95.72%,开放测试正确率达85.71%。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供