加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于N-gram增量主题模型的语义挖掘方法

发明专利无效专利
  • 申请号:
    CN201110201966.8
  • IPC分类号:G06F17/27
  • 申请日期:
    2011-07-19
  • 申请人:
    北京航空航天大学
著录项信息
专利名称一种基于N-gram增量主题模型的语义挖掘方法
申请号CN201110201966.8申请日期2011-07-19
法律状态权利终止申报国家中国
公开/公告日2011-11-16公开/公告号CN102243625A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人北京航空航天大学申请人地址
北京市海淀区学院路37号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京航空航天大学当前权利人北京航空航天大学
发明人王晗;徐毅;郎波;李未
代理机构北京科迪生专利代理有限责任公司代理人李新华
摘要
一种基于N-gram增量主题模型的语义挖掘方法:(1)将Author-Conference主题模型进行扩展:扩展单词空间,从Unigram到N-gram;(2)对于当前输入数据,根据之前训练模型中后验概率的线性加权计算当前模型中先验概率的参数;(3)采用吉布斯采样方法计算模型对当前数据的后验概率值;(4)对于新的输入数据流,重复步骤(2)、(3)增量训练模型。本发明将N-gram引入到主题模型中,根据N-gram包含的语义特性,提高了主题模型对科技文献建模的性能;采用非对称先验概率记录历史数据的主题分布,从而增量式地训练模型,提高了方法的效率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供