加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于语义词网络的短文本主题挖掘方法

发明专利有效专利
  • 申请号:
    CN201910400416.5
  • IPC分类号:G06F40/258;G06F40/30;G06F40/284
  • 申请日期:
    2019-05-14
  • 申请人:
    南京大学
著录项信息
专利名称一种基于语义词网络的短文本主题挖掘方法
申请号CN201910400416.5申请日期2019-05-14
法律状态授权申报国家中国
公开/公告日2019-08-16公开/公告号CN110134958A
优先权暂无优先权号暂无
主分类号G06F40/258IPC分类号G;0;6;F;4;0;/;2;5;8;;;G;0;6;F;4;0;/;3;0;;;G;0;6;F;4;0;/;2;8;4查看分类表>
申请人南京大学申请人地址
江苏省南京市鼓楼区汉口路22号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人南京大学当前权利人南京大学
发明人张雷;经伟;蔡洋;陆恒杨;徐鸣;王崇骏
代理机构南京瑞弘专利商标事务所(普通合伙)代理人刘珊珊
摘要
本发明公开了一种基于语义词网络的短文本主题挖掘方法,包括如下步骤1)模型初始化阶段:相关领域外部语料收集、语料预处理、参数设置等;2)主题单元构建阶段:构建语义词网络、寻找特定词三角结构、计算模型先验参数等工作;3)模型训练阶段:使用吉布斯采样方法对模型变量进行采样,并判断模型是否达到收敛条件;4)结果输出阶段:根据模型训练结束后的各个变量的采样结果,得到各个词三角的主题分布,进而推算出原文档的主题分布。本发明将外部语料库学习到的语义信息与词三角主题结构相结合,应用于短文本主题挖掘方面,相对于传统词对主题模型,该方法提供了一个在传统主题模型中融入外部先验知识的解决方案,并且挖掘主题的质量具有显著提升。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供