加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于图聚类的用户生成文本流中的突发话题检测方法

发明专利有效专利
  • 申请号:
    CN201110187138.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-07-05
  • 申请人:
    清华大学
著录项信息
专利名称一种基于图聚类的用户生成文本流中的突发话题检测方法
申请号CN201110187138.3申请日期2011-07-05
法律状态授权申报国家中国
公开/公告日2011-10-12公开/公告号CN102214241A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人清华大学申请人地址
北京市海淀区清华园1号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人清华大学当前权利人清华大学
发明人赵丽;管晓宏;袁睿翕
代理机构北京清亦华知识产权代理事务所(普通合伙)代理人廖元秋
摘要
本发明涉及一种基于图聚类的用户生成文本流中的突发话题检测方法,属于互联网数据挖掘技术领域。该方法提供了相对传统的话题检测问题的一种基于图的新视角,将在文本流中检测突发话题转化为一个典型的图聚类问题,这样可以根据已有的图论方法来得到解决。该方法主要步骤包括:获取文本流;检测突发词;构建突发词图;聚类突发词。该方法针对用户生成文本流中的突发话题检测,其性能优于已有的基于文档聚类、概率话题模型和基于突发特征聚类的方法。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供