加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种面向微博的动态主题检测与演变追踪方法

发明专利无效专利
  • 申请号:
    CN201410488391.6
  • IPC分类号:G06F17/30;G06F17/27
  • 申请日期:
    2014-09-22
  • 申请人:
    中科嘉速(北京)并行软件有限公司
著录项信息
专利名称一种面向微博的动态主题检测与演变追踪方法
申请号CN201410488391.6申请日期2014-09-22
法律状态驳回申报国家中国
公开/公告日2014-12-10公开/公告号CN104199974A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
申请人中科嘉速(北京)并行软件有限公司申请人地址
北京市海淀区中关村南四街4号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中科嘉速(北京)并行软件有限公司当前权利人中科嘉速(北京)并行软件有限公司
发明人闫碧莹;邓攀;余雷;赵鑫;袁伟;万安格
代理机构北京永创新实专利事务所代理人赵文利
摘要
本发明提出一种面向微博的动态主题检测与演变追踪方法,属于智能信息处理技术领域。方法包括:步骤1,构建分布式爬虫,获取微博数据;步骤2,对微博数据进行预处理;步骤3,进行中文分词去除停用词,获取词集合VOC;步骤4,对各个时间区间的微博数据进行LDA聚类,提取潜在主题;步骤5,筛选出每个时间区间内的微博热门主题;步骤6,对全局时间的热门主题进行层次聚类,获取各主题之间的聚合和分化关系;步骤7,根据主题的聚合和分化关系,可视化主题演变过程。本发明以较低的时间复杂度挖掘出一个事件在不同时期的主题词分布和同一个主题在不同时期的细粒度主题,具有高效性、鲁棒性等优点,具有较大的实用价值。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供