加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种挖掘热词的方法与装置

发明专利有效专利
  • 申请号:
    CN201210018787.5
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-01-20
  • 申请人:
    深圳市腾讯计算机系统有限公司
著录项信息
专利名称一种挖掘热词的方法与装置
申请号CN201210018787.5申请日期2012-01-20
法律状态授权申报国家中国
公开/公告日2013-07-24公开/公告号CN103218368A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人深圳市腾讯计算机系统有限公司申请人地址
广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人深圳市腾讯计算机系统有限公司当前权利人深圳市腾讯计算机系统有限公司
发明人邸楠
代理机构北京德琦知识产权代理有限公司代理人王一斌;王琦
摘要
本发明公开了一种挖掘热词的方法及装置。该方法包括:预先设置热词库并对热词库中的各热词设置相应的热词权重;根据热词在文档中的词频以及热词库中设置的热词权重,将文档用热词库中热词进行表示;将用热词库中热词进行表示的文档聚类为预设数目的文档类;对预设数目的文档类进行重心排序,过滤掉文档类重心值小于预先设置的重心阈值的文档类;对过滤后的文档类按照预先设置的热词选取策略进行热词选取。应用本发明,可以降低聚类复杂度、提高社交网络热点挖掘的效率。

专利服务由北京酷爱智慧知识产权代理公司提供