加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种微博话题检测方法

发明专利无效专利
  • 申请号:
    CN201410056208.5
  • IPC分类号:G06F17/30
  • 申请日期:
    2014-02-19
  • 申请人:
    广西科技大学
著录项信息
专利名称一种微博话题检测方法
申请号CN201410056208.5申请日期2014-02-19
法律状态撤回申报国家中国
公开/公告日2014-05-21公开/公告号CN103810280A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人广西科技大学申请人地址
广西壮族自治区柳州市东环路268号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人广西科技大学当前权利人广西科技大学
发明人王萌;黄镇谨;欧阳浩
代理机构北京科亿知识产权代理事务所(普通合伙)代理人汤东凤
摘要
本发明公开了一种微博话题检测方法,选择微博集合,利用网词网网络词库扫描对微博集合进行预处理;进行预处理后使用中科院ICTCLAS分词系统对待处理的微博集合进行词语切分和词性标注等处理;利用HOWNET工具对微博词语概念进行获取和扩展;利用TFIDF来进行概念重要度的计算,并对每个帖子建立概念向量空间模型,将微博帖子集合形成帖子矩阵模型;利用聚类算法来进行每条微博的聚类,聚类后的微博集合就是一个个话题集合。本发明使用中科院ICTCLAS分词系统对带处理的微博集合进行词语切分和词性标注等处理提高后期话题检测的时间;使用HOWNET作为工具,将同义词、词语相关属性作为扩充增加信息量,大大避免了信息稀疏的问题,较大幅度的提高后期话题检测的准确性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供