加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于大数据的话题抽取方法

发明专利无效专利
  • 申请号:
    CN201510460521.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2015-07-30
  • 申请人:
    成都鼎智汇科技有限公司
著录项信息
专利名称一种基于大数据的话题抽取方法
申请号CN201510460521.X申请日期2015-07-30
法律状态驳回申报国家暂无
公开/公告日2015-12-23公开/公告号CN105183765A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人成都鼎智汇科技有限公司申请人地址
四川省成都市高新区天府大道中段1388号1栋7层772号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人成都鼎智汇科技有限公司当前权利人成都鼎智汇科技有限公司
发明人肖会
代理机构北京天奇智新知识产权代理有限公司代理人郭霞
摘要
本发明提出了一种基于大数据的话题抽取方法,所述方法包括:步骤S100,数据采集,基于分布式云计算方式对网络数据进行数据采集;步骤S200,数据预处理,对步骤S100采集的网络数据进行预处理,首先对采集的网络数据进行分词和词性标注处理,然后进行标点符号处理、表情字符处理和停用词处理,最后得到用于表示文本的特征项;步骤S300,话题抽取,基于预处理后的网络数据,从中抽取出话题。本发明采用分布式的云计算方式,能够对大规模采集的各种网络数据进行挖掘、分析。

专利服务由北京酷爱智慧知识产权代理公司提供