加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于特征空间分解的文本大数据主题挖掘方法和装置

发明专利有效专利
  • 申请号:
    CN201310049504.8
  • IPC分类号:G06F17/30
  • 申请日期:
    2013-02-07
  • 申请人:
    中国科学院软件研究所
著录项信息
专利名称基于特征空间分解的文本大数据主题挖掘方法和装置
申请号CN201310049504.8申请日期2013-02-07
法律状态授权申报国家中国
公开/公告日2013-05-22公开/公告号CN103116636A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中国科学院软件研究所申请人地址
北京市海淀区中关村南四街4号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院软件研究所当前权利人中国科学院软件研究所
发明人李文波;孙乐
代理机构北京君尚知识产权代理事务所(普通合伙)代理人余长江
摘要
本发明涉及一种基于特征空间分解的文本大数据主题挖掘方法和装置。该方法主要包含两个关联的部分:一是基于主题特征的空间分解方法;二是基于多子空间的模型求解并行加速方法。空间分解方法的关键在于利用模型特征对数据样本和主题集合进行解耦合,从而同时实现对数据空间和主题空间的切分和消解,得到了多个相对于全模型空间更小的子模型空间,有效降低了求解算法的存储空间复杂度;同时可以利用子空间之间的相对独立性,将其映射到各种并行实体上,从而有效降低了求解算法的计算时间复杂度。本发明方法能够充分利用计算设备的并行处理能力,实现对大型主题建模空间、大规模数据集合的并行可扩展处理。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供