加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于自适应子空间学习的迭代文本聚类方法

发明专利有效专利
  • 申请号:
    CN201310230981.4
  • IPC分类号:G06F17/30;G06K9/66
  • 申请日期:
    2013-06-09
  • 申请人:
    南方报业传媒集团
著录项信息
专利名称基于自适应子空间学习的迭代文本聚类方法
申请号CN201310230981.4申请日期2013-06-09
法律状态暂无申报国家中国
公开/公告日2013-09-04公开/公告号CN103279556A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;K;9;/;6;6查看分类表>
申请人南方报业传媒集团申请人地址
广东省广州市越秀区广州大道中289号采编楼第15层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人广东南方报业传媒集团新媒体有限公司当前权利人广东南方报业传媒集团新媒体有限公司
发明人吴娴;杨兴锋;张东明;何崑
代理机构广州市华学知识产权代理有限公司代理人杨晓松
摘要
本发明公开了一种基于自适应子空间学习的迭代文本聚类方法,包括以下步骤(1)初始化将文本语料表示成文本向量空间,采用仿射传播聚类方法产生初始K个聚类,所有文本的聚类类别表示为初始类归属指示矩阵。(2)子空间投影与聚类之间的迭代将初始类归属指示矩阵作为先验知识,以最大化平均邻域边缘为目标求解子空间投影矩阵,将文本向量空间投影到子空间,并在子空间中采用仿射传播聚类方法产生K个聚类,从而更新类归属指示矩阵;基于子空间投影矩阵和类归属指示矩阵计算收敛函数,直到函数收敛,退出迭代,完成文本聚类。本发明对文本数据的大小和分布无限制,子空间求解和聚类被融合到统一框架下,通过迭代的策略取得全局最优的聚类结果。

专利服务由北京酷爱智慧知识产权代理公司提供