加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

短文本特征空间扩展方法

发明专利无效专利
  • 申请号:
    CN201010118594.8
  • IPC分类号:G06F17/27;G06F17/30
  • 申请日期:
    2010-02-13
  • 申请人:
    武汉理工大学
著录项信息
专利名称短文本特征空间扩展方法
申请号CN201010118594.8申请日期2010-02-13
法律状态驳回申报国家中国
公开/公告日2010-07-07公开/公告号CN101770454A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;3;0查看分类表>
申请人武汉理工大学申请人地址
湖北省武汉市武昌珞狮路122号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人武汉理工大学当前权利人武汉理工大学
发明人李琳;钟珞;胡燕;刘东飞
代理机构武汉开元知识产权代理有限公司代理人潘杰
摘要
本发明公开了一种短文本特征空间扩展方法,包括如下步骤:(1)选取短文本特征空间的扩展来源;(2)对扩展来源的文本数据进行文本预处理,获取作为训练集的文档—词矩阵;(3)在训练集的文档—词矩阵上建立浅层狄利赫雷分配主题模型;(4)将每条短文本表示成词向量;(5)将短文本的词向量作为浅层狄利赫雷分配主题模型的输入,输出得到与短文本相关的隐含主题概率分布;(6)将隐含主题的主题表示成主题向量;(7)将主题向量和词向量组合在一起,形成具有扩展特征空间的短文本。本发明将得到的隐含主题确定的主题向量与短文本确定的词向量组合在一起,因此短文本的特征空间得到扩展,能有效地提高短文本信息处理的质量。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供