加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

同义词的获取方法及装置

发明专利有效专利
  • 申请号:
    CN201410156167.7
  • IPC分类号:G06F17/30
  • 申请日期:
    2014-04-17
  • 申请人:
    阿里巴巴集团控股有限公司
著录项信息
专利名称同义词的获取方法及装置
申请号CN201410156167.7申请日期2014-04-17
法律状态暂无申报国家中国
公开/公告日2015-11-25公开/公告号CN105095204A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人阿里巴巴集团控股有限公司申请人地址
开曼群岛大开曼岛西湾路802号木槿街大展览馆31119号邮箱 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人创新先进技术有限公司当前权利人创新先进技术有限公司
发明人阮淑梨;蒋建;魏洪平;谢庆伟
代理机构北京亿腾知识产权代理事务所代理人李楠
摘要
本发明涉及一种同义词的获取方法及装置,该方法包括:获取文本集,对文本集进行分词生成第一词语集;对第一词语集通过停词表进行无效词过滤生成第二词语集;对第二词语集中的任意两个词语进行编辑距离处理生成第一同义词对集;对第一词语集中的词语构建向量空间模型;根据该模型获得每对同义词的空间向量,计算每对同义词的余弦相似度值,将每对同义词进行余弦阈值过滤策略的识别,生成第二同义词对集;对第二同义词对集中的词语进行词性标注生成第三同义词对集;将第三同义词对集中的词语通过一元模型处理后获取同义词。因此,本申请实现了检索出的同义词更为准确,并且没有歧义词语和无效词语出现,从而智能的检索出同义词的相关网页。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供