加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于域特定的自然语言标准化的方法和系统

发明专利有效专利
  • 申请号:
    CN201310072086.4
  • IPC分类号:G06F17/22
  • 申请日期:
    2013-03-07
  • 申请人:
    国际商业机器公司
著录项信息
专利名称用于域特定的自然语言标准化的方法和系统
申请号CN201310072086.4申请日期2013-03-07
法律状态授权申报国家中国
公开/公告日2013-09-25公开/公告号CN103324604A
优先权暂无优先权号暂无
主分类号G06F17/22IPC分类号G;0;6;F;1;7;/;2;2查看分类表>
申请人国际商业机器公司申请人地址
美国纽约阿芒克 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人国际商业机器公司当前权利人国际商业机器公司
发明人S.阿尔希纳维;G.D.卡达克;E.S.萨弗恩;J.M.韦伯
代理机构北京市柳沈律师事务所代理人邸万奎
摘要
本发明的实施例提供一种用于文本集的域特定标准化的方法、系统和计算机程序产品。在本发明的一个实施例中,提供了一种用于文本集的域特定标准化的方法,包括行业、组织、人口统计学或地理域。所述方法包括将文本集加载在计算机的存储器中并确定用于所述文本集的域。所述方法还包括针对所确定的域检索替换词的字典。最后,所述方法包括使用所检索的字典对所述文本集进行文本简化。在本实施例的一个方面中,通过基于已经存在于所述文本集中的词的推断而确定所述域。在本实施例的另一方面中,基于与所述文本集一起提供的元数据确定所述域。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供