加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种跨语种语料自动分类与检索方法

发明专利有效专利
  • 申请号:
    CN96116654.1
  • IPC分类号:--
  • 申请日期:
    1996-12-31
  • 申请人:
    复旦大学
著录项信息
专利名称一种跨语种语料自动分类与检索方法
申请号CN96116654.1申请日期1996-12-31
法律状态公开申报国家中国
公开/公告日1997-09-03公开/公告号CN1158460
优先权暂无优先权号暂无
主分类号暂无IPC分类号暂无查看分类表>
申请人复旦大学申请人地址
上海市邯郸路220号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人复旦大学当前权利人复旦大学
发明人韦雄观;吴立德
代理机构复旦大学专利事务所代理人陆飞
摘要
本发明属计算机信息处理技术领域,是一种跨语种语料自动分类与检索方法。其特点是用文本的Gram(n,s)表示以及其中的n-Gram分布特性来表示文本的特征,并由此计算文本之间的相似度;然后,根据相似度大小对文本进行自动聚类、领域分类、检索。与通常的基于字词频统计方法相比,本发明可同时处理多种语言,不需要任何词典,不需要对文本进行分词或抽词干等麻烦的预处理过程。方法的容错性、检索与分类的速度和精度等更为优越,且极易于在微机上实现。因此可广泛用于大规模多语种语料的自动聚类、邮件分类、信息过滤、电子会议以及信息检索服务等领域。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供