加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

传统蒙古文网页识别方法和装置

发明专利有效专利
  • 申请号:
    CN201510033629.0
  • IPC分类号:G06F17/30
  • 申请日期:
    2015-01-22
  • 申请人:
    中央民族大学
著录项信息
专利名称传统蒙古文网页识别方法和装置
申请号CN201510033629.0申请日期2015-01-22
法律状态授权申报国家中国
公开/公告日2015-05-06公开/公告号CN104598593A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中央民族大学申请人地址
北京市海淀区中关村南大街27号中央民族大学理工楼516 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中央民族大学当前权利人中央民族大学
发明人王志娟
代理机构北京亿腾知识产权代理事务所代理人陈霁
摘要
本发明涉及一种传统蒙古文网页识别方法和装置,所述方法包括:获取并统计传统蒙古文网页语料库中的各个词的词频和文档频率,并计算各个词的调和平均值;根据所述调和平均值由大到小,选取前第一数量个词,并对所述前第一数量个词的调和平均值进行累加,得到第一累加和;获取并统计待识别网页中所述前第一数量个词的词频,并对其进行累加,得到第二累加和;当所述第一累加和与所述第二累加和之间的差值小于等于第一阈值时,确定所述待识别网页为传统蒙古文网页。本发明提供的传统蒙古文网页识别方法,可以以较高准确率和较高效率实现传统蒙古文网页的识别,进而有助于传统蒙古文网页的搜集以及传统蒙古文全文搜索引擎的实现。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供