加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

利用网页结构抽取双语词条的方法及设备

发明专利有效专利
  • 申请号:
    CN200910204804.2
  • IPC分类号:G06F17/30
  • 申请日期:
    2009-10-14
  • 申请人:
    腾讯科技(深圳)有限公司
著录项信息
专利名称利用网页结构抽取双语词条的方法及设备
申请号CN200910204804.2申请日期2009-10-14
法律状态暂无申报国家中国
公开/公告日2011-05-04公开/公告号CN102043808A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人腾讯科技(深圳)有限公司申请人地址
广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人腾讯科技(深圳)有限公司,深圳市腾讯计算机系统有限公司当前权利人腾讯科技(深圳)有限公司,深圳市腾讯计算机系统有限公司
发明人刘秋阁;方高林
代理机构北京鑫媛睿博知识产权代理有限公司代理人龚家骅
摘要
本发明公开了一种利用网页结构抽取双语词条的方法,包括:根据预设的种子词条在搜索引擎中搜索相关网页并保存;提取所述种子词条在所述网页中出现的格式,并在所述网页中提取与所述种子词条具有相同格式的其他双语词条。本发明中,通过利用预设的种子词条在搜索引擎中搜索相关网页并保存,然后提取种子词条在搜索到的网页中出现的格式,并在搜索到的网页中提取与种子词条具有相同格式的其他双语词条,从而提高网页中双语词条的抽取效率。

专利服务由北京酷爱智慧知识产权代理公司提供