加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于Hadoop的分布式搜索引擎构建方法

发明专利无效专利
  • 申请号:
    CN201210408753.7
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-10-24
  • 申请人:
    苏州两江科技有限公司
著录项信息
专利名称基于Hadoop的分布式搜索引擎构建方法
申请号CN201210408753.7申请日期2012-10-24
法律状态放弃专利权申报国家中国
公开/公告日2013-02-06公开/公告号CN102915365A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人苏州两江科技有限公司申请人地址
江苏省苏州市工业园区仁爱路150号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人苏州两江科技有限公司当前权利人苏州两江科技有限公司
发明人陈国庆;杨浩
代理机构苏州创元专利商标事务所有限公司代理人范晴
摘要
本发明公开了一种基于Hadoop的分布式搜索引擎构建方法,其特征在于所述方法包括以下步骤:(1)通过Lucene分词处理本地海量文件,形成文件块;(2)通过Map-Reduce进行数据分解处理,获得key=关键字和value=文件名的输出键值对,构建关键字和文件名列表相关的索引文件;(3)将关键字和文件名列表相关的索引文件存储到HBase数据库中。该方法解决了Lucene数据量大的瓶颈,而且还提高了搜索响应效率。

专利服务由北京酷爱智慧知识产权代理公司提供