加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种音乐作品信息数据采集及存储方法

发明专利有效专利
  • 申请号:
    CN202010222391.7
  • IPC分类号:G06F16/951;G06F16/955
  • 申请日期:
    2020-03-26
  • 申请人:
    第一曲库(北京)科技有限公司
著录项信息
专利名称一种音乐作品信息数据采集及存储方法
申请号CN202010222391.7申请日期2020-03-26
法律状态公开申报国家中国
公开/公告日2020-07-28公开/公告号CN111460255A
优先权暂无优先权号暂无
主分类号G06F16/951IPC分类号G;0;6;F;1;6;/;9;5;1;;;G;0;6;F;1;6;/;9;5;5查看分类表>
申请人第一曲库(北京)科技有限公司申请人地址
北京市朝阳区东三环中路39号院18号楼16层1905室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人第一曲库(北京)科技有限公司当前权利人第一曲库(北京)科技有限公司
发明人王雷
代理机构北京北新智诚知识产权代理有限公司代理人赵郁军
摘要
本发明提供了一种音乐作品信息数据采集及存储方法,它包括如下步骤:通过搜索引擎抓取相关网站链接;对相关网站链接进行优化处理,生成目标网站链接;错峰访问目标网站链接,保存有效的网页内容;解析保存的有效网页内容的HTML文件中的HTMLDOM树,采集需要的字段信息数据;对采集的信息数据进行整理、哈希处理,建立映射关系写入数据库中。由于本发明对首次通过搜索引擎抓取的网站链接进行优化处理生成目标网站链接,对目标网站链接进行错峰访问,对访问的网页内容进行再次判断筛选,故,本发明从根本上克服了传统的信息数据采集方法浪费网络资源、造成网站服务器负载过大、网站崩溃的弊端,实现高效、快速、准确的数据采集及存储。

专利服务由北京酷爱智慧知识产权代理公司提供