加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于脚本引擎的微博用户关系采集方法

发明专利有效专利
  • 申请号:
    CN201210114869.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-04-17
  • 申请人:
    北京拓尔思信息技术股份有限公司
著录项信息
专利名称基于脚本引擎的微博用户关系采集方法
申请号CN201210114869.X申请日期2012-04-17
法律状态暂无申报国家暂无
公开/公告日2013-10-30公开/公告号CN103377207A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人北京拓尔思信息技术股份有限公司申请人地址
北京市海淀区知春路6号锦秋国际大厦14层14B04 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人拓尔思信息技术股份有限公司当前权利人拓尔思信息技术股份有限公司
发明人都云程
代理机构暂无代理人暂无
摘要
本发明涉及信息采集技术领域,公开了一种基于脚本引擎的微博用户关系采集方法,该方法包括步骤:S1,采用脚本引擎技术自动登录微博客网站;S2,采用网页采集方式对特定账户信息爬取其对应内容页面信息;S3,元数据解析,获取用户列表、用户行为机制及用户基本信息;S4,实现用户关系抽取;S5,使用广度优先遍历用户列表,丰富用户关联关系。本发明提供的采集方法克服了API访问限制问题,有利于微博客信息的规模化采集,同时也提高了信息采集的精确度。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供