加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于文本编码识别的热点信息采集方法和装置

发明专利有效专利
  • 申请号:
    CN201710267663.3
  • IPC分类号:G06F40/126;G06F16/33;G06F16/903
  • 申请日期:
    2017-04-21
  • 申请人:
    东莞中国科学院云计算产业技术创新与育成中心
著录项信息
专利名称基于文本编码识别的热点信息采集方法和装置
申请号CN201710267663.3申请日期2017-04-21
法律状态授权申报国家中国
公开/公告日2017-09-05公开/公告号CN107133201A
优先权暂无优先权号暂无
主分类号G06F40/126IPC分类号G;0;6;F;4;0;/;1;2;6;;;G;0;6;F;1;6;/;3;3;;;G;0;6;F;1;6;/;9;0;3查看分类表>
申请人东莞中国科学院云计算产业技术创新与育成中心申请人地址
广东省东莞市松山湖高新技术产业开发区松科苑10号楼305室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人东莞中国科学院云计算产业技术创新与育成中心当前权利人东莞中国科学院云计算产业技术创新与育成中心
发明人符晓;杨风雷;李沙沙
代理机构广州华进联合专利商标代理有限公司代理人舒丁
摘要
本发明涉及一种基于文本编码识别的热点信息采集方法,包括:获取待识别文本,确定待识别文本对应的多个编码种类;根据多个编码种类分别对待识别文本进行编码,生成与每个编码种类对应的文本编码结果;将每个文本编码结果与预设字符库中的字符进行匹配,得到匹配字符的数量,按照匹配字符的数量对多个编码种类进行排序;获取多个编码种类对应的匹配字符数量最多的编码种类,根据匹配字符数量最多的编码种类对待识别文本进行编码;提取多个经过编码后的待识别文本所包含的主题相同的信息;检测主题相同的信息的热度值是否达到预设阈值,若是,则确定主题相同的信息为热点信息。通过高效地、准确地进行文本编码识别,实现对网络中热点信息的采集。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供