加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

数据清洗方法、装置、电子设备及可读存储介质

发明专利有效专利
  • 申请号:
    CN201910729955.3
  • IPC分类号:G06F16/215
  • 申请日期:
    2019-08-08
  • 申请人:
    北京百度网讯科技有限公司
著录项信息
专利名称数据清洗方法、装置、电子设备及可读存储介质
申请号CN201910729955.3申请日期2019-08-08
法律状态实质审查申报国家中国
公开/公告日2019-11-15公开/公告号CN110457304A
优先权暂无优先权号暂无
主分类号G06F16/215IPC分类号G;0;6;F;1;6;/;2;1;5查看分类表>
申请人北京百度网讯科技有限公司申请人地址
北京市海淀区上地十街10号百度大厦2层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京百度网讯科技有限公司当前权利人北京百度网讯科技有限公司
发明人罗亚东;郭方园;晋小玲
代理机构北京同立钧成知识产权代理有限公司代理人朱颖;刘芳
摘要
本发明实施例提供一种数据清洗方法、装置、电子设备及可读存储介质,该方法包括:获取数据集合中待处理样本数据和所述待处理样本数据的原始标注结果;将所述待处理样本数据输入多个标注模型,得到所述待处理样本数据的多个预测标注结果,所述多个标注模型用于计算同类型样本数据的预测标注结果;若所述多个预测标注结果中相同的预测标注结果的数量大于或等于预设阈值、且所述相同的预测标注结果与所述原始标注结果不同,则将所述数据集合中所述待处理样本数据的原始标注结果替换为所述相同的预测标注结果,得到更新后的所述数据集合。该方法使得数据清洗的效率得到极大提升。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供