加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种语料数据的生成方法、装置、电子设备及存储介质

发明专利有效专利
  • 申请号:
    CN201810588635.6
  • IPC分类号:G06F16/28;G06F16/215;G06N20/00
  • 申请日期:
    2018-06-08
  • 申请人:
    北京三快在线科技有限公司
著录项信息
专利名称一种语料数据的生成方法、装置、电子设备及存储介质
申请号CN201810588635.6申请日期2018-06-08
法律状态授权申报国家中国
公开/公告日2020-01-03公开/公告号CN110647589A
优先权暂无优先权号暂无
主分类号G06F16/28IPC分类号G;0;6;F;1;6;/;2;8;;;G;0;6;F;1;6;/;2;1;5;;;G;0;6;N;2;0;/;0;0查看分类表>
申请人北京三快在线科技有限公司申请人地址
北京市海淀区北四环西路9号2106-030 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京三快在线科技有限公司当前权利人北京三快在线科技有限公司
发明人张辰;刘怀军
代理机构北京润泽恒知识产权代理有限公司代理人莎日娜
摘要
本发明实施例提供了一种语料数据的生成方法、装置、电子设备及存储介质,包括:获取商品数据;获取搜索词以及搜索词对应的第一订单数据;依据商品数据及所述第一订单数据获得商品售价数据;其中,所述商品数据包括第一商品数据;针对商品数据及第一订单数据进行数据清洗和归一化操作,获得混合商品数据;依据第一商品数据、所述混合商品数据及所述商品售价数据获得订单信息集及商品信息集;依据所述订单信息集及所述商品信息集生成多个语料数据。本发明实施例中,适用于面向电子商务尤其是外卖等以非文本数据领域的NLP任务,增加使用维度,且后续更新将不再依靠手动地制定规则,实现自动化、例行化,大幅减少了人力成本与时间成本。

专利服务由北京酷爱智慧知识产权代理公司提供