加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种电子商务字典自动生成方法

发明专利无效专利
  • 申请号:
    CN201210359050.X
  • IPC分类号:G06F17/30;G06F17/27
  • 申请日期:
    2012-09-25
  • 申请人:
    姚明东
著录项信息
专利名称一种电子商务字典自动生成方法
申请号CN201210359050.X申请日期2012-09-25
法律状态权利终止申报国家暂无
公开/公告日2013-01-30公开/公告号CN102902757A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
申请人姚明东申请人地址
湖南省长沙市岳麓区麓山名园D2-301 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人姚明东当前权利人姚明东
发明人姚明东;范英磊;陈浩
代理机构暂无代理人暂无
摘要
本发明公开了一种电子商务字典自动生成方法,包括以下步骤:步骤1:数据爬取:从电子商务网站、搜索引擎爬取原始商品数据;步骤2:预处理;步骤3:递进穷举;步骤4:词频统计;步骤5:归并处理;步骤6:冗余过滤;步骤7:正则式过滤;步骤8;步骤9:低频词剔除;步骤10:特征词补偿。主要优点包括:一是生成字典的速度快,采用机器学习、智能过滤、纠偏、补偿等算法自动生成字典、可大大提高生成效率。二是生成字典收录率高,由于采用了递进穷举方法对文本进行分词,因此在分词过程中很少会漏掉词条。三是生成的字典更加精炼,结合纠偏、冗余过滤、正则过滤等处理算法,消除字典中的冗余和错误,最终生成的电子商务字典更加精炼。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供