加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于深度学习的自然场景文本检测方法

发明专利有效专利
  • 申请号:
    CN201911057601.5
  • IPC分类号:--
  • 申请日期:
    2019-10-31
  • 申请人:
    华南理工大学
著录项信息
专利名称一种基于深度学习的自然场景文本检测方法
申请号CN201911057601.5申请日期2019-10-31
法律状态实质审查申报国家中国
公开/公告日2020-02-18公开/公告号CN110807422A
优先权暂无优先权号暂无
主分类号暂无IPC分类号暂无查看分类表>
申请人华南理工大学申请人地址
广东省广州市天河区五山路381号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人华南理工大学当前权利人华南理工大学
发明人刘发贵;谷典
代理机构广州粤高专利商标代理有限公司代理人何淑珍;江裕强
摘要
本发明公开了一种基于深度学习的任意形状自然场景文本检测方法。本发明的目的在于提升对于任意形状自然场景文本检测的准确率和召回率。所述方法包括以下步骤:构建并训练基于神经网络的自然场景文本检测模型,使用训练完成的自然场景文本检测模型对给定图像中的自然场景文本进行检测。本发明提出通用的完整性感知的损失函数替代回归分支的smoothl1loss损失函数,将IoU相关的指标直接作为被优化的对象,从而直接地提高检测的精度和召回率;本发明在MaskRCNN头中增加TextIoU头用来预测文本掩模的IoU,并将该预测值乘以Box头的分类置信度,获得最终的置信度得分,凭借此来筛选得到最终的检测结果。TextIoU头的加入,可以有效抑制假阳性结果,从而提高检测效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供