著录项信息
专利名称 | 一种通过摄像自动锁定目标题目并传输的方法 |
申请号 | CN201510085571.4 | 申请日期 | 2015-02-16 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2015-05-20 | 公开/公告号 | CN104636742A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/20 | IPC分类号 | G;0;6;K;9;/;2;0查看分类表>
|
申请人 | 珠海市追梦网络科技有限公司 | 申请人地址 | 广东省中山市五桂山镇长命水工业园
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 读书郎教育科技有限公司 | 当前权利人 | 读书郎教育科技有限公司 |
发明人 | 秦曙光 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开了一种通过摄像自动锁定目标题目并传输的方法,具有摄像和网络通讯功能的电子设备扩展安装有应用程序,该应用程序包括语言包、文字识别模块、摄像头采集图像模块、图像预处理模块、图像布局分析模块、题目区域判定模块和图像区域选取模块。采用上述方法,能使用户突破时间和空间的限制,通过摄像及网络,智能高效、自动准确地锁定和传输目标题目内容,及时获取正确答疑和帮助。
1.一种通过摄像自动锁定目标题目并传输的方法,其特征在于:具有摄像和网络通讯功能的电子设备扩展安装有应用程序,该应用程序包括语言包、文字识别模块、摄像头采集图像模块、图像预处理模块、图像布局分析模块、题目区域判定模块和图像区域选取模块;
所述方法包括:
用户通过手动摄像采集目标题目区域的图像并自动存储;
图像预处理模块自动分析处理摄像采集的图像,图像预处理内容至少包括:缩放、灰度、二值化、去噪、除干扰;
图像布局分析模块对预处理后的图像自动分析,筛选出图像中每个判定为文字的若干个小区域坐标,并且筛选出可能为阿拉伯数字题号的小区域坐标;
语言包与文字识别模块自动识别筛选出的若干个小区域,得出识别结果;
题目区域判定模块根据识别结果判定是否存在阿拉伯数字题号,并根据数字题号存在与否进行不同的布局计算方式,分析得出目标题目区域坐标;
图像区域选取模块得到目标题目区域坐标后,进行缩放比例转换,并根据比例转换后的坐标对原图像进行切割,切割后得到的图像即为目标题目图像;
具有网络通讯功能的电子设备自动将目标题目图像传输到指定的网络地址,请求解答和帮助。
2.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述图像预处理模块的二值化是根据图像大小、原始亮度、光线均匀度、原图是否为白底黑字这些因素所做的二值化操作,将图像转换成像素点灰度值为0或255的单通道,也就是将图像呈现出明显的只有黑和白的视觉效果。
3.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述图像预处理模块的去噪是根据试卷、习题册、课本中常见的布局特征,把页眉、页脚、大标题、小标题及其他与题目本身无关的内容过滤删除。
4.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述图像预处理模块的除干扰是把用户通过摄像采集的多道目标题目以外的其他多余文字、图片区域过滤删除。
5.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述图像布局分析是对预处理后的图像进行区域分块,粒度为单个文字,通过试卷和书本的特征筛选出可能为阿拉伯数字题号的小区域坐标。
6.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述题目区域判定模块对没有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,判断最合理题目区域位置。
7.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述题目区域判定模块对有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,根据每个题号区域坐标选取最合理题号,并通过该题号与上下题号区域坐标之间关系,取得该题号与下一个题号之间的所有行为目标题目区域。
8.如权利要求1所述的一种通过摄像自动锁定目标题目并传输的方法,其特征在于:所述图像区域选取模块的比例转换是在定位目标题目区域前,对过大图像进行缩小处理并定位到坐标,按照比例反向转换成适用于原图像的坐标。
一种通过摄像自动锁定目标题目并传输的方法\n技术领域\n[0001] 本发明涉及一种通过摄像自动锁定目标题目并传输的方法。\n背景技术\n[0002] 随着教育电子产品的普及推广,用平板电脑或者手机摄像功能将难题拍下来并寻求网络答疑的方法得到广泛应用。但现有方法在拍摄难题后,需要用户手动拉拽剪切框选取目标题目区域。这个操作往往需要很多时间和精力,而且拖拽选取题目区域的剪切框不易操作且不准确,手动拖拽往往容易造成框多或者框少,导致寻求答疑过程困难、缓慢甚至误解。如今学生学业繁重,应尽量减轻学生寻求答疑难度,如何省去手动拉拽剪切,提高难题锁定和传输难题的准确性和效率,减少提问和答疑的误差已成为亟需解决的问题。\n发明内容\n[0003] 有鉴于此,本发明所解决的技术问题,在于提供通过摄像自动锁定和传输目标题目的方法。\n[0004] 本发明一种通过摄像自动锁定目标题目并传输的方法重点在于:具有摄像和网络通讯功能的电子设备扩展安装有应用程序,该应用程序包括语言包、文字识别模块、摄像头采集图像模块、图像预处理模块、图像布局分析模块、题目区域判定模块和图像区域选取模块;\n[0005] 所述方法包括:\n[0006] 用户通过手动摄像采集目标题目区域的图像并自动存储;\n[0007] 图像预处理模块自动分析处理摄像采集的图像,图像预处理内容至少包括:缩放、灰度、二值化、去噪、除干扰;\n[0008] 图像布局分析模块对预处理后的图像自动分析,筛选出图像中每个判定为文字的若干个小区域坐标,并且筛选出可能为阿拉伯数字题号的小区域坐标;\n[0009] 语言包与文字识别模块自动识别筛选出的若干个小区域,得出识别结果;\n[0010] 题目区域判定模块根据识别结果判定是否存在阿拉伯数字题号,并根据数字题号存在与否进行不同的布局计算方式,分析得出目标题目区域坐标;\n[0011] 图像区域选取模块得到目标题目区域坐标后,进行缩放比例转换,并根据比例转换后的坐标对原图像进行切割,切割后得到的图像即为目标题目图像;\n[0012] 具有网络通讯功能的电子设备自动将目标题目图像传输到指定的网络地址,请求解答和帮助。\n[0013] 所述图像预处理模块的二值化是根据图像大小、原始亮度、光线均匀度、原图是否为白底黑字这些因素所做的二值化操作,将图像转换成像素点灰度值为0或255的单通道,也就是将图像呈现出明显的只有黑和白的视觉效果。\n[0014] 所述图像预处理模块的去噪是根据试卷、习题册、课本中常见的的布局特征,把页眉、页脚、大标题、小标题及其他与题目本身无关的内容过滤删除。\n[0015] 所述图像预处理模块的除干扰是把用户通过摄像采集的多道目标题目以外的其他多余文字、图片区域过滤删除。\n[0016] 所述图像布局分析是对预处理后的图像进行区域分块,粒度为单个文字,通过试卷和书本的特征筛选出可能为阿拉伯数字题号的小区域坐标。\n[0017] 所述题目区域判定模块对没有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,判断最合理题目区域位置。\n[0018] 所述题目区域判定模块对有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,根据每个题号区域坐标选取最合理题号,并通过该题号与上下题号区域坐标之间关系,取得该题号与下一个题号之间的所有行为目标题目区域。\n[0019] 所述图像区域选取模块的比例转换是在定位目标题目区域前,对过大图像进行缩小处理并定位到坐标,按照比例反向转换成适用于原图像的坐标。\n[0020] 本发明的有益效果是:能使用户突破时间和空间的限制,通过摄像及网络,自动、智能、高效、准确地锁定和传输目标题目内容,及时获取正确答疑和帮助。\n附图说明\n[0021] 图1为本发明一种通过摄像自动锁定目标题目并传输的方法流程示意图。\n具体实施方式\n[0022] 如图1所示,本发明提出了一种通过摄像自动锁定目标题目并传输的方法,其重点在于:具有摄像和网络通讯功能的电子设备扩展安装有应用程序,该应用程序包括语言包、文字识别模块、摄像头采集图像模块、图像预处理模块、图像布局分析模块、题目区域判定模块和图像区域选取模块;\n[0023] 所述方法包括:\n[0024] 用户通过手动摄像采集目标题目区域的图像并自动存储;\n[0025] 图像预处理模块自动分析处理摄像采集的图像,图像预处理内容至少包括:缩放、灰度、二值化、去噪、除干扰;\n[0026] 图像布局分析模块对预处理后的图像自动分析,筛选出图像中每个判定为文字的若干个小区域坐标,并且筛选出可能为阿拉伯数字题号的小区域坐标;\n[0027] 语言包与文字识别模块自动识别筛选出的若干个小区域,得出识别结果;\n[0028] 题目区域判定模块根据识别结果判定是否存在阿拉伯数字题号,并根据数字题号存在与否进行不同的布局计算方式,分析得出目标题目区域坐标;\n[0029] 图像区域选取模块得到目标题目区域坐标后,进行缩放比例转换,并根据比例转换后的坐标对原图像进行切割,切割后得到的图像即为目标题目图像;\n[0030] 具有网络通讯功能的电子设备自动将目标题目图像传输到指定的网络地址,请求解答和帮助。\n[0031] 所述图像预处理模块的二值化是根据图像大小、原始亮度、光线均匀度、原图是否为白底黑字这些因素所做的二值化操作,将图像转换成像素点灰度值为0或255的单通道,也就是将图像呈现出明显的只有黑和白的视觉效果。\n[0032] 所述图像预处理模块的去噪是根据试卷、习题册、课本中常见的的布局特征,把页眉、页脚、大标题、小标题及其他与题目本身无关的内容过滤删除。\n[0033] 所述图像预处理模块的除干扰是把用户通过摄像采集的多道目标题目以外的其他多余文字、图片区域过滤删除。\n[0034] 所述图像布局分析是对预处理后的图像进行区域分块,粒度为单个文字,通过试卷和书本的特征筛选出可能为阿拉伯数字题号的小区域坐标。\n[0035] 所述题目区域判定模块对没有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,判断最合理题目区域位置。\n[0036] 所述题目区域判定模块对有阿拉伯数字题号的目标题目区域判定,是根据图像布局分析模块得出的若干个判定为文字的小区域,分析出题目所在行,计算每一行的最左坐标,左右坐标,最上坐标,最下坐标,行高,行距,行所处整个题目图像中的位置信息,根据每个题号区域坐标选取最合理题号,并通过该题号与上下题号区域坐标之间关系,取得该题号与下一个题号之间的所有行为目标题目区域。\n[0037] 所述图像区域选取模块的比例转换是在定位目标题目区域前,对过大图像进行缩小处理并定位到坐标,按照比例反向转换成适用于原图像的坐标。\n[0038] 目前尚未有公开的方法实现目标题目区域自动锁定和传输,本发明首先填补了这一空白。经过申请人大量实践测试,以中低端主频2.0GHz的CPU平板电脑为例,应用程序自动完成锁定目标题目区域并剪切的效率要比人工操作高出百倍以上,而且更能保证目标题目传输的完整性和准确性。\n[0039] 以上的实施说明及附图所示,为本发明较佳实施例之一,并非以此局限本发明,是以,举凡与本发明的构造、装置、特征等近似、雷同者,均应属本发明的创设目的及申请专利范围之内。
法律信息
- 2018-02-06
专利权的转移
登记生效日: 2018.01.17
专利权人由珠海市追梦网络科技有限公司变更为读书郎教育科技有限公司
地址由519000 广东省珠海市高新区唐家湾镇科技六路39号变更为528400 广东省中山市五桂山镇长命水工业园
- 2017-12-15
- 2015-06-17
实质审查的生效
IPC(主分类): G06K 9/20
专利申请号: 201510085571.4
申请日: 2015.02.16
- 2015-05-20
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
2010-12-07
| | |
2
| |
2014-07-30
|
2014-05-09
| | |
3
| |
2011-09-28
|
2010-12-10
| | |
4
| |
2014-07-16
|
2014-04-23
| | |
5
| |
2014-08-13
|
2014-05-27
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |