著录项信息
专利名称 | 一种图像处理方法、装置和终端 |
申请号 | CN201310256952.5 | 申请日期 | 2013-06-25 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-10-09 | 公开/公告号 | CN103347151A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N5/232 | IPC分类号 | H;0;4;N;5;/;2;3;2;;;H;0;4;M;1;/;7;2;5查看分类表>
|
申请人 | 腾讯科技(深圳)有限公司 | 申请人地址 | 广东省深圳市福田区振兴路赛格科技园2栋东403室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 腾讯科技(深圳)有限公司 | 当前权利人 | 腾讯科技(深圳)有限公司 |
发明人 | 邬振海;郑志昊;梁柱;陶润 |
代理机构 | 广州三环专利代理有限公司 | 代理人 | 郝传鑫;熊永强 |
摘要
本发明适用于图片处理领域,提供了一种图像处理方法、装置和终端,所述方法包括:接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,拍摄图像,并在拍摄界面预设叠加光学识别字符的区域;利用终端的信息分析单元对所述拍摄图像进行分析,获取所述拍摄图像对应的光学识别字符;检测用户输入的叠加指令,响应所述叠加指令,将获取的所述光学识别字符叠加到拍摄界面预设的所述区域;检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述光学识别字符的拍摄图像。本发明实施例,通过在终端的拍摄界面叠加光学识别字符,使得拍摄图像在不清晰的情况下,也可以通过光学识别字符进行辅助说明。
1.一种图像处理方法,其特征在于,所述方法包括:
接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加光学识别字符的区域;
利用终端的信息分析单元对所述拍摄图像进行分析,选用数学距离函数获取所述拍摄图像对应的光学识别字符,所述数学距离函数包括:欧式空间的比对方法、松弛比对法、动态程序比对法、类神经网络的数据库建立及比对法或隐马尔科夫模型中的至少一种;
检测用户输入的叠加指令,响应所述叠加指令,将获取的所述光学识别字符叠加到拍摄界面预设的所述区域;
检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述光学识别字符的拍摄图像。
2.如权利要求1所述的方法,其特征在于,在所述获取所述拍摄图像对应的光学识别字符的步骤之后,所述方法还包括:
将所述光学识别字符的格式调整为预设的显示格式。
3.如权利要求1所述的方法,其特征在于,在所述将获取的所述光学识别字符叠加到拍摄界面预设的所述区域的步骤之后,所述方法还包括:
保存叠加了所述光学识别字符的拍摄图像。
4.如权利要求3所述的方法,其特征在于,所述保存叠加了所述光学识别字符的拍摄图像的步骤,包括:
将叠加了光学识别字符的拍摄图像存储于所述终端;或者,
接收用户输入的图像发布指令,响应所述图像发布指令,将叠加有所述光学识别字符的图像传输给第三方应用进行发布,其中,所述第三方应用与所述多媒体拍摄应用相关联。
5.如权利要求1~4任一项所述的方法,其特征在于,所述将获取的所述光学识别字符叠加到拍摄界面预设的所述区域的步骤,包括:
将所述光学识别字符转换为图片;
通过水印算法将所述图片叠加到预设的所述区域。
6.一种图像处理装置,其特征在于,所述装置包括:
叠加区域预设单元,用于接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加光学识别字符的区域;
获取单元,用于在所述叠加区域预设单元预设之后,利用终端的信息分析单元对所述拍摄图像进行分析,选用数学距离函数获取所述拍摄图像对应的光学识别字符,所述数学距离函数包括:欧式空间的比对方法、松弛比对法、动态程序比对法、类神经网络的数据库建立及比对法或隐马尔科夫模型中的至少一种;
叠加单元,用于检测用户输入的叠加指令,响应所述叠加指令,将所述获取单元获取的光学识别字符叠加到所述叠加区域预设单元预设的区域;
拍摄图像输出单元,用于检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述叠加单元叠加的光学识别字符的拍摄图像。
7.如权利要求6所述的装置,其特征在于,在所述获取单元获取之后,所述装置还包括:
调整单元,用于将所述获取单元获取的光学识别字符的格式调整为预设的显示格式。
8.如权利要求6所述的装置,其特征在于,在所述叠加单元叠加之后,所述装置还包括:
保存单元,用于保存所述叠加单元叠加了光学识别字符的拍摄图像。
9.如权利要求8所述的装置,其特征在于,所述保存单元,包括:
存储子单元,用于将叠加了光学识别字符的拍摄图像存储于所述终端;或者,发布子单元,用于接收用户输入的图像发布指令,响应所述图像发布指令,将叠加有所述光学识别字符的图像传输给第三方应用进行发布,其中,所述第三方应用与所述多媒体拍摄应用相关联。
10.如权利要求6~9任一项所述的装置,其特征在于,所述叠加单元,包括:
转换子单元,用于将所述光学识别字符转换为图片;
叠加子单元,用于通过水印算法将所述转换子单元转换的图片叠加到预设的所述区域。
11.一种终端,其特征在于,所述终端包括如权利要求7~11任一项所述的图像处理装置。
一种图像处理方法、装置和终端\n技术领域\n[0001] 本发明属于图片处理领域,尤其涉及一种图像处理方法、装置和终端。\n背景技术\n[0002] 现在,很多的终端(如手机)都可以通过拍摄单元(如摄像头)来拍摄图像,进一步地,终端的拍摄界面上可以显示一些时间点信息(如:X点X时X分拍摄),当拍摄单元拍摄图像后,即可获得叠加有时间点信息的拍摄图像。然而实践中发现,终端只能在拍摄界面提供时间点信息,并不能提供更多的其他信息。\n发明内容\n[0003] 本发明实施例提供一种图像处理方法、装置和终端,以解决现有技术拍摄的图像只能记录用户拍摄图像的时间点信息的问题。\n[0004] 本发明实施例是这样实现的,一种图像处理方法,所述方法包括:\n[0005] 接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加光学识别字符的区域;\n[0006] 利用终端的信息分析单元对所述拍摄图像进行分析,获取所述拍摄图像对应的光学识别字符;\n[0007] 检测用户输入的叠加指令,响应所述叠加指令,将获取的所述光学识别字符叠加到拍摄界面预设的所述区域;\n[0008] 检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述光学识别字符的拍摄图像。\n[0009] 本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有程序,所述程序执行时包括如上所述的步骤。\n[0010] 本发明实施例还提供一种图像处理装置,所述装置包括:\n[0011] 叠加区域预设单元,用于接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加光学识别字符的区域;\n[0012] 获取单元,用于在所述叠加区域预设单元预设之后,利用终端的信息分析单元对所述拍摄图像进行分析,获取所述拍摄图像对应的光学识别字符;\n[0013] 叠加单元,用于检测用户输入的叠加指令,响应所述叠加指令,将所述获取单元获取的光学识别字符叠加到所述叠加区域预设单元预设的区域;\n[0014] 拍摄图像输出单元,用于检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述叠加单元叠加的光学识别字符的拍摄图像。\n[0015] 本发明实施例还提供一种图像处理终端,所述终端包括如上所述的图像处理装置。\n[0016] 本发明实施例,在终端的拍摄界面预设叠加光学识别字符的区域,对拍摄界面显示的拍摄图像进行分析,获取拍摄图像对应的光学识别字符,并输出叠加有该光学识别字符的拍摄图像,使得光学识别字符可以对终端拍摄的图像进行辅助说明,通过发布包含该光学识别字符的图像,使用户的好友更方便分辨出用户拍摄的图像。\n附图说明\n[0017] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。\n[0018] 图1为本发明实施例提供的图像处理方法的流程图;\n[0019] 图2为本发明实施例提供的通过水印算法叠加音频关联信息的效果图;\n[0020] 图3为本发明实施例提供的图像处理装置的结构图;\n[0021] 图4为本发明实施例提供的图像处理终端的结构图。\n具体实施方式\n[0022] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。\n[0023] 本发明实施例,在终端的拍摄界面预设叠加光学识别字符的区域,对拍摄界面显示的拍摄图像进行分析,获取拍摄图像对应的光学识别字符,并输出叠加有该光学识别字符的拍摄图像,使得光学识别字符可以对终端拍摄的图像进行辅助说明,通过发布包含该光学识别字符的图像,图像的接收对象(例如:发布该图像的用户的好友),可以在拍摄图像不清晰的情况下,从光学识别字符中获取该图像的拍摄信息,从而使用户的好友更方便分辨出用户拍摄的图像。\n[0024] 为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。\n[0025] 实施例一\n[0026] 如图1所示为本发明实施例提供的图像处理方法的流程图,所述方法包括以下步骤:\n[0027] 在步骤S101中,接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加光学识别字符的区域。\n[0028] 在本发明实施例中,终端首先接收用户对多媒体拍摄应用(如:相机应用)的操作指令,终端响应所述操作指令,启动拍摄单元拍摄图片,终端在拍摄该图像的拍摄界面预设叠加光学识别字符(Optical Character Recognition简称:OCR)的区域。\n[0029] 在步骤S102中,利用终端的信息分析单元对所述拍摄图像进行分析,获取所述拍摄图像对应的OCR。\n[0030] 在本发明实施例中,用户通过终端的信息分析单元,对终端拍摄界面显示的拍摄图像进行分析,获取该拍摄图像对应的OCR,如:终端的拍摄界面的显示的拍摄图像为树木,则通过信息分析单元对该拍摄图像的分析,获取的OCR即为“树”,该OCR可以为文字(如:树、tree),也可以为图形,可以根据实际使用的需要进行选择。\n[0031] 需要指出的是,根据所述拍摄图像不同的特征特性,可以选用不同的数学距离函数获取拍摄图像的OCR,包括:欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP),以及类神经网络的数据库建立及比对、隐马尔科夫模型(Hidden Markov Model)等。\n[0032] 在步骤S103中,检测用户输入的叠加指令,响应所述叠加指令,将获取的所述OCR叠加到拍摄界面预设的所述区域。\n[0033] 在本发明实施例中,用户通过操作(如:鼠标键盘操作、触摸屏可用触摸操作)将获取的OCR叠加到终端拍摄界面预设的区域。所述将获取的所述OCR叠加到拍摄界面预设的所述区域的步骤,包括:\n[0034] 1、将所述OCR转换为图片。\n[0035] 在本发明实施例中,用户通过终端首先将获取的OCR的格式通过转换软件转换为图片格式,如:PDF、JPG等。\n[0036] 2、通过水印算法将所述图片叠加到预设的所述区域。\n[0037] 通过水印算法叠加OCR的效果图如图2所示。\n[0038] 在步骤S104中,检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述OCR的拍摄图像。\n[0039] 在本发明实施例中,在将OCR叠加到终端拍摄界面预设的区域之后,终端检测用户是否输入了拍摄指令,当检测到用户输入了拍摄指令时,终端响应所述拍摄指令,其响应结果即为输出叠加有OCR的拍摄图像。\n[0040] 本发明实施例,在终端的拍摄界面预设叠加OCR的区域,对拍摄界面显示的拍摄图像进行分析,获取拍摄图像对应的OCR,并输出叠加有该OCR的拍摄图像,使得OCR可以对终端拍摄的图像进行辅助说明,通过发布包含该OCR的图像,使用户的好友更方便分辨出用户拍摄的图像。\n[0041] 作为本发明的一个可选实施例,在所述获取所述拍摄图像对应的OCR的步骤之后,所述方法还包括:\n[0042] 将所述OCR的格式调整为预设的显示格式。\n[0043] 在本发明实施例中,在获取OCR的步骤之后,可以根据预设的显示格式对该OCR的格式进行调整。\n[0044] 举例说明:假设终端预设的显示格式为:中文,则如果拍摄图像为树木,则该OCR的显示格式为“树”;假设终端预设的显示格式为:英文,则如果拍摄图像为树木,则该OCR的显示格式为“Tree”;假设终端预设的显示格式为:图形,则如果拍摄图像为树木,则该OCR的显示格式为树木的图形。\n[0045] 作为本发明的另一个可选实施例,在所述将获取的所述OCR叠加到拍摄界面预设的所述区域的步骤之后,所述方法还包括:\n[0046] 保存叠加了所述OCR的拍摄图像。\n[0047] 在本发明实施例中,用户在通过终端将OCR叠加到拍摄界面的预设区域之后,还可以保存所述叠加了OCR的图像。所述保存叠加了所述OCR的拍摄图像的步骤,包括:\n[0048] 1、将叠加了OCR的拍摄图像存储于所述终端。或者,\n[0049] 2、接收用户输入的图像发布指令,响应所述图像发布指令,将叠加有所述OCR的图像传输给第三方应用进行发布,其中,所述第三方应用与所述多媒体拍摄应用相关联。\n[0050] 在本发明实施例中,将拍摄图像存储在终端是最传统的保存方式,随着科技的发展也可以将该拍摄图像发布到与多媒体拍摄应用相关联的第三方应用,以方便用户通过第三方应用将该图像分享给好友。\n[0051] 实施例二\n[0052] 如图3所示为本发明实施例提供的图像处理装置的结构图,为了便于说明,仅示出与本发明实施例相关的部分,包括:\n[0053] 叠加区域预设单元301,用于接收用户对终端的多媒体拍摄应用的操作指令,响应所述操作指令,利用终端的拍摄单元拍摄图像,并在拍摄界面预设叠加OCR的区域。\n[0054] 在本发明实施例中,叠加区域预设单元301首先接收用户对多媒体拍摄应用(如:\n相机应用)的操作指令,终端响应所述操作指令,启动拍摄单元拍摄图片,终端在拍摄该图像的拍摄界面预设叠加光学识别字符(Optical Character Recognition简称:OCR)的区域。\n[0055] 获取单元302,用于在所述叠加区域预设单元301预设之后,利用终端的信息分析单元对所述拍摄图像进行分析,获取所述拍摄图像对应的OCR。\n[0056] 在本发明实施例中,获取单元302通过终端的信息分析单元,对终端拍摄界面显示的拍摄图像进行分析,获取该拍摄图像对应的OCR,如:终端的拍摄界面的显示的拍摄图像为树木,则通过信息分析单元对该拍摄图像的分析,获取的OCR即为“树”,该OCR可以为文字(如:树、tree),也可以为图形,可以根据实际使用的需要进行选择。\n[0057] 需要指出的是,根所述据拍摄图像不同的特征特性,可以选用不同的数学距离函数获取拍摄图像的OCR,包括:欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP),以及类神经网络的数据库建立及比对、隐马尔科夫模型(Hidden Markov Model)等。\n[0058] 叠加单元303,用于检测用户输入的叠加指令,响应所述叠加指令,将所述获取单元302获取的OCR叠加到所述叠加区域预设单元301预设的区域。\n[0059] 在本发明实施例中,用户通过操作(如:鼠标键盘操作、触摸屏可用触摸操作)将获取的OCR叠加到终端拍摄界面预设的区域。所述叠加单元303,包括:\n[0060] 转换子单元3031,用于将所述OCR转换为图片。\n[0061] 在本发明实施例中,用户通过终端首先将获取的OCR的格式通过转换软件转换为图片格式,如:PDF、JPG等。\n[0062] 叠加子单元3032,用于通过水印算法将所述转换子单元3031转换的图片叠加到预设的所述区域。\n[0063] 拍摄图像输出单元304,用于检测用户输入的拍摄指令,响应所述拍摄指令,并输出叠加有所述叠加单元303叠加的OCR的拍摄图像。\n[0064] 在本发明实施例中,在将OCR叠加到终端拍摄界面预设的区域之后,拍摄图像输出单元304检测用户是否输入了拍摄指令,当检测到用户输入了拍摄指令时,终端响应所述拍摄指令,其响应结果即为输出叠加有该OCR的拍摄图像。\n[0065] 本发明实施例,在终端的拍摄界面预设叠加OCR的区域,对拍摄界面显示的拍摄图像进行分析,获取拍摄图像对应的OCR,并输出叠加有该OCR的拍摄图像,使得OCR可以对终端拍摄的图像进行辅助说明,通过发布包含该OCR的图像,使用户的好友更方便分辨出用户拍摄的图像。\n[0066] 作为本发明的一个可选实施例,在所述获取单元302获取之后,所述装置还包括:\n[0067] 调整单元305,用于将所述获取单元302获取的OCR的格式调整为预设的显示格式。\n[0068] 在本发明实施例中,在获取单元302获取OCR之后,调整单元305可以根据预设的显示格式对该OCR的格式进行调整。\n[0069] 举例说明:假设终端预设的显示格式为:中文,则如果拍摄图像为树木,则该OCR的显示格式为“树”;假设终端预设的显示格式为:英文,则如果拍摄图像为树木,则该OCR的显示格式为“Tree”;假设终端预设的显示格式为:图形,则如果拍摄图像为树木,则该OCR的显示格式为树木的图形。\n[0070] 作为本发明的另一个可选实施例,在所述叠加单元303叠加之后,所述装置还包括:\n[0071] 保存单元306,用于保存所述叠加单元303叠加了OCR的拍摄图像。\n[0072] 在本发明实施例中,用户在通过终端在将OCR叠加到拍摄界面的预设区域之后,还可以保存所述叠加了OCR的图像。所述保存单元306,包括:\n[0073] 存储子单元3061,用于将叠加了OCR的拍摄图像存储于所述终端;或者,[0074] 发布子单元3062,用于接收用户输入的图像发布指令,响应所述图像发布指令,将叠加有所述OCR的图像传输给第三方应用进行发布,其中,所述第三方应用与所述多媒体拍摄应用相关联。\n[0075] 在本发明实施例中,将拍摄图像存储在终端是最传统的保存方式,随着科技的发展也可以将该拍摄图像发布到与多媒体拍摄应用相关联的第三方应用,以方便用户通过第三方应用将该图像分享给好友。\n[0076] 实施例三\n[0077] 如图4所示为本发明实施例提供的图像处理终端的结构图,其中,图4所示的终端包括图3所示的一种图像处理装置,通过实施图4所示的终端,用户可以在拍摄界面上叠加拍摄图像对应的OCR,从而可以使OCR对拍摄图像进行辅助说明。\n[0078] 本发明实施例进一步公开了一种计算机存储介质,该计算机存储介质存储有程序,该程序执行时包括如图1所示方法的全部步骤。具体而言,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,如存储在所述终端中的指令,通过该终端中的至少一个处理器来执行,从而实现图像处理方法。本实施例中,所述的程序可以存储于终端的可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。\n[0079] 本领域普通技术人员可以理解为上述实施例所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。\n[0080] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
法律信息
- 2015-11-18
- 2013-11-06
实质审查的生效
IPC(主分类): H04N 5/232
专利申请号: 201310256952.5
申请日: 2013.06.25
- 2013-10-09
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-11-25
|
2007-11-28
| | |
2
| |
2013-02-06
|
2011-08-05
| | |
3
| |
2013-05-08
|
2012-11-08
| | |
4
| |
2011-10-05
|
2011-06-01
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |