著录项信息
专利名称 | 一种图片标记方法及装置 |
申请号 | CN201410180803.X | 申请日期 | 2014-04-28 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2015-11-25 | 公开/公告号 | CN105094760A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F16/58 | IPC分类号 | G;0;6;F;1;6;/;5;8;;;G;0;6;F;1;6;/;5;1;;;G;0;6;K;9;/;6;2查看分类表>
|
申请人 | 小米科技有限责任公司 | 申请人地址 | 北京市海淀区清河中街68号华润五彩城购物中心二期13层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 小米科技有限责任公司 | 当前权利人 | 小米科技有限责任公司 |
发明人 | 陈志军;张波;张涛 |
代理机构 | 北京弘权知识产权代理事务所(普通合伙) | 代理人 | 逯长明;许伟群 |
摘要
本公开是关于一种图片标记方法及装置,该方法包括:获取待标注图片;按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签。本公开可以通过预设识别条件根据待标注图片的图像特征自动生成待标注图片的标签,生成标签的过程不需要用户参与,从而可以节省用户的时间;而且,还能够将自动生成的标签传播给与图像特征的相似度大于阈值的图片,这样可以避免为图像特征相似的图片分别单独设置标签,从而提高了为多张图片设置标签的效率。
1.一种图片标记方法,其特征在于,包括:
获取待标注图片;
按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;
在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;
将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签;
所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签包括:
根据字符识别条件识别出所述待标注图片中的字符特征;
从数据库中获取与所述字符特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签;
或者,
根据物体识别条件识别出所述待标注图片中的物体特征;
从数据库中获取与所述物体特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签;
或者,
根据人脸识别条件识别出所述待标注图片中的人脸特征;
从数据库中获取与所述人脸特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签。
2.根据权利要求1所述的图片标记方法,其特征在于,在所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签之后,还包括:
获取所述待标注图片的全球定位系统GPS信息;
根据所述GPS信息确定所述待标注图片的位置信息;
将所述位置信息写入所述待标注图片的标签中。
3.根据权利要求1所述的图片标记方法,其特征在于,所述标签包括字符串,所述方法还包括:
将所述标签的字符串拆分成至少一个字符组,所述每个字符组包括至少一个字符;
将所述至少一个字符组写入所述标签中。
4.根据权利要求1-3任一项所述的图片标记方法,其特征在于,还包括:
接收含有语音信息的查询指令;
判断是否能够识别出所述语音信息对应的文字信息;
当能够识别出所述语音信息对应的文字信息时,显示含有所述文字信息的标签对应的图片;
当无法识别出所述语音信息对应的文字信息时,显示含有所述语音信息的标签对应的图片。
5.根据权利要求1-3任一项所述的图片标记方法,其特征在于,还包括:
接收含有文字信息的查询指令;
判断是否存在含有所述文字信息的标签对应的图片;
当存在含有所述文字信息的标签对应的图片时,显示所述含有所述文字信息的标签对应的图片。
6.根据权利要求1所述的图片标记方法,其特征在于,还包括:
将所述待标注图片的标签和所述图片的标签均设定为预设标签类型;
当接收到查询所述预设标签类型对应的图片的指令时,显示所述预设标签类型对应的所述待标注图片和所述图片。
7.一种图片标记装置,其特征在于,包括:
第一获取模块,用于获取待标注图片;
生成模块,用于按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;
第一确定模块,用于在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;
传播模块,用于将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签;
所述生成模块包括:
第一识别单元,用于根据字符识别条件识别出所述待标注图片中的字符特征;
第一获取单元,用于从数据库中获取与所述字符特征对应的描述信息;
第一传播单元,用于将所述描述信息作为所述待标注图片的标签;
或者,
第二识别单元,用于根据物体识别条件识别出所述待标注图片中的物体特征;
第二获取单元,用于从数据库中获取与所述物体特征对应的描述信息;
第二传播单元,用于将所述描述信息作为所述待标注图片的标签;
或者,
第三识别单元,用于根据人脸识别条件识别出所述待标注图片中的人脸特征;
第三获取单元,用于从数据库中获取与所述人脸特征对应的描述信息;
第三传播单元,用于将所述描述信息作为所述待标注图片的标签。
8.根据权利要求7所述的图片标记装置,其特征在于,还包括:
第二获取模块,用于获取所述待标注图片的全球定位系统GPS信息;
第二确定模块,用于根据所述GPS信息确定所述待标注图片的位置信息;
第一写入模块,用于将所述位置信息写入所述待标注图片的标签中。
9.根据权利要求7所述的图片标记装置,其特征在于,所述标签包括字符串,所述装置还包括:
拆分模块,用于将所述标签的字符串拆分成至少一个字符组,所述每个字符组包括至少一个字符;
第二写入模块,用于将所述至少一个字符组写入所述标签中。
10.根据权利要求7-9任一项所述的图片标记装置,其特征在于,还包括:
第一接收模块,用于接收含有语音信息的查询指令;
第一判断模块,用于判断是否能够识别出所述语音信息对应的文字信息;
第一执行模块,用于在能够识别出所述语音信息对应的文字信息时,显示含有所述文字信息的标签对应的图片;在无法识别出所述语音信息对应的文字信息时,显示含有所述语音信息的标签对应的图片。
11.根据权利要求7-9任一项所述的图片标记装置,其特征在于,还包括:
第二接收模块,用于接收含有文字信息的查询指令;
第二判断模块,用于判断是否存在含有所述文字信息的标签对应的图片;
第二执行模块,用于在存在含有所述文字信息的标签对应的图片时,显示所述含有所述文字信息的标签对应的图片。
12.根据权利要求7所述的图片标记装置,其特征在于,还包括:
设定模块,用于将所述待标注图片的标签和所述图片的标签均设定为预设标签类型;
第三执行模块,用于在接收到查询所述预设标签类型对应的图片的指令时,显示所述预设标签类型对应的所述待标注图片和所述图片。
13.一种图片标记装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待标注图片;
按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;
在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;
将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签;
所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签包括:
根据字符识别条件识别出所述待标注图片中的字符特征;
从数据库中获取与所述字符特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签;
或者,
根据物体识别条件识别出所述待标注图片中的物体特征;从数据库中获取与所述物体特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签;
或者,
根据人脸识别条件识别出所述待标注图片中的人脸特征;从数据库中获取与所述人脸特征对应的描述信息;
将所述描述信息作为所述待标注图片的标签。
一种图片标记方法及装置\n技术领域\n[0001] 本发明涉及图像技术领域,更具体的说,涉及图片标记方法及装置。\n背景技术\n[0002] 目前,用户在获取到图片以后,会对该图片手动设置一个标签,以便于下次访问该图片时,能够通过标签快速的查找到该图片。例如,用户通过终端拍摄了几张大海的图片,然后将文字“大海”分别设置为这几张图片的标签。\n[0003] 对于图片数量较少的情况下,用户可以很容易的为这些图片设置标签。但是,在图片数量较多时,例如图片的数量达到几十张甚至上百张,用户将会耗费大量的时间来为这些图片设置标签;而且,在图片数量较多时,会有很多图片的图像特征是很相似的,所以用户经常会为这些图像特征相似的图片设置相同的标签,从而需要用户付出大量重复性的工作。因此,上述相关的为图片设置标签的方法不仅占用了人力成本,而且非常浪费用户的时间,从而降低了用户的体验。\n发明内容\n[0004] 为克服相关技术中存在的问题,本公开提供一种图片标记方法及装置,以节省人力成本,而且提高图片标记的效率。\n[0005] 根据本公开实施例的第一方面,提供一种图片标记方法,包括:\n[0006] 获取待标注图片;\n[0007] 按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;\n[0008] 在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;\n[0009] 将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签。\n[0010] 可选的,所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签包括:\n[0011] 根据字符识别条件识别出所述待标注图片中的字符特征;\n[0012] 从数据库中获取与所述字符特征对应的描述信息;\n[0013] 将所述描述信息作为所述待标注图片的标签。\n[0014] 可选的,所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签包括:\n[0015] 根据物体识别条件识别出所述待标注图片中的物体特征;\n[0016] 从数据库中获取与所述物体特征对应的描述信息;\n[0017] 将所述描述信息作为所述待标注图片的标签。\n[0018] 可选的,所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签包括:\n[0019] 根据人脸识别条件识别出所述待标注图片中的人脸特征;\n[0020] 从数据库中获取与所述人脸特征对应的描述信息;\n[0021] 将所述描述信息作为所述待标注图片的标签。\n[0022] 可选的,在所述按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签之后,还包括:\n[0023] 获取所述待标注图片的全球定位系统GPS信息;\n[0024] 根据所述GPS信息确定所述待标注图片的位置信息;\n[0025] 将所述位置信息写入所述待标注图片的标签中。\n[0026] 可选的,所述标签包括字符串,所述方法还包括:\n[0027] 将所述标签的字符串拆分成至少一个字符组,所述每个字符组包括至少一个字符;\n[0028] 将所述至少一个字符组写入所述标签中。\n[0029] 可选的,还包括:\n[0030] 接收含有语音信息的查询指令;\n[0031] 判断是否能够识别出所述语音信息对应的文字信息;\n[0032] 当能够识别出所述语音信息对应的文字信息时,显示含有所述文字信息的标签对应的图片;\n[0033] 当无法识别出所述语音信息对应的文字信息时,显示含有所述语音信息的标签对应的图片。\n[0034] 可选的,还包括:\n[0035] 接收含有文字信息的查询指令;\n[0036] 判断是否存在含有所述文字信息的标签对应的图片;\n[0037] 当存在含有所述文字信息的标签对应的图片时,显示所述含有所述文字信息的标签对应的图片。\n[0038] 可选的,还包括:\n[0039] 将所述待标注图片的标签和所述图片的标签均设定为预设标签类型;\n[0040] 当接收到查询所述预设标签类型对应的图片的指令时,显示所述预设标签类型对应的所述待标注图片和所述图片。\n[0041] 根据本公开实施例的第二方面,提供一种图片标记装置,包括:\n[0042] 第一获取模块,用于获取待标注图片;\n[0043] 生成模块,用于按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;\n[0044] 第一确定模块,用于在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;\n[0045] 传播模块,用于将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签。\n[0046] 可选的,所述生成模块包括:\n[0047] 第一识别单元,用于根据字符识别条件识别出所述待标注图片中的字符特征;\n[0048] 第一获取单元,用于从数据库中获取与所述字符特征对应的描述信息;\n[0049] 第一传播单元,用于将所述描述信息作为所述待标注图片的标签。\n[0050] 可选的,所述生成模块包括:\n[0051] 第二识别单元,用于根据物体识别条件识别出所述待标注图片中的物体特征;\n[0052] 第二获取单元,用于从数据库中获取与所述物体特征对应的描述信息;\n[0053] 第二传播单元,用于将所述描述信息作为所述待标注图片的标签。\n[0054] 可选的,所述生成模块包括:\n[0055] 第三识别单元,用于根据人脸识别条件识别出所述待标注图片中的人脸特征;\n[0056] 第三获取单元,用于从数据库中获取与所述人脸特征对应的描述信息;\n[0057] 第三传播单元,用于将所述描述信息作为所述待标注图片的标签。\n[0058] 可选的,还包括:\n[0059] 第二获取模块,用于获取所述待标注图片的全球定位系统GPS信息;\n[0060] 第二确定模块,用于根据所述GPS信息确定所述待标注图片的位置信息;\n[0061] 第一写入模块,用于将所述位置信息写入所述待标注图片的标签中。\n[0062] 可选的,所述标签包括字符串,所述装置还包括:\n[0063] 拆分模块,用于将所述标签的字符串拆分成至少一个字符组,所述每个字符组包括至少一个字符;\n[0064] 第二写入模块,用于将所述至少一个字符组写入所述标签中。\n[0065] 可选的,还包括:\n[0066] 第一接收模块,用于接收含有语音信息的查询指令;\n[0067] 第一判断模块,用于判断是否能够识别出所述语音信息对应的文字信息;\n[0068] 第一执行模块,用于在能够识别出所述语音信息对应的文字信息时,显示含有所述文字信息的标签对应的图片;在无法识别出所述语音信息对应的文字信息时,显示含有所述语音信息的标签对应的图片。\n[0069] 可选的,还包括:\n[0070] 第二接收模块,用于接收含有文字信息的查询指令;\n[0071] 第二判断模块,用于判断是否存在含有所述文字信息的标签对应的图片;\n[0072] 第二执行模块,用于在存在含有所述文字信息的标签对应的图片时,显示所述含有所述文字信息的标签对应的图片。\n[0073] 可选的,还包括:\n[0074] 设定模块,用于将所述待标注图片的标签和所述图片的标签均设定为预设标签类型;\n[0075] 第三执行模块,用于在接收到查询所述预设标签类型对应的图片的指令时,显示所述预设标签类型对应的所述待标注图片和所述图片。\n[0076] 根据本公开实施例的第三方面,提供一种图片标记装置,包括:\n[0077] 处理器;\n[0078] 用于存储处理器可执行指令的存储器;\n[0079] 其中,所述处理器被配置为:\n[0080] 获取待标注图片;\n[0081] 按照预设识别条件根据所述待标注图片的图像特征生成所述待标注图片的标签;\n[0082] 在图片库中确定与所述待标注图片的图像特征的相似度大于阈值的图片;\n[0083] 将所述待标注图片的标签作为所述图像特征的相似度大于阈值的图片的标签。\n[0084] 本公开的实施例提供的技术方案可以包括以下有益效果:本公开可以通过预设识别条件根据待标注图片的图像特征自动生成待标注图片的标签,生成标签的过程不需要用户参与,从而可以节省用户的时间;而且,还能够将自动生成的标签传播给与图像特征的相似度大于阈值的图片,这样可以避免为图像特征相似的图片分别单独设置标签,从而提高了为多张图片设置标签的效率。\n[0085] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。\n附图说明\n[0086] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。\n[0087] 图1是根据一示例性实施例示出的一种图片标记方法的流程图。\n[0088] 图2是根据一示例性实施例示出的一种图片标记装置的示意图。\n[0089] 图3是根据一示例性实施例示出的一种图片标记装置的框图。\n具体实施方式\n[0090] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。\n[0091] 实施例一\n[0092] 图1是根据一示例性实施例示出的一种图片标记方法的流程图,如图1所示,图1所示的图片标记方法可以用于终端中。本公开提供的图片标记方法可以节省人力成本,而且提高图片标记的效率。该方法包括以下步骤。\n[0093] 在步骤S11中,获取待标注图片。\n[0094] 其中,待标注图片可以为不同的图片格式,例如,待标注图片可以为bmp或jpg等图片格式。每个待标注图片都可以拥有多个不同的标签,例如,一张图片包含4个标签,这4个标签分别为标签A、标签B、标签C和标签D,标签A为汉字“大海”,标签B为汉字“蓝天”,标签C为汉字“沙滩”,标签D为语音“海边游玩”。在步骤S11中,终端获取待标注图片的方式有很多种,例如,假设终端为手机,手机每隔一段时间会查询一次手机的内存卡中的A文件夹下是否存在图片,如果A文件夹下存在图片,那么手机会主动的获取A文件夹下的图片,以备后续步骤使用。\n[0095] 在步骤S12中,按照预设识别条件根据待标注图片的图像特征生成待标注图片的标签。\n[0096] 其中,预设识别条件为预先设定好的图像识别技术,终端可以利用预先设定好的图像识别技术来识别待标注图片的图像特征,并根据该图像特征生成待标注图片的标签。\n例如,预设识别条件可以为字符识别条件、物体识别条件、人脸识别条件或图形识别条件等,当然,预设识别条件也可以为上述字符识别条件、物体识别条件、人脸识别条件和图形识别条件的组合。\n[0097] 下面通过实例简要介绍步骤S12。\n[0098] 假设预设识别条件为字符识别条件。其中,字符识别条件可以为OCR(Optical Character Recognition,光学字符识别)技术。首先,根据字符识别条件识别出待标注图片中的字符特征;然后,从数据库中获取与字符特征对应的描述信息;最后,将描述信息作为待标注图片的标签。\n[0099] 例如,用户在北京动物园游玩,并利用手机对北京动物园的正门上的“北京动物园”五个字进行拍照,并将生成的照片存储在手机的内存卡中。由于手机从内存卡中获取到了一张照片,该手机根据OCR技术识别出该照片中存在“北京动物园”五个汉字,并在数据库中获取“北京动物园”这五个汉字对应的描述信息,假设描述信息为“北京动物园”、“海洋馆”和“北京西直门外大街137号”,那么将“北京动物园”、“海洋馆”和“北京西直门外大街\n137号”作为该照片的标签。\n[0100] 假设预设识别条件为物体识别条件。其中,物体识别条件可以为一种图像识别技术,该图像识别技术可以为CBIR(Content-based image retrieval,基于内容的图像检索)技术,该图像识别技术可以识别出图片中的物体特征。首先,根据物体识别条件识别出待标注图片中的物体特征;然后,从数据库中获取与物体特征对应的描述信息;最后,将描述信息作为待标注图片的标签。\n[0101] 例如,用户使用手机在服务器上下载一幅图片,并将下载的图片存储在手机的内存卡中,该图片的内容为一束玫瑰花。手机可以从内存卡中获取到一幅图片,该手机根据CBIR技术开始识别图片中的色彩、纹理和形状等特征,并在数据库中确定与该色彩、纹理和形状等特征对应的描述信息。假设在数据库中与该物体特征对应的描述信息为“花”、“植物”和“花朵”,那么将“花”、“植物”和“花朵”作为该图片的标签。又如,用户使用手机在服务器上下载一幅图片,并将下载的图片存储在手机的内存卡中,该图片的内容为太阳。手机可以从内存卡中获取到一幅图片,该手机根据CBIR技术开始识别图片中的色彩、纹理和形状等特征,并在数据库中确定与该色彩、纹理和形状等特征对应的描述信息。假设在数据库中与该物体特征对应的描述信息为“落日”、“阳光”和“夕阳”,那么将“落日”、“阳光”和“夕阳”作为该图片的标签。\n[0102] 假设预设识别条件为人脸识别条件。其中,人脸识别条件可以为一种人脸识别技术,该人脸识别技术可以识别出图片中的人脸特征,人脸特征具体为人脸五官的特征。首先,根据人脸识别条件识别出待标注图片中的人脸特征;然后,从数据库中获取与人脸特征对应的描述信息;最后,将描述信息作为待标注图片的标签。\n[0103] 例如,数据库中预先存储有用户A的人脸特征和与该人脸特征对应的描述信息,该描述信息为“张三”、“小三”和“儿子”。当用户A向手机内存卡中存入一张照片时,手机会先获取该照片;然后根据人脸识别技术识别出该照片的人脸特征,其中,人脸特征可以为从该照片的人脸上提取出的多个特征点的坐标值和多个特征点对应的颜色信息。由于在数据库中与该人脸特征对应的描述信息为“张三”、“小三”和“儿子”,那么将“张三”、“小三”和“儿子”作为该照片的标签。\n[0104] 在步骤S12中,上述提到的OCR技术、图像识别技术和人脸识别技术均为成熟的图形识别技术,所以本领域技术人员在本公开的基础上,可以根据上述成熟的识别技术来实现本公开的技术方案,所以在此不再赘述。\n[0105] 另外,在步骤S12之后,在步骤S13之前,本公开提供的方案还可以包括以下步骤:\n首先,获取待标注图片的GPS(Global Positioning System,全球定位系统)信息;根据GPS信息确定待标注图片的位置信息;将位置信息写入待标注图片的标签中。其中,在使用终端拍照生成待标注图片时,可以利用终端的定位导航模块确定该终端当前的GPS信息,并将该GPS信息存入待标注图片的附加字段中。这样便可以获取待标注图片的GPS信息,并根据该GPS信息确定待标注图片的位置信息,位置信息可以为利用GPS信息确定的街道信息或旅游景点等,从而将街道信息或旅游景点写入待标注图片的标签中。例如,手机获取到待标注图片的GPS信息,并识别出该GPS信息对应的街道信息为“东长安街”,还可以识别出该GPS信息对应的旅游景点为“天安门”,然后将“东长安街”和“天安门”写入待标注图片的标签中。\n[0106] 在步骤S13中,在图片库中确定与待标注图片的图像特征的相似度大于阈值的图片。\n[0107] 其中,用户可以预先向图片库中存储多张图片,这些存储至图片库中的图片可以是具有标签的图片,也可以是不具有标签的图片,图片库中存储的图片为用户希望被传播标签的图片。例如,图片库中存储有图片A和图片B,假设图片A的图像特征与待标注图片的图像特征的相似度大于阈值,假设图片B的图像特征与待标注图片的图像特征的相似度小于阈值,那么选中图片库中的图片A,并将待标注图片的标签作为图片A的标签,其中,所述阈值可以根据具体图片匹配要求进行设置;所述图像特征相似度的计算方法包括但不限于:直方图匹配法、矩阵分解法、特征点提取法。\n[0108] 在步骤S14中,将待标注图片的标签作为图像特征的相似度大于阈值的图片的标签。\n[0109] 在图1所示的实施例中,本公开可以通过预设识别条件根据待标注图片的图像特征自动生成待标注图片的标签,生成标签的过程不需要用户参与,从而可以节省用户的时间;而且,还能够将自动生成的标签传播给与图像特征的相似度大于阈值的图片,这样可以避免为图像特征相似的图片分别单独设置标签,从而提高了为多张图片设置标签的效率。\n[0110] 可选的,如果标签包括字符串,本公开提供的方案还可以包括以下步骤:将标签的字符串拆分成至少一个字符组,每个字符组包括至少一个字符;将所述至少一个字符组写入所述标签中。例如,标签为“张三在故宫开心的游玩”,该标签包括一个字符串“张三在故宫开心的游玩”,将该字符串拆分成5个字符组,第一个字符组为“张三”,第二个字符组为“在”,第三个字符组为“故宫”,第四个字符组为“开心的”,第五个字符组为“游玩”。拆分以后,可以将这5个字符组全部写入标签中,也可以挑选适合的字符组写入标签中。如果将这5个字符组全部写入标签中,那么该标签为“张三在故宫开心的游玩,张三,在,故宫,开心的,游玩”。如果仅将第三个字符组为“故宫”写入标签中,那么该标签为“张三在故宫开心的游玩,故宫”。这样拆分标签的字符串的目的是,将标签中较长的字符串拆分成多个字符组,从而使该标签具有更多的关键词可以被查询,进而提高该标签被查询到的几率。\n[0111] 可选的,本公开提供的方案还可以包括以下步骤:接收含有语音信息的查询指令;\n判断是否能够识别出语音信息对应的文字信息;当能够识别出语音信息对应的文字信息时,显示含有文字信息的标签对应的图片;当无法识别出语音信息对应的文字信息时,显示含有语音信息的标签对应的图片。例如,手机的内存卡中存储有一张图片A,该图片A的标签包括文字信息的“张三”和语音信息的“张三”,当手机接收到语音信息的查询指令时,那么手机便识别该语音信息对应的文字信息,如果手机能够识别出该语音信息对应的文字信息为“张三”,那么手机将显示出具有文字信息为“张三”的标签对应的图片,即显示出图片A;\n如果手机不能够识别出该语音信息对应的文字信息,但是手机能够识别出该语音信息的声音频率,那么手机将显示出具有该语音信息的声音频率的标签对应图片,即可显示出图片A。上述内容提到一种情况为,手机不能够识别出该语音信息对应的文字信息,这是因为用户向手机发出的语音信息可能不是标准的普通话,而是地方话,所以手机就无法识别出该语音信息对应的文字信息,但是由于用户已经通过地方话说出的语音信息“张三”作为了图片A的标签,所以在手机无法识别出语音信息对应的文字信息时,手机可以显示出含有语音信息的标签对应的图片A。因此,本公开提供的实施例不仅可以根据接收到的语音信息,识别出该语音信息对应的文字信息,以通过该文字信息查找到含有该文字信息的标签对应的图片,而且还能根据接收到的语音信息查找到含有该语音信息的标签对应的图片,所以本实施例可以通过多种方式查找标签的方式,来显示含有语音信息或文字信息的标签对应的图片,从而增加相关图片被查找到的几率。\n[0112] 可选的,本公开提供的方案还可以包括以下步骤:接收含有文字信息的查询指令;\n判断是否存在含有文字信息的标签对应的图片;当存在含有文字信息的标签对应的图片时,显示含有文字信息的标签对应的图片。例如,手机的内存卡中存储有一张图片A,该图片A的标签包括文字信息的“张三”,当手机接收到文字信息的查询指令时,手机可以识别出接收到的文字信息为“张三”,并在手机中查找是否存在含有文字信息“张三”的标签对应的图片,手机一旦找到手机内存卡中存在含有文字信息“张三”的标签对应的图片A,手机便显示图片A。因此,本公开提供的实施例可以根据接收到的文字信息,来查找出含有该文字信息的标签对应的图片,所以本实施例可以实现通过文字信息查询标签对应的图片的功能。可选的,本公开提供的方案还可以包括以下步骤:将待标注图片的标签和图片的标签均设定为预设标签类型;当接收到查询预设标签类型对应的图片的指令时,显示预设标签类型对应的待标注图片和图片。例如,在手机中存储有待标注图片A和图片B,待标注图片A的标签为文字信息“张三”,图片B的标签同样为文字信息“张三”,用户可以预先将待标注图片A的标签和图片B的标签均设定为人名标签类型,如果用户查询人名标签类型的标签,那么手机将显示出所有人名标签类型的标签,即显示出待标注图片A和图片B。因此,本公开提供的实施例可以将所有图片的标签进行分类,从而便于用户可以根据不同类别的标签来查看图片,进而提高了用户的使用感受。\n[0113] 实施例二\n[0114] 图2是根据一示例性实施例示出的一种图片标记装置示意图。本公开提供的图片标记装置可以节省人力成本,而且提高图片标记的效率。参照图2,该装置包括第一获取模块11,生成模块12,第一确定模块13和传播模块14。其中:\n[0115] 第一获取模块11被配置为用于获取待标注图片;\n[0116] 生成模块12被配置为用于按照预设识别条件根据待标注图片的图像特征生成待标注图片的标签;\n[0117] 第一确定模块13被配置为用于在图片库中确定与待标注图片的图像特征的相似度大于阈值的图片;\n[0118] 传播模块14被配置为用于将待标注图片的标签作为图像特征的相似度大于阈值的图片的标签。\n[0119] 可选的,本公开提供的生成模块可以包括以下单元:第一识别单元,用于根据字符识别条件识别出待标注图片中的字符特征;第一获取单元,用于从数据库中获取与字符特征对应的描述信息;第一传播单元,用于将描述信息作为待标注图片的标签。\n[0120] 可选的,本公开提供的生成模块也可以包括以下单元:第二识别单元,用于根据物体识别条件识别出待标注图片中的物体特征;第二获取单元,用于从数据库中获取与物体特征对应的描述信息;第二传播单元,用于将描述信息作为待标注图片的标签。\n[0121] 可选的,本公开提供的生成模块还可以包括以下单元:第三识别单元,用于根据人脸识别条件识别出待标注图片中的人脸特征;第三获取单元,用于从数据库中获取与人脸特征对应的描述信息;第三传播单元,用于将描述信息作为待标注图片的标签。\n[0122] 可选的,本公开提供的方案还可以包括以下模块:第二获取模块,用于获取待标注图片的全球定位系统GPS信息;第二确定模块,用于根GPS信息确定待标注图片的位置信息;\n第一写入模块,用于将位置信息写入待标注图片的标签中。\n[0123] 可选的,本公开提供的方案还可以包括以下模块:拆分模块,用于将标签的字符串拆分成至少一个字符组,每个字符组包括至少一个字符;第二写入模块,用于将至少一个字符组写入标签中。\n[0124] 可选的,本公开提供的方案还可以包括以下模块:第一接收模块,用于接收含有语音信息的查询指令;第一判断模块,用于判断是否能够识别出语音信息对应的文字信息;第一执行模块,用于在能够识别出语音信息对应的文字信息时,显示含有文字信息的标签对应的图片;在无法识别出语音信息对应的文字信息时,显示含有语音信息的标签对应的图片。\n[0125] 可选的,本公开提供的方案还可以包括以下模块:第二接收模块,用于接收含有文字信息的查询指令;第二判断模块,用于判断是否存在含有文字信息的标签对应的图片;第二执行模块,用于在存在含有文字信息的标签对应的图片时,显示含有文字信息的标签对应的图片。\n[0126] 可选的,本公开提供的方案还可以包括以下模块:设定模块,用于将待标注图片的标签和图片的标签均设定为预设标签类型;第三执行模块,用于在接收到查询预设标签类型对应的图片的指令时,显示预设标签类型对应的待标注图片和图片。\n[0127] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。\n[0128] 实施例三\n[0129] 图3是根据一示例性实施例示出的一种用于图片标记装置800的框图。例如,装置\n800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。\n[0130] 参照图3,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。\n[0131] 处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。\n[0132] 存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。\n[0133] 电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。\n[0134] 多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。\n[0135] 音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。\n[0136] I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。\n[0137] 传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。\n[0138] 通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置\n800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。\n在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。\n[0139] 在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。\n[0140] 在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。\n[0141] 一种非临时性计算机可读存储介质,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种图片标记方法,方法包括:获取待标注图片;按照预设识别条件根据待标注图片的图像特征生成待标注图片的标签;在图片库中确定与待标注图片的图像特征的相似度大于阈值的图片;将待标注图片的标签作为图像特征的相似度大于阈值的图片的标签。\n[0142] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。\n[0143] 应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
法律信息
- 2019-10-29
- 2017-02-22
实质审查的生效
IPC(主分类): G06F 9/44
专利申请号: 201410180803.X
申请日: 2014.04.28
- 2015-11-25
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-08-24
|
2011-04-20
| | |
2
| |
2014-03-12
|
2013-12-19
| | |
3
| |
2012-08-22
|
2011-02-22
| | |
4
| |
2013-04-24
|
2012-12-24
| | |
5
| |
2008-06-11
|
2007-12-26
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |