著录项信息
专利名称 | 一种进行通话的方法和智能移动终端 |
申请号 | CN201310069841.3 | 申请日期 | 2013-03-04 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-09-10 | 公开/公告号 | CN104038617A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04M1/725 | IPC分类号 | H04M1/725;H04M1/247查看分类表>
|
申请人 | 联想移动通信科技有限公司 | 申请人地址 | 福建省厦门市火炬高新区信息光电园岐山北二路9***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 联想移动通信科技有限公司 | 当前权利人 | 联想移动通信科技有限公司 |
发明人 | 李振声;郑煊;林金强;常程;梁超;张龙 |
代理机构 | 北京银龙知识产权代理有限公司 | 代理人 | 许静;安利霞 |
摘要
本发明实施例提供一种进行通话的方法和智能移动终端,方法应用于智能移动终端,所述智能移动终端具有拍摄功能,方法包括:手语通话功能启动后,拍摄手部的行为形成初始视频;从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;选择所述含义对应的语音并发送所述语音。对于功能障碍人士而言,可以拍摄其手部的行为,并通过图像处理分析其手部的行为的具体含义,如此,则能够根据其手部的行为来理解其想要表达的意思,并将这一想要表达的意思转换为语音与对方进行通话。
1.一种进行通话的方法,其特征在于,应用于智能移动终端,所述智能移动终端具有拍摄功能,
方法包括:
手语通话功能启动后,拍摄手部的行为形成初始视频;
从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同,包括:以第一时间间隔将初始视频划分为多个区段,每一个区段中包含多个帧,在一个区段中选择至少一个清晰的帧,在所述清晰的帧中尝试获取所述手语动作的边界,将成功获取了所述边界的帧确定为所述手语图像;
依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义,具体包括:在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义;
选择所述含义对应的语音并发送所述语音。
2.根据权利要求1所述的方法,其特征在于,依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义,具体包括:
在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义。
3.根据权利要求2所述的方法,其特征在于,选择所述含义对应的语音并发送所述语音,具体包括:
在获取对应的所述标准多边形的含义之后,根据所述含义获取语音信号,将所述语音信号形成数据包,向接收端发送数据包。
4.根据权利要求1所述的方法,其特征在于,还包括:
接收到来自另一终端的数据包之后,解调所述数据包得到对应的语音信号,根据所述语音信号获取对应的标准多边形,
根据所述标准多边形生成对应的手语动作;
在所述智能移动终端上显示所述手语动作。
5.一种智能移动终端,其特征在于,包括:
摄像单元,用于启动手语通话功能后,拍摄手部的行为形成初始视频;
图像处理单元,用于从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;包括:帧识别模块,用于以第一时间间隔将初始视频划分为多个区段,每一个区段中包含多个帧,在一个区段中选择至少一个清晰的帧;帧处理模块,用于在所述清晰的帧中尝试获取所述手语动作的边界,将成功获取了所述边界的帧确定为所述手语图像;
手语处理单元,用于依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;包括:特征匹配模块,用于在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义;
语音单元,用于选择所述含义对应的语音并发送所述语音。
6.根据权利要求5所述的智能移动终端,其特征在于,图像处理单元还包括:
手语动作识别模块,用于基于每一个手语动作具有一个边界,边界具有若干个边界点,将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合,将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合,若判定第一距离集合与第二距离集合不同,则认定手语动作不同。
一种进行通话的方法和智能移动终端
技术领域
[0001] 本发明涉及移动终端技术,特别是指一种进行通话的方法和智能移动终端。
背景技术
[0002] 智能移动终端在辅助功能障碍人士方面已经开始了有益的探索,例如,对于非盲人群体-例如聋哑人而言,短信并没有使用过程中的障碍,聋哑人同样也可以毫无障碍的使用智能移动终端提供的访问网络的功能。
[0003] 现有技术存在如下问题:对于聋哑人群体而言,仍然无法通过语音与另一端进行正常的通话。
发明内容
[0004] 本发明要解决的技术问题是提供一种进行通话的方法和智能移动终端,解决现有技术中,聋哑人仍然无法通过语音与另一端进行正常的通话的缺陷。
[0005] 为解决上述技术问题,本发明的实施例提供一种进行通话的方法,应用于智能移动终端,所述智能移动终端具有拍摄功能,方法包括:手语通话功能启动后,拍摄手部的行为形成初始视频;从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;选择所述含义对应的语音并发送所述语音。
[0006] 所述的方法中,从初始视频中识别出至少一个手语图像,具体包括:以第一时间间隔将初始视频划分为多个区段,每一个区段中包含多个帧,在一个区段中选择至少一个清晰的帧,在所述清晰的帧中尝试获取所述手语动作的边界,将成功获取了所述边界的帧确定为所述手语图像。
[0007] 所述的方法中,相邻的手语图像中的手语动作不同,具体包括:每一个手语动作具有一个边界,边界具有若干个边界点,将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合,将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合,若判定第一距离集合与第二距离集合不同,则认定手语动作不同。
[0008] 所述的方法中,依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义,具体包括:在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义。
[0009] 所述的方法中,选择所述含义对应的语音并发送所述语音,具体包括:在获取对应的所述标准多边形的含义之后,根据所述含义获取语音信号,将所述语音信号形成数据包,向接收端发送数据包。
[0010] 所述的方法中,还包括:接收到来自另一终端的数据包之后,解调所述数据包得到对应的语音信号,根据所述语音信号获取对应的标准多边形,根据所述标准多边形生成对应的手语动作;在所述智能移动终端上显示所述手语动作。
[0011] 一种智能移动终端,包括:摄像单元,用于启动手语通话功能后,拍摄手部的行为形成初始视频;图像处理单元,用于从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;手语处理单元,用于依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;语音单元,用于选择所述含义对应的语音并发送所述语音。
[0012] 所述的智能移动终端中,图像处理单元包括:帧识别模块,用于以第一时间间隔将初始视频划分为多个区段,每一个区段中包含多个帧,在一个区段中选择至少一个清晰的帧;帧处理模块,用于在所述清晰的帧中尝试获取所述手语动作的边界,将成功获取了所述边界的帧确定为所述手语图像。
[0013] 所述的智能移动终端中,图像处理单元还包括:手语动作识别模块,用于基于每一个手语动作具有一个边界,边界具有若干个边界点,将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合,将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合,若判定第一距离集合与第二距离集合不同,则认定手语动作不同。
[0014] 所述的智能移动终端中,手语处理单元包括:特征匹配模块,用于在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义。
[0015] 本发明的上述技术方案的有益效果如下:对于功能障碍人士-例如聋哑人而言,可以拍摄其手部的行为,并通过图像处理分析其手部的行为的具体含义,如此,则能够根据其手部的行为来理解其想要表达的意思,并将这一想要表达的意思转换为语音与对方进行通话。
附图说明
[0016] 图1表示一种进行通话的方法的流程示意图;
[0017] 图2表示一种智能移动终端的结构示意图。
具体实施方式
[0018] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0019] 本发明实施例提供一种进行通话的方法,如图1所示,应用于智能移动终端,所述智能移动终端具有拍摄功能,
[0020] 方法包括:
[0021] 步骤101,手语通话功能启动后,拍摄手部的行为形成初始视频;
[0022] 步骤102,从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;
[0023] 步骤103,依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;
[0024] 步骤104,选择所述含义对应的语音并发送所述语音。
[0025] 应用所提供的技术,对于功能障碍人士-例如聋哑人而言,可以拍摄其手部的行为,并通过图像处理分析其手部的行为的具体含义,如此,则能够根据其手部的行为来理解其想要表达的意思,并将这一想要表达的意思转换为语音与对方进行通话。
[0026] 智能移动终端包含有摄像头,因而启动手语通话功能后,若智能移动终端判定当前的通话功能是为功能障碍人士服务,则采用摄像头对手部的行为进行拍摄形成初始视频,实际上,初始视频是由若干个帧组成的。
[0027] 在一个优选实施例中,从初始视频中识别出至少一个手语图像,具体包括:
[0028] 以第一时间间隔将初始视频划分为若干个区段,每一个区段中包含若干个帧,[0029] 在一个区段中选择至少一个清晰的帧,
[0030] 在所述清晰的帧中获取手语动作的边界,该边界围住的区域为所述手语图像。
[0031] 第一时间间隔可以是一个经验值,是根据功能障碍人士的行为习惯确定的,例如,若功能障碍人士平均一秒钟展现一个手部动作,则第一时间间隔即为1秒,若平均半秒钟展现一个手部动作,则第一时间间隔即为0.5秒。
[0032] 其中,清晰的帧是指,在该帧图像中,手部的行为所形成的手语动作与帧图像的背景之间存在明显的差别。
[0033] 在一个优选实施例中,相邻的手语图像中的手语动作不同,具体包括:
[0034] 每一个手语动作具有一个边界,边界具有若干个边界点,
[0035] 在第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合,[0036] 在第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合,[0037] 若判定第一距离集合与第二距离集合不同,则认定手语动作不同。
[0038] 在一个优选实施例中,依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义,具体包括:
[0039] 在手语图像的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义。
[0040] 所述特征点应当包括手掌或手背部位的特征点,大拇指部位的特征点,其他四指部位的特征点,手掌边缘的特征点,手掌与手腕分解处的特征点。
[0041] 在一个优选实施例中,选择所述含义对应的语音并发送,具体包括:
[0042] 在获取对应的所述标准多边形的含义之后,根据所述含义获取语音信号,将所述语音信号形成数据包,向接收端发送数据包。
[0043] 在一个优选实施例中,接收到来自接收端的数据包之后,解调所述数据包得到对应的语音信号,
[0044] 根据所述语音信号获取对应的标准多边形,
[0045] 根据所述标准多边形生成对应的手语动作;
[0046] 显示所述手语动作。
[0047] 聋哑人在打电话过程中通过智能移动终端的摄像头拍摄到手语动作,再将手语动作转化为语音,将聋哑人使用的手语转化成语音输出,这样就可将声音传输给位于接收端的正常人,同理,正常人的语音到达智能移动终端后,在智能移动终端上转化为手语动作并显示给聋哑人看。
[0048] 本发明实施例提供一种智能移动终端,如图2所示,包括:
[0049] 摄像单元201,用于启动手语通话功能后,拍摄手部的行为形成初始视频;
[0050] 图像处理单元202,用于从初始视频中识别出至少一个手语图像,相邻的手语图像中的手语动作不同;
[0051] 手语处理单元203,用于依照顺序在各个手语图像中采集手语动作的特征点,根据所述特征点确定所述手语动作的含义;
[0052] 语音单元204,用于选择所述含义对应的语音并发送所述语音。
[0053] 在一个优选实施例中,图像处理单元202包括:
[0054] 帧识别模块,用于以第一时间间隔将初始视频划分为多个区段,每一个区段中包含多个帧,在一个区段中选择至少一个清晰的帧;
[0055] 帧处理模块,用于在所述清晰的帧中尝试获取所述手语动作的边界,将成功获取了所述边界的帧确定为所述手语图像。
[0056] 在一个优选实施例中,图像处理单元202还包括:
[0057] 手语动作识别模块,用于基于每一个手语动作具有一个边界,边界具有若干个边界点,
[0058] 将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合,[0059] 将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合,[0060] 若判定第一距离集合与第二距离集合不同,则认定手语动作不同。
[0061] 在一个优选实施例中,手语处理单元203包括:
[0062] 特征匹配模块,用于在手语动作的边界之上或者边界之内确定若干个特征点,连接各个特征点形成待测多边形,将所述待测多边形与预先存放的标准多边形进行匹配,匹配成功之后,获取对应的所述标准多边形的含义。
[0063] 智能移动终端不仅能够辅助功能障碍人士向接收端发送语音信号,而且也可以作为接收端,接收来自正常人的语音信号之后,将其转换为手语动作,这一过程包括:接收到来自接收端的数据包之后,解调所述数据包得到对应的语音信号,
[0064] 根据所述语音信号获取对应的标准多边形,
[0065] 根据所述标准多边形生成对应的手语动作;
[0066] 在所述智能移动终端上显示所述手语动作。
[0067] 采用本方案之后的优势是:聋哑人在打电话过程中通过智能移动终端的摄像功能拍摄到手语动作,将手语动作转化为语音输出,这样就可将声音传输给位于接收端的正常人,同理,正常人的语音到达智能移动终端后,在智能移动终端上被转化为手语动作并显示给聋哑人看。
[0068] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
法律信息
- 2022-02-22
未缴年费专利权终止
IPC(主分类): H04M 1/725
专利号: ZL 201310069841.3
申请日: 2013.03.04
授权公告日: 2016.08.03
- 2016-08-03
- 2014-10-15
实质审查的生效
IPC(主分类): H04M 1/725
专利申请号: 201310069841.3
申请日: 2013.03.04
- 2014-09-10
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |