首页专利查询专利详情

*来源于国家知识产权局数据，仅供参考，实际以国家知识产权局展示为准

一种进行通话的方法和智能移动终端

发明专利有效专利

申请号：
CN201310069841.3
IPC分类号：H04M1/725H04M1/247
申请日期：
2013-03-04
申请人：
联想移动通信科技有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种进行通话的方法和智能移动终端
申请号	CN201310069841.3	申请日期	2013-03-04
法律状态	授权	申报国家	中国
公开/公告日	2014-09-10	公开/公告号	CN104038617A
优先权	暂无	优先权号	暂无
主分类号	H04M1/725 ? IPC结构图谱： H 电学 H9 电学 H04 电通信技术 H04M 电话通信（通过电话电缆控制其他设备，但不包括电话交换设备的电路入G08） H04M1/00 分局设备，例如用户使用的（交换机提供的用户服务或设备入H04M 3/00；预付费电话硬币箱入H04M 17/00；电流供给装置入H04M 19/08）〔1，7〕 H04M1/72 分局的分机装置；无绳电话机，即无需路由选择建立无线链路到基站的设备〔1，7〕 H04M1/725 无绳电话机〔7〕	IPC分类号	H04M1/725;H04M1/247查看分类表>
申请人	联想移动通信科技有限公司	申请人地址	福建省厦门市火炬高新区信息光电园岐山北二路9*** 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	联想移动通信科技有限公司	当前权利人	联想移动通信科技有限公司
发明人	李振声;郑煊;林金强;常程;梁超;张龙
代理机构	北京银龙知识产权代理有限公司	代理人	许静;安利霞

摘要

本发明实施例提供一种进行通话的方法和智能移动终端，方法应用于智能移动终端，所述智能移动终端具有拍摄功能，方法包括：手语通话功能启动后，拍摄手部的行为形成初始视频；从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；选择所述含义对应的语音并发送所述语音。对于功能障碍人士而言，可以拍摄其手部的行为，并通过图像处理分析其手部的行为的具体含义，如此，则能够根据其手部的行为来理解其想要表达的意思，并将这一想要表达的意思转换为语音与对方进行通话。

一种捕鼠杯

实用新型

立即咨询

水稻早衰控制基因ES1-3及其应用

发明授权

立即咨询

调控水稻抽穗期的主效QTL及分子标记与应用

发明授权

立即咨询

水稻窄叶基因NAL13及其应用

发明授权

立即咨询

水稻控制茎秆强度基因BC-n及其应用

发明授权

立即咨询

水稻类病斑突变体及其应用

发明授权

立即咨询

提高砷胁迫水稻耐受性的microRNA基因及其应用

发明授权

立即咨询

一种基于机器视觉的消防人员应急处理能力分析评价系统

发明授权

立即咨询

一种消防阀的网络化监测系统及预警方法

发明授权

立即咨询

一种消控室内人员姿态检测方法及系统

发明授权

立即咨询

一种制备高产二十碳五烯酸裂殖壶菌的方法

发明授权

立即咨询

一种利用海带水解液培养裂殖壶菌生产DHA的方法

发明授权

立即咨询

一种用于特硬树脂生产的尾气处理装置

实用新型

立即咨询

基于人工智能的医疗健康服务数据处理分析系统

发明授权

立即咨询

一种体育器材用的消毒机

实用新型

立即咨询

VR授课方法、装置和系统

发明授权

立即咨询

一种佩戴舒适的MR智能眼镜

发明授权

立即咨询

一种碳纤维复合材料内腔镀膜装置（报过高企）

实用新型

立即咨询

一种可调节企业服务信息展示架

实用新型

立即咨询

一种基于特征压缩的单样本行人重识别方法

发明授权

立即咨询

1.一种进行通话的方法，其特征在于，应用于智能移动终端，所述智能移动终端具有拍摄功能，
方法包括：
手语通话功能启动后，拍摄手部的行为形成初始视频；
从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同，包括：以第一时间间隔将初始视频划分为多个区段，每一个区段中包含多个帧，在一个区段中选择至少一个清晰的帧，在所述清晰的帧中尝试获取所述手语动作的边界，将成功获取了所述边界的帧确定为所述手语图像；
依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义，具体包括：在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义；
选择所述含义对应的语音并发送所述语音。
2.根据权利要求1所述的方法，其特征在于，依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义，具体包括：
在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义。
3.根据权利要求2所述的方法，其特征在于，选择所述含义对应的语音并发送所述语音，具体包括：
在获取对应的所述标准多边形的含义之后，根据所述含义获取语音信号，将所述语音信号形成数据包，向接收端发送数据包。
4.根据权利要求1所述的方法，其特征在于，还包括：
接收到来自另一终端的数据包之后，解调所述数据包得到对应的语音信号，根据所述语音信号获取对应的标准多边形，
根据所述标准多边形生成对应的手语动作；
在所述智能移动终端上显示所述手语动作。
5.一种智能移动终端，其特征在于，包括：
摄像单元，用于启动手语通话功能后，拍摄手部的行为形成初始视频；
图像处理单元，用于从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；包括：帧识别模块，用于以第一时间间隔将初始视频划分为多个区段，每一个区段中包含多个帧，在一个区段中选择至少一个清晰的帧；帧处理模块，用于在所述清晰的帧中尝试获取所述手语动作的边界，将成功获取了所述边界的帧确定为所述手语图像；
手语处理单元，用于依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；包括：特征匹配模块，用于在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义；
语音单元，用于选择所述含义对应的语音并发送所述语音。
6.根据权利要求5所述的智能移动终端，其特征在于，图像处理单元还包括：
手语动作识别模块，用于基于每一个手语动作具有一个边界，边界具有若干个边界点，将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合，将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合，若判定第一距离集合与第二距离集合不同，则认定手语动作不同。

一种进行通话的方法和智能移动终端
技术领域
[0001] 本发明涉及移动终端技术，特别是指一种进行通话的方法和智能移动终端。
背景技术
[0002] 智能移动终端在辅助功能障碍人士方面已经开始了有益的探索，例如，对于非盲人群体-例如聋哑人而言，短信并没有使用过程中的障碍，聋哑人同样也可以毫无障碍的使用智能移动终端提供的访问网络的功能。
[0003] 现有技术存在如下问题：对于聋哑人群体而言，仍然无法通过语音与另一端进行正常的通话。
发明内容
[0004] 本发明要解决的技术问题是提供一种进行通话的方法和智能移动终端，解决现有技术中，聋哑人仍然无法通过语音与另一端进行正常的通话的缺陷。
[0005] 为解决上述技术问题，本发明的实施例提供一种进行通话的方法，应用于智能移动终端，所述智能移动终端具有拍摄功能，方法包括：手语通话功能启动后，拍摄手部的行为形成初始视频；从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；选择所述含义对应的语音并发送所述语音。
[0006] 所述的方法中，从初始视频中识别出至少一个手语图像，具体包括：以第一时间间隔将初始视频划分为多个区段，每一个区段中包含多个帧，在一个区段中选择至少一个清晰的帧，在所述清晰的帧中尝试获取所述手语动作的边界，将成功获取了所述边界的帧确定为所述手语图像。
[0007] 所述的方法中，相邻的手语图像中的手语动作不同，具体包括：每一个手语动作具有一个边界，边界具有若干个边界点，将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合，将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合，若判定第一距离集合与第二距离集合不同，则认定手语动作不同。
[0008] 所述的方法中，依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义，具体包括：在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义。
[0009] 所述的方法中，选择所述含义对应的语音并发送所述语音，具体包括：在获取对应的所述标准多边形的含义之后，根据所述含义获取语音信号，将所述语音信号形成数据包，向接收端发送数据包。
[0010] 所述的方法中，还包括：接收到来自另一终端的数据包之后，解调所述数据包得到对应的语音信号，根据所述语音信号获取对应的标准多边形，根据所述标准多边形生成对应的手语动作；在所述智能移动终端上显示所述手语动作。
[0011] 一种智能移动终端，包括：摄像单元，用于启动手语通话功能后，拍摄手部的行为形成初始视频；图像处理单元，用于从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；手语处理单元，用于依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；语音单元，用于选择所述含义对应的语音并发送所述语音。
[0012] 所述的智能移动终端中，图像处理单元包括：帧识别模块，用于以第一时间间隔将初始视频划分为多个区段，每一个区段中包含多个帧，在一个区段中选择至少一个清晰的帧；帧处理模块，用于在所述清晰的帧中尝试获取所述手语动作的边界，将成功获取了所述边界的帧确定为所述手语图像。
[0013] 所述的智能移动终端中，图像处理单元还包括：手语动作识别模块，用于基于每一个手语动作具有一个边界，边界具有若干个边界点，将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合，将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合，若判定第一距离集合与第二距离集合不同，则认定手语动作不同。
[0014] 所述的智能移动终端中，手语处理单元包括：特征匹配模块，用于在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义。
[0015] 本发明的上述技术方案的有益效果如下：对于功能障碍人士-例如聋哑人而言，可以拍摄其手部的行为，并通过图像处理分析其手部的行为的具体含义，如此，则能够根据其手部的行为来理解其想要表达的意思，并将这一想要表达的意思转换为语音与对方进行通话。
附图说明
[0016] 图1表示一种进行通话的方法的流程示意图；
[0017] 图2表示一种智能移动终端的结构示意图。
具体实施方式
[0018] 为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。
[0019] 本发明实施例提供一种进行通话的方法，如图1所示，应用于智能移动终端，所述智能移动终端具有拍摄功能，
[0020] 方法包括：
[0021] 步骤101，手语通话功能启动后，拍摄手部的行为形成初始视频；
[0022] 步骤102，从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；
[0023] 步骤103，依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；
[0024] 步骤104，选择所述含义对应的语音并发送所述语音。
[0025] 应用所提供的技术，对于功能障碍人士-例如聋哑人而言，可以拍摄其手部的行为，并通过图像处理分析其手部的行为的具体含义，如此，则能够根据其手部的行为来理解其想要表达的意思，并将这一想要表达的意思转换为语音与对方进行通话。
[0026] 智能移动终端包含有摄像头，因而启动手语通话功能后，若智能移动终端判定当前的通话功能是为功能障碍人士服务，则采用摄像头对手部的行为进行拍摄形成初始视频，实际上，初始视频是由若干个帧组成的。
[0027] 在一个优选实施例中，从初始视频中识别出至少一个手语图像，具体包括：
[0028] 以第一时间间隔将初始视频划分为若干个区段，每一个区段中包含若干个帧，[0029] 在一个区段中选择至少一个清晰的帧，
[0030] 在所述清晰的帧中获取手语动作的边界，该边界围住的区域为所述手语图像。
[0031] 第一时间间隔可以是一个经验值，是根据功能障碍人士的行为习惯确定的，例如，若功能障碍人士平均一秒钟展现一个手部动作，则第一时间间隔即为1秒，若平均半秒钟展现一个手部动作，则第一时间间隔即为0.5秒。
[0032] 其中，清晰的帧是指，在该帧图像中，手部的行为所形成的手语动作与帧图像的背景之间存在明显的差别。
[0033] 在一个优选实施例中，相邻的手语图像中的手语动作不同，具体包括：
[0034] 每一个手语动作具有一个边界，边界具有若干个边界点，
[0035] 在第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合，[0036] 在第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合，[0037] 若判定第一距离集合与第二距离集合不同，则认定手语动作不同。
[0038] 在一个优选实施例中，依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义，具体包括：
[0039] 在手语图像的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义。
[0040] 所述特征点应当包括手掌或手背部位的特征点，大拇指部位的特征点，其他四指部位的特征点，手掌边缘的特征点，手掌与手腕分解处的特征点。
[0041] 在一个优选实施例中，选择所述含义对应的语音并发送，具体包括：
[0042] 在获取对应的所述标准多边形的含义之后，根据所述含义获取语音信号，将所述语音信号形成数据包，向接收端发送数据包。
[0043] 在一个优选实施例中，接收到来自接收端的数据包之后，解调所述数据包得到对应的语音信号，
[0044] 根据所述语音信号获取对应的标准多边形，
[0045] 根据所述标准多边形生成对应的手语动作；
[0046] 显示所述手语动作。
[0047] 聋哑人在打电话过程中通过智能移动终端的摄像头拍摄到手语动作，再将手语动作转化为语音，将聋哑人使用的手语转化成语音输出，这样就可将声音传输给位于接收端的正常人，同理，正常人的语音到达智能移动终端后，在智能移动终端上转化为手语动作并显示给聋哑人看。
[0048] 本发明实施例提供一种智能移动终端，如图2所示，包括：
[0049] 摄像单元201，用于启动手语通话功能后，拍摄手部的行为形成初始视频；
[0050] 图像处理单元202，用于从初始视频中识别出至少一个手语图像，相邻的手语图像中的手语动作不同；
[0051] 手语处理单元203，用于依照顺序在各个手语图像中采集手语动作的特征点，根据所述特征点确定所述手语动作的含义；
[0052] 语音单元204，用于选择所述含义对应的语音并发送所述语音。
[0053] 在一个优选实施例中，图像处理单元202包括：
[0054] 帧识别模块，用于以第一时间间隔将初始视频划分为多个区段，每一个区段中包含多个帧，在一个区段中选择至少一个清晰的帧；
[0055] 帧处理模块，用于在所述清晰的帧中尝试获取所述手语动作的边界，将成功获取了所述边界的帧确定为所述手语图像。
[0056] 在一个优选实施例中，图像处理单元202还包括：
[0057] 手语动作识别模块，用于基于每一个手语动作具有一个边界，边界具有若干个边界点，
[0058] 将第一手语图像中各个边界点到手语图像的边缘的距离组成第一距离集合，[0059] 将第二手语图像中各个边界点到手语图像的边缘的距离组成第二距离集合，[0060] 若判定第一距离集合与第二距离集合不同，则认定手语动作不同。
[0061] 在一个优选实施例中，手语处理单元203包括：
[0062] 特征匹配模块，用于在手语动作的边界之上或者边界之内确定若干个特征点，连接各个特征点形成待测多边形，将所述待测多边形与预先存放的标准多边形进行匹配，匹配成功之后，获取对应的所述标准多边形的含义。
[0063] 智能移动终端不仅能够辅助功能障碍人士向接收端发送语音信号，而且也可以作为接收端，接收来自正常人的语音信号之后，将其转换为手语动作，这一过程包括：接收到来自接收端的数据包之后，解调所述数据包得到对应的语音信号，
[0064] 根据所述语音信号获取对应的标准多边形，
[0065] 根据所述标准多边形生成对应的手语动作；
[0066] 在所述智能移动终端上显示所述手语动作。
[0067] 采用本方案之后的优势是：聋哑人在打电话过程中通过智能移动终端的摄像功能拍摄到手语动作，将手语动作转化为语音输出，这样就可将声音传输给位于接收端的正常人，同理，正常人的语音到达智能移动终端后，在智能移动终端上被转化为手语动作并显示给聋哑人看。
[0068] 以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。