著录项信息
专利名称 | 业务服务器装置及业务提供方法 |
申请号 | CN201280002191.4 | 申请日期 | 2012-05-24 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2013-07-31 | 公开/公告号 | CN103229494A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04M3/493 | IPC分类号 | H;0;4;M;3;/;4;9;3查看分类表>
|
申请人 | 株式会社NTT都科摩 | 申请人地址 | 日本东京都
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 株式会社NTT都科摩 | 当前权利人 | 株式会社NTT都科摩 |
发明人 | 那须和德;柴田精司;阿久泽真理;内山健 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 李辉;朱丽娟 |
摘要
提供容易应对根据说话者的通话内容执行了任务的错误纠正的业务服务器装置。由接受执行与通过声音通信涉及的应用程序执行的任务不同的其他任务的指示的业务起动部、对多个声音通信终端装置间的声音通信中的说话者的声音进行录音的电话/呼叫控制使能器、根据所录音的声音执行任务并制作包含表示所执行的结果的文本数据和表示所执行的结果的声音数据的任务数据的声音识别使能器、文本翻译使能器、声音合成使能器来构成业务服务器装置。通过该业务服务器装置,向多个声音通信终端装置、或与声音通信终端装置关联起来的其他的通信终端装置中的至少一个提供任务数据。
1.一种业务服务器装置,其与通过声音彼此进行声音通信的多个声音通信终端装置连接,提供基于翻译任务的业务,所述翻译任务是由与在该声音通信终端装置之间进行的声音通信涉及的应用程序所执行的任务不同的应用程序执行的作业,该业务服务器装置的特征在于,包括:
指示接受部,其接受执行所述翻译任务的指示;
录音部,其对多个所述声音通信终端装置之间的声音通信中的说话者的声音进行录音;
声音识别部,其在通过所述指示接受部接受了所述指示时,根据由所述录音部录音的声音来制作文本数据;
文本翻译部,其通过将所述声音识别部制作的所述文本数据翻译成被呼叫通信终端装置的用户使用的语言来制作翻译文本数据;
声音合成部,其通过将由所述文本翻译部制作的所述翻译文本数据转换为利用声音来表示的声音,从而制作用于通过合成声音来阅读的声音数据;以及
提供部,其向所有正在进行声音通信的多个所述声音通信终端装置提供任务数据,该任务数据包含由所述声音识别部制作的所述文本数据、由所述文本翻译部制作的所述翻译文本数据和由所述声音合成部制作的所述声音数据。
2.根据权利要求1所述的业务服务器装置,其特征在于,
所述指示接受部获取关于所述业务而预先登记的加入者信息,
在所述加入者信息中包含有确定所述声音通信终端装置的信息时,接受所述指示。
3.根据权利要求1所述的业务服务器装置,其特征在于,
所述声音通信终端装置为电话机,
在多个所述声音通信终端装置中的至少一个使用附加有预先确定的信息的电话号码来发出呼叫的情况下,所述指示接受部接受所述指示。
4.根据权利要求1所述的业务服务器装置,其特征在于,
在被所述录音部录音的声音为表示预先确定的意思的声音的情况下,所述声音识别部开始所述翻译任务的执行。
5.根据权利要求1所述的业务服务器装置,其特征在于,
在通过所述声音通信终端装置的操作而输出的信号为预先确定的信号的情况下,所述声音识别部开始所述翻译任务的执行。
6.根据权利要求1所述的业务服务器装置,其特征在于,
所述提供部代替向所述声音通信终端装置,而向与该声音通信终端装置关联且能够进行基于文本的通信的文本通信终端装置发送所述任务数据中的所述文本数据。
7.根据权利要求6所述的业务服务器装置,其特征在于,
所述指示接受部获取关于所述业务预先登记的加入者信息,
在所述加入者信息中包含用于确定与所述声音通信终端装置关联的所述文本通信终端装置的信息的情况下,所述指示接受部接受所述指示。
8.一种在业务服务器装置中提供业务的业务提供方法,该业务服务器装置与通过声音彼此进行声音通信的多个声音通信终端装置连接,提供基于翻译任务的业务,所述翻译任务是由与在该声音通信终端装置之间进行的声音通信涉及的应用程序所执行的任务不同的应用程序执行的作业,该业务提供方法的特征在于,包含:
指示接受步骤,接受在声音通信期间执行所述翻译任务的指示;
录音步骤,对多个所述声音通信终端装置之间的声音通信中的说话者的声音进行录音;
声音识别步骤,当在所述指示接受步骤中接受了所述指示时,根据在所述录音步骤中录音的声音来制作文本数据;
文本翻译步骤,通过在所述声音识别步骤中制作的所述文本数据翻译成被呼叫通信终端装置的用户使用的语言来制作翻译文本数据;
声音合成步骤,通过将在所述文本翻译步骤中制作的所述翻译文本数据转换为利用声音来表示的声音,从而制作用于通过合成声音来阅读的声音数据;以及提供步骤,向所有正在进行声音通信的多个所述声音通信终端装置提供任务数据,该任务数据包含通过所述声音识别步骤制作的所述文本数据、通过所述文本翻译步骤制作的所述翻译文本数据和通过所述声音合成步骤制作的所述声音数据。
业务服务器装置及业务提供方法\n技术领域\n[0001] 本发明涉及通过通信提供业务的业务服务器装置、业务提供方法、业务提供程序,特别是涉及在基于电话机的通话中提供通话以外的业务的业务服务器装置、业务提供方法、业务提供程序。\n背景技术\n[0002] 当前,将说话者使用任意的语言说话的内容自动地翻译成其他语言的翻译器和翻译系统得到实用化。关于以往的翻译器等,存在称为一人用型或面对面会话型的翻译器、和远程会话型的翻译器。\n[0003] 图8(a)是例示了一人用翻译器的图。在图8(a)中,例如,说话者用日语通过声音向翻译器输入“这本书多少钱?”。于是,通过翻译器的翻译功能,该日语的声音被英译而输出“How much is this book?”的合成声音。一人用的翻译器是作为日英词典来使用,或者能够在通过使面对面中的另一个人听到合成声音而使说话者将自身的意思传递给另一个人时使用。如上所述的以往的翻译器例如记载在非专利文献1中。\n[0004] 图8(b)是例示了远程会话型的翻译器的图。图8(b)所示的翻译器具有电话机的声音通信功能和翻译功能。在图8(b)中,例如,作为说话者的日本人用作为母语的日语将“预约3名”的声音输入到翻译器。于是,通过翻译器的翻译功能,该日语的声音被英译而输出“Please make a reservation for 3 people”的合成声音。远程会话型的翻译器虽然说话者用母语来说话,但是向不能理解该母语的另一个人也能够传递自身的意思。如上所述的以往的翻译器例如记载在非专利文献2中。\n[0005] 而且,作为远程会话型的翻译器,存在在专利文献1中记载的翻译器。在专利文献\n1中记载的电话系统不仅能够翻译电话的内容而发送到通话目的地,而且能够将说话者的通话声音也发送到通话目的地。因此,专利文献1记载的发明似乎能够通过口译向用户付与与通话对方会话的感觉。\n[0006] 现有技术文献\n[0007] 专利文献\n[0008] 专利文献1:专利第3741025号公报\n[0009] 非专利文献\n[0010] 非专利文献1:andro navi,[online],“iTranslator for Android~20カ国語に対応した高機能翻訳アプリ~”,[平成23年5月13日检索],因特网\n[0011] 非专利文献2:iplatform.org,[online],セカイフォン[平成23年5月13日检索],因特网\n发明内容\n[0012] 发明所要解决的问题\n[0013] 但是,在上述非专利文献2的技术中,由于对说话者说话的内容进行翻译的声音仅发送到通话目的地,因此说话者不能知道自身说话的内容如何被识别、翻译。另外,即使是专利文献1记载的发明,由于对说话者说话的内容进行了翻译后的声音和说话者的通话声音仅发送给对方,因此说话者不能知道自身说话的内容如何被系统翻译。而且,在非专利文献1记载的发明中,虽然能够将自身通过声音而输入的内容转换为文本来确认,但是原本就是一人用的翻译器,因此不能一边确认自身通过声音输入的内容一边发送该内容。\n[0014] 因此,即使通过上述的专利文献1、非专利文献1、非专利文献2的技术中的任意一个,在翻译说话者的通话内容时,说话者很难识别自身说话的内容如何被翻译并纠正错误。\n[0015] 本发明是鉴于上述的问题而完成的,其目的在于,提供能够实现容易应对根据说话者的通话内容执行的翻译的错误纠正的业务的业务服务器装置、业务提供方法、业务提供程序。\n[0016] 用于解决问题的手段\n[0017] 为了解决以上的问题,本发明的一方式的业务服务器装置(例如图2所示的业务服务器装置200),其与通过声音彼此进行声音通信的多个声音通信终端装置连接,提供基于其他任务的业务,所述其他任务是由与在该声音通信终端装置之间进行的声音通信涉及的应用程序所执行的任务不同的应用程序执行的作业,该业务服务器装置的特征在于,包括:指示接受部(例如图2所示的业务起动部250),其接受执行上述其他任务的指示;录音部(例如图2所示的电话/呼叫控制使能器201),其对多个上述声音通信终端装置间的声音通信中的说话者的声音进行录音;指示接受部(例如图2所示的业务起动部250),其接受执行上述其他任务的指示;任务执行部(例如图2所示的声音识别使能器203、文本翻译使能器204、声音合成使能器202),其在通过上述指示接受部接受了上述指示时,根据由上述录音部录音的声音来执行上述其他任务;任务数据制作部(例如图2所示的声音识别使能器\n203、文本翻译使能器204、声音合成使能器202),其制作任务数据,该任务数据包含由所述任务执行部执行所述其他任务而得到的文本数据、和由所述任务执行部执行所述其他任务而得到的声音数据;以及提供部(例如图2所示的通信控制部224),其向正在进行声音通信的多个上述声音通信终端装置分别提供上述任务数据。\n[0018] 另外,本发明的一方式的业务服务器装置,在上述发明中,上述提供部能够对所述声音通信终端装置提供所述任务数据和所述说话者的所述声音。\n[0019] 另外,本发明的一方式的业务服务器装置,在上述发明中,所述指示接受部可以获取关于所述业务而预先登记的加入者信息,在所述加入者信息中包含有确定所述声音通信终端装置的信息时,接受所述指示。\n[0020] 另外,本发明的一方式的业务服务器装置,在上述发明中,可以是所述声音通信终端装置为电话机,在多个所述声音通信终端装置中的至少一个使用附加有预先确定的信息的电话号码来发出呼叫的情况下,所述指示接受部接受所述指示。\n[0021] 另外,本发明的一方式的业务服务器装置,在上述发明中,可以在被所述录音部录音的声音为表示预先确定的意思的声音的情况下,所述任务执行部开始所述其他任务的执行。\n[0022] 另外,本发明的一方式的业务服务器装置,在上述发明中,可以在通过所述声音通信终端装置的操作而输出的信号为预先确定的信号的情况下,所述任务执行部开始所述其他任务的执行。\n[0023] 另外,本发明的一方式的业务服务器装置,在上述发明中,所述提供部可以代替向所述声音通信终端装置,而向与该声音通信终端装置关联且能够进行基于文本的通信的文本通信终端装置发送所述任务数据中的所述文本数据。\n[0024] 另外,本发明的一方式的业务服务器装置,在上述发明中,可以是所述指示接受部获取关于所述业务预先登记的加入者信息,在所述加入者信息中包含用于确定与所述声音通信终端装置关联的所述文本通信终端装置的信息的情况下,所述指示接受部接受所述指示。\n[0025] 本发明的一方式的在业务服务器装置中提供业务的业务提供方法,该业务服务器装置与通过声音彼此进行声音通信的多个声音通信终端装置连接,提供基于其他任务的业务,所述其他任务是由与在该声音通信终端装置之间进行的声音通信涉及的应用程序所执行的任务不同的应用程序执行的作业,该业务提供方法的特征在于,包含:指示接受步骤,接受在声音通信期间执行所述其他任务的指示;录音步骤,对多个所述声音通信终端装置之间的声音通信中的说话者的声音进行录音;任务执行步骤,当在所述指示接受步骤中接受了所述指示时,根据在所述录音步骤中录音的声音来执行所述其他任务;任务数据制作步骤,制作任务数据,该任务数据包含通过所述任务执行步骤执行所述其他任务而得到的文本数据以及通过所述任务执行步骤执行所述其他任务而得到的声音数据;以及提供步骤,向正在进行声音通信的多个所述声音通信终端装置分别提供所述任务数据。\n[0026] 本发明的一方式的在业务服务器装置中执行的业务提供程序,该业务服务器装置与通过声音彼此进行声音通信的多个声音通信终端装置连接,提供基于其他任务的业务,所述其他任务是由与在该声音通信终端装置之间进行的声音通信涉及的应用程序所执行的任务不同的应用程序执行的作业,该业务提供程序的特征在于,使计算机实现如下上述的功能:指示接受功能,接受在声音通信期间执行所述其他任务的指示;录音功能,对多个所述声音通信终端装置之间的声音通信中的说话者的声音进行录音;任务执行功能,在通过所述指示接受功能接受了所述指示时,根据通过所述录音功能录音的声音来执行所述其他任务;任务数据制作功能,制作任务数据,该任务数据包含通过所述任务执行功能执行所述其他任务而得到的文本数据以及通过所述任务执行功能执行所述其他任务而得到的声音数据;以及提供功能,向正在进行声音通信的多个所述声音通信终端装置分别提供所述任务数据。\n[0027] 发明效果\n[0028] 根据本发明的上述方式,由于通过执行任务而制作包含文本和声音的任务数据,将它们分别发送到正在进行通话的声音通信终端装置,因此说话者能够与翻译声音一起通过文本接收任务的执行结果。因此,容易应对根据说话者的通话内容执行的任务的错误发现和纠正。\n[0029] 另外,根据本发明的上述方式,能够将任务数据和说话者的声音发送到通话对方。\n因此,在任务数据包含翻译声音时,能够将说话者的翻译声音与任务的执行结果一起发送到通话对方。并且,在本发明的上述方式中,由于通过与基于声音的通信涉及的应用程序不同的应用程序来执行任务,因此能够使用与现有的声音涉及的应用程序和执行任务的应用程序来将说话者的通话声音与任务的执行结果一起发送到通话对方。如上所述的本发明的方式能够提供如下所述的通话业务:使用现有的应用程序,同时虽然处于遥远的地方但具有面对面进行会话那样的现场感。\n附图说明\n[0030] 图1是用于说明成为本发明的实施方式的前提的业务的概要的图。\n[0031] 图2是本发明的实施方式的业务服务器装置的框图。\n[0032] 图3是用于说明通过图2所示的业务服务器装置来进行的处理步骤的图。\n[0033] 图4是用于具体地说明连接图2、图3所示的业务服务器装置与呼叫通信终端装置、被呼叫通信终端装置的CS网、PS网的图。\n[0034] 图5是用于具体地说明连接图2、图3所示的业务服务器装置与呼叫通信终端装置、被呼叫通信终端装置的PS网的图。\n[0035] 图6是用于说明本发明的实施方式的业务提供方法的图。\n[0036] 图7是说明了将本发明应用在调整用户日程的应用程序上的例子的图。\n[0037] 图8(a)是用于说明一般的翻译器的结构的图,图8(b)是用于说明一般的翻译系统的结构的图。\n具体实施方式\n[0038] 以下,参照附图对本发明的业务服务器装置、业务提供方法、业务提供程序的实施方式进行说明。在以下参照的各图中,对于与其他图相同的结构,附上相同的标号来示出,能够省略其说明的一部分。\n[0039] [交流·看门人]\n[0040] 图1是用于说明成为本实施方式的前提的业务的概要的图。该业务支持具有通话 功能的通信终端装置的会话(以下,表述为通话),开发成实现直接见面会话那样的交流。以下还将成为本实施方式的前提的业务记载为CC(交流·管家)业务。\n[0041] 如图1所示,CC业务是向与网络N连接的通信终端装置c1~c5提供的业务。能够将具有通话功能的电话机、与网络N连接而能够通过分组通信来收发文本的通信终端装置(例如,智能机等)、或者能够收发通话声音和文本双方的通信终端装置中的任意一个作为通信终端装置c1~c5来使用。另外,通信终端装置c1~c5也可以不仅收发文本,而且还具有收发静态图像、动态图像、音乐的功能。\n[0042] 在本实施方式中,假设在与网络N连接的通信终端装置c1~c5中的至少一个装置的用户与其他至少一个装置的用户之间进行声音通话的情况。并且,使用电话机进行通话中的用户在该通话中,能够起动别的任务而执行任务。通过执行该起动的任务而得到的信息能够由通话中的电话机或与该电话机对应的其他通信终端装置来接收。\n[0043] 为了实现本实施方式,在使用了电话机的通话中,需要提供基于与通话不同的任务的业务的业务服务器装置。用于实现本实施方式的业务服务器装置执行通话内容的翻译、翻译后的通话内容的合成声音化、向通话声音中插入合成声音而引起的数据(以下,还记载为任务数据)的生成、翻译后的通话内容的文本化、以及将任务数据和被文本化的数据(以下,还记载为文本数据)连动而发送给通话中的电话机等任务。\n[0044] 以下,对用于实现本实施方式的业务服务器装置进行更具体的说明。\n[0045] [业务服务器装置]\n[0046] (i)功能\n[0047] 图2是示出本实施方式的业务服务器装置的一构成例的框图。图2的业务服务器装置200构成为能够与包含多个使能器的使能器组261进行通信。另外,使能器是用于使计算机动作的驱动软件,是指按照各个目的而设计的软件(应用程序)。\n[0048] 使能器组261包括电话功能用的使能器组205、和为了实现在本实施方式中特有的功能即翻译功能而附加的使能器组206。使能器组205包括:会话合作使能器218、数据保管使能器207、设备管理控制使能器208、在场使能器209、电话簿使能器210、SNS(Social Networking Service)使能器211、位置信息检测使能器262、电话/呼叫控制使能器201、发报文使能器212等。\n[0049] 另外,使能器组206包括:要点管理使能器219、共同体管理使能器213、对与应用程序对应的预定信息进行管理的信息管理使能器214、声音合成使能器202、图 像·影像合成/编辑使能器215、字体转换使能器216、声音识别使能器203、图像·影像识别使能器\n217、文本翻译使能器204等。\n[0050] 另外,电话功能用的使能器组205是基于声音的通信涉及的使能器的集合。另外,使能器组206是与基于声音的通信涉及的应用程序不同的使能器的集合。即、在本说明书中,包含在使能器组205中的使能器是通过基于声音的通信涉及的应用程序来执行的任务,而包含在使能器组206中的使能器是通过与通过基于声音的通信涉及的应用程序所执行的任务不同的应用程序所执行的作业、即其他任务。\n[0051] 在使能器组261中包含的使能器组205和206构成用于在网络侧提供业务的环境、所谓的业务·使能器·网络(以下,记载为SEN)2。SEN2与能够提供包含翻译业务的多个业务的多个因特网玩家P合作而能够提供各种业务。\n[0052] 在本实施方式中,为了进行翻译涉及的任务,业务服务器装置200获取使能器组\n205的电话/呼叫控制使能器201而保存在业务应用部中。另外,业务服务器装置200从使能器组206将声音合成使能器202、声音识别使能器203、文本翻译使能器204保存在业务应用部中。另外,如上所述,在本实施方式中,所有的业务应用部包含业务起动部250。其结果,在本实施方式中,业务应用部成为提供翻译涉及的业务的业务应用部225。\n[0053] 业务服务器装置200能够选择在与业务类别对应的任务的执行中所需的使能器并获取。将通过业务服务器装置200获取的使能器作为后述的业务应用(业务·应用程序·软件)部按照每个业务保存在业务服务器装置200中。\n[0054] 通过如上所述的结构,本实施方式的业务服务器装置200能够将现有的使能器组合来构筑在业务中所需的应用程序。因此,根据本实施方式,不需要重新开发专用的应用程序,不产生与应用程序的开发有关的时间和成本。而且,根据本实施方式,由于能够使用有实绩的现有应用程序来提供业务,因此与开发新的应用程序相比,能够提供可靠性高的业务。\n[0055] 在本实施方式中,呼叫通信终端装置241a、被呼叫通信终端装置241b彼此一边通话一边通过业务服务器装置200来接受业务的提供。在向呼叫通信终端装置241a、被呼叫通信终端装置241b提供业务时,业务服务器装置200执行任务。本实施方式中的呼叫通信终端装置241a和被呼叫通信终端装置241b例如是一并具有电话机的功能和能够收发文本、静态图像、动态图像等的功能的便携电话机。\n[0056] 业务服务器装置200除了具有与业务对应的使能器的业务应用部以外,还具有作为电话机的对通话进行控制的现有的结构。作为控制通话的结构,存在保存与CC业务的加入者(即接受CC业务的提供的用户,以下简单记载为“用户”)有关的数据的加入者简介积蓄部221、对CC业务提供的请求进行认证、许可的认证许可部222、进行与在通话中征收的费用有关的处理的收费处理部223、对通话和分组通信进行控制的通信控制部224。通信控制部224还具有作为分别向呼叫通信终端装置241a、和被呼叫通信终端装置241b提供任务数据的提供部的功能。\n[0057] 在加入者简介积蓄部221中,与用户的姓名和正在使用的电话机的电话号码一起,预先登记有用户使用的语言的种类。除此以外,在加入者简介积蓄部221中,作为确定电话机的信息,登记有在电话机的数据通信会话中包含的MSISDN(Mobile Subscriber ISDN Number:在电话机的SIM卡中登记的电话号码)。而且,为了将上述的平板PC或相框等装置与电话机关联起来,只要将这些装置的标识符与相应电话机的电话号码对应起来而登记到加入者简介积蓄部221中即可。\n[0058] 业务服务器装置200能够具有多个业务应用部225、226、227。另外,在实施方式1中,还能够使多个业务应用部225、226、227作为例如能够存储多个使能器的存储区域。在如上所述的情况下,能够通过所存储的使能器来使该存储区域成为业务应用部225、226、\n227中的任意一个。另外,在成为本实施方式的业务应用部的存储区域中,存储有业务起动部250。该业务起动部250为了例如接受从呼叫通信终端装置241a通过IP网络230发送的指示来提供业务而具有将使能器起动的功能。\n[0059] 在本实施方式中,当用户操作了呼叫通信终端装置241a时,业务起动部250起动在业务应用部225中保存的使能器。当保存在该业务应用部225中的使能器起动时,开始执行任务。在呼叫通信终端装置241a、被呼叫通信终端装置241b之间的通信中,起动的电话/呼叫控制使能器201对说话者的声音(以下,记载为通话声音)进行录音。另外,通话声音的录音也可以是对电话/呼叫控制使能器201具备的公知的自动录音电话的录音进行控制的功能,使用自动录音电话的通话声音录音功能来进行。\n[0060] 声音识别使能器203根据所录音的声音制作文本数据。声音识别使能器203例如通过形态学分析来对所录音的声音进行分析,将该声音转换为文本数据。\n[0061] 文本翻译使能器204通过将声音识别使能器203制作的文本数据翻译成被呼叫通信终端装置241b的用户使用的语言来制作翻译文本数据。\n[0062] 声音合成使能器202通过将由文本翻译使能器204制作的翻译文本数据转换为利用声音来表示的声音,从而来制作用于通过合成声音来阅读的声音数据。\n[0063] 在本实施方式中,将通过声音合成使能器202制作的声音数据与通话声音一起提供给呼叫通信终端装置241a、被呼叫通信终端装置241b。另外,在本实施方式中,通过声音识别使能器203制作的文本数据和通过文本翻译使能器204生成的翻译文本数据也提供给呼叫通信终端装置241a、被呼叫通信终端装置241b。在本实施方式中,还将声音数据、文本数据以及翻译文本数据一并记载为任务数据。\n[0064] 如上所述,在声音识别使能器203、文本翻译使能器204、声音合成使能器202通过业务起动部250接受了执行任务的指示时,根据通过电话/呼叫控制使能器201录音的声音来执行任务,通过任务的执行来制作任务数据。将该任务数据提供给呼叫通信终端装置\n241a和被呼叫通信终端装置241b。\n[0065] 在如上所述构成的本实施方式的业务服务器装置中,业务起动部250作为指示接受部来发挥功能。另外,电话/呼叫控制使能器201作为录音部来发挥功能,声音识别使能器203、文本翻译使能器204、声音合成使能器202作为任务执行部和任务数据制作部来发挥功能。\n[0066] 另外,在本实施方式中,业务起动部250也可以不在呼叫通信终端装置241a、被呼叫通信终端装置241b指示提供业务之后立即起动各使能器,而是从加入者简介积蓄部221获取预先登记的加入者信息。并且,当在加入者信息中包含用于确定呼叫通信终端装置\n241a、被呼叫通信终端装置241b中的至少任意一方的信息时,也可以接受呼叫通信终端装置241a、被呼叫通信终端装置241b的指示。\n[0067] 另外,在本实施方式中,也可以将业务起动部250的起动条件设定成在指示业务的提供时,使便携电话机在本机的电话号码上附加预先设定的特定号码等信息后呼叫。在如上所述设定了起动条件时,在呼叫通信终端装置241a、被呼叫通信终端装置241b中的至少任意一方使用附加了预先设定的信息的电话号码来发出呼叫的情况下,业务起动部250接受呼叫通信终端装置241a、被呼叫通信终端装置241b的指示。\n[0068] 而且,本实施方式不限定于业务起动部250根据由呼叫通信终端装置241a、被呼叫通信终端装置241b的操作而输出的信号来起动各使能器。例如,在输入了通过电话/呼叫控制使能器201而录音的通话声音时,也可以由业务起动部250起动各使能器而开始任务的执行。如上所述,在构成业务起动部250时,预先设定能够确定应 用程序的文言,例如“开始翻译”等文言。并且,作为对声音识别使能器203录音的通话声音进行了形态学分析的结果,仅当在通话声音中包含预先设定的文言时,业务起动部250才起动各使能器来执行任务。\n[0069] 在以上说明的本实施方式中,呼叫通信终端装置241a、被呼叫通信终端装置241b不限定于能够发送文本的便携电话机。在呼叫通信终端装置241a、被呼叫通信终端装置\n241b为仅具有通话功能的电话机时,也可以根据来自仅具有通话功能的电话机的请求,将任务的执行结果发送到预先与该电话机关联起来的平板PC242a、242b和相框243a、243b。\n[0070] (ii)处理步骤\n[0071] 图3是用于说明通过图2所示的业务服务器装置进行的处理步骤的图。\n[0072] 在图2所示的业务应用部225中,通过图2所示的电话/呼叫控制使能器201来执行通话声音的录音(步骤S311)。通话声音的录音是将从没有对声音进行录音的状态(以下,还记载为无录音状态)到下一个无录音状态为止的期间发出的通话声音作为1个单位来进行的。接着,通过声音识别使能器203对声音进行形态学分析,进行分析。分析是按照每个作为1个单位被录音的通话声音来进行的。并且,根据分析结果将通话声音转换为文本数据(步骤S312)。\n[0073] 接着,在业务应用部225中,通过文本翻译使能器204,将在步骤S312中被转换的文本数据翻译成预先由被呼叫通信终端装置241b的用户在加入者简介积蓄部221中登记的语言的翻译文本数据(步骤S313)。将翻译后的翻译文本数据转换为合成声音,成为声音数据(步骤S314)。而且,将声音数据插入到通话声音中(步骤S315)。\n[0074] 此处,“将声音数据插入到通话声音中”是指确定与通话声音一起发送声音数据的定时。如上所述通过确定声音数据的发送定时,通话声音如通常那样通过CS(Circuit Switched,线路切换)网发送到呼叫通信终端装置241a、被呼叫通信终端装置241b。另外,虽然声音数据也经由CS网通过数据通信会话发送到呼叫通信终端装置241a、被呼叫通信终端装置241b,但是也能够经由PS网(Packet Switched,分组切换)来发送。而且,对通话声音进行翻译而文本化的文本数据利用PS网发送。另外,在图3中,对CS网和PS网标注标号320来示出。\n[0075] 但是,本实施方式不限定于通过CS网发送通话声音。例如,也可以将通话声音 与声音数据一起通过PS网而发送到呼叫通信终端装置241a、被呼叫通信终端装置241b。\n[0076] 在本实施方式中,如上所述,将在从无录音状态到下一个无录音状态为止的期间发出的通信声音作为1个单位来进行录音、识别、翻译而制作任务数据,每次都发送到呼叫通信终端装置241a、被呼叫通信终端装置241b,能够获取通话声音与任务数据的同步而发送到呼叫通信终端装置241a、被呼叫通信终端装置241b。\n[0077] 在本实施方式中,为了避免通话的不自然感,将通话声音如通常那样实时地发送到通信目的地的呼叫通信终端装置241a、被呼叫通信终端装置241b。因此,通过在通话声音中插入声音数据,从而对于用户而言基于声音数据的声音有可能重叠在通话声音上被听到。但是,在通过口译者进行会话时,一般认为存在人在口译者进行说话的期间会控制自身说话的倾向。因此,很难引起基于声音数据的声音与通话声音重叠而对会话带来障碍的情况。\n[0078] 在本实施方式中,呼叫通信终端装置241a、被呼叫通信终端装置241b双方都访问业务应用部225而获取文本数据、翻译文本数据以及声音数据。如上所述,将通过业务应用部225连接呼叫通信终端装置241a、被呼叫通信终端装置241b的方式称为桥连接。\n[0079] 另外,在图1所示的业务服务器装置200中,能够通过公知的方法识别呼叫通信终端装置241a的电话线路和被呼叫通信终端装置241b的电话线路。因此,能够区别呼叫通信终端装置241a的上行线路u1、下行线路d1、被呼叫通信终端装置241b的上行线路u2、下行线路d2,能够适当地翻译用户的话语而发送到通话对方。\n[0080] 根据以上说明的本实施方式,能够将通话声音、合成声音的声音数据、文本数据、翻译文本数据提供给呼叫通信终端装置241a、被呼叫通信终端装置241b。因此,用户能够容易地识别自身说话的内容如何被业务服务器装置200识别,如果存在误译等则能够快速地进行纠正等应对。另外,由于用户能够听到通话对方的通话声音和将其进行了翻译后的声音数据双方,因此能够实现似乎在之间经由口译者进行会话那样的具有临场感的会话。\n[0081] (iii)CS网和PS网\n[0082] 图4是为了具体地说明连接图2、图3所示的业务服务器装置200与呼叫通信终端装置241a、被呼叫通信终端装置241b的CS网404、PS网405的图。\n[0083] 呼叫通信终端装置241a向MPN(媒介·处理·节点)408发出呼叫。该发出呼叫信号到达CS网404、现有的电话系统装置401。现有的电话系统装置401是指例如CSN(认证装置,用于实现切换的本地代理器、DHCP服务器等)、ASN(无线基站等)。在现有的电话系统装置401中,对于发出呼叫执行不收费处理和特殊号码路由处理。另外,不收费处理是使得不进行在一般通话中的收费处理的处理。另外,特殊号码路由是指在对预先确定的电话号码(特殊号码)发出呼叫时,将通信路径变更为进行与原来的处理不同的处理的通信路径。\n[0084] 接着,发出呼叫信号从现有的电话系统装置401到达本实施方式的业务服务器装置200。由于在业务服务器装置200中具备控制如图1所示的电话机的通信的通信控制部\n224、加入者简介积蓄部221、认证许可部222、收费处理部223,因此通过如上所述的结构进行来自其他网的业务限制和声音与画面的合作(声音数据与文本数据等的合作)的处理。\n[0085] 声音数据与文本数据及翻译文本数据的合作能够以如下所述的方式来实现。\n[0086] 即、在能够得到本业务的提供的电话机成为通话状态时,业务服务器装置200的通信控制部224开始监视包含与在电话机的通话涉及的信号中包含的MSISDN一致的MSISDN的数据通信会话的执行。并且,在进行了与通话涉及的信号中包含的MSISDN一致的数据会话时,判断为应该在CC业务中使该通话与数据会话合作。根据如上所述的方法,在将通话声音与声音数据、文本数据以及翻译文本数据发送到一个通信终端装置时,能够取得通过CS网404发送的通话声音与通过PS网405发送的任务数据的合作。\n[0087] 另外,如上所述,在本实施方式中,能够将通话声音与声音数据同样地通过PS网\n405来发送。将通话声音与声音数据等一起通过PS网405发送的结构在图5中示出。\n[0088] 另外,在实施方式1中,在图2所示的加入者简介积蓄部221中,如上所述,将仅具有通话功能的电话机与能够发送文本等的通信终端装置关联起来进行登记。在如上所述的情况下,当利用电话机的电话号码发出了呼叫时,通信控制部224也可以向所登记的通信终端装置的地址发送能够取得任务数据的URL。\n[0089] 另外,在MPN408中通过电话/呼叫控制使能器201来对与发出呼叫对应的通话声音进行录音,传递给业务服务器装置200。\n[0090] 在业务服务器装置200中,根据应用部225录音的通话声音来制作声音数据与文本数据及翻译文本数据。将声音数据经由CS网而发送到被呼叫通信终端装置241b。另外,对于声音数据的发送,还能够利用PS网。另外,将文本数据和翻译文本数据从现有的Web系统装置402(网关等)或xGSN(x-GPRS Support Node,x-GPRS支持节点)/EPC(Evolved Packet Core,分组核心演进)经由PS网405发送到被呼叫通信终端装置241b。\n[0091] (iv)业务提供方法\n[0092] 图6是用于说明通过本实施方式的业务服务器装置200来实现的业务提供方法。\n在图6中,用虚线来示出使用了HTTP(Hypertext Transfer Protocol)的数据通信,用实线来示出电话机的通话。\n[0093] 在呼叫通信终端装置241a中,用户启动例如用于实现本实施方式的业务提供方法的应用程序,并且输入对方的电话号码(步骤S501)。通过如上所述的处理,从呼叫通信终端装置241a将呼叫通信终端装置241a的地址发送到业务服务器装置。并且,在业务服务器装置200中,以满足其他必要的要件为条件,接受在执行通信(通话)期间执行任务的指示而开始翻译业务(步骤S502)。\n[0094] 业务服务器装置200建立与呼叫通信终端装置241a、被呼叫通信终端装置241b之间的通话线路(步骤S503)。并且,业务服务器装置200对从呼叫通信终端装置241a的线路发送的通话声音进行录音(步骤S504),并且送出到被呼叫通信终端装置241b的线路(步骤S505)。\n[0095] 当成为不从呼叫通信终端装置241a的线路发送来通话声音的无录音状态时,业务服务器装置200暂时结束从呼叫通信终端装置241a的线路发送来的通话声音的录音(步骤S506)。并且,关于所录音的通话声音,通过图2、图3所示的声音识别使能器203、文本翻译使能器204、声音合成使能器202进行文本化、翻译、合成声音的合成(步骤S507),制作声音数据与文本数据及翻译文本数据。\n[0096] 并且,本实施方式的业务服务器装置200将声音数据发送到呼叫通信终端装置\n241a、241b双方,并且将文本数据和翻译文本数据也发送到呼叫通信终端装置241a、被呼叫通信终端装置241b双方(步骤S508~511)。接着,当被呼叫通信终端装置241b的用户说话时,业务服务器装置200对从被呼叫通信终端装置241b的电话线路发送的用户的通话声音执行以上的动作。另外,当在2个用户中的一方发言的期间另 一方发言时,在本实施方式中,对于正在对通话声音进行录音中的用户的通话声音执行以上的处理,对于另一方的用户说话的内容不作为处理对象。\n[0097] 另外,本实施方式不限定于以上说明的结构。即、在以上说明的本实施方式中,将2个用户之间的通话作为对象来执行翻译涉及的CC业务。但是,在本实施方式中,不限定于将2人之间的通话作为对象,也能够在3人以上通话的会议电话等中应用。\n[0098] 而且,本发明不限定于在本实施方式的翻译涉及的应用程序中应用的结构。图7是说明了将本发明的业务服务器装置、业务控制方法、业务控制程序应用到调整用户日程的应用程序中的例子的图。\n[0099] 在图7所示的例子中,在呼叫通信终端装置641a、被呼叫通信终端装置641b的通信中,业务服务器装置提供与基于声音的通信不同的调度任务的业务。在如上所述的例子中,操作呼叫通信终端装置641a等而向业务服务器装置指示,以在呼叫通信终端装置641a的用户通话的期间执行调度任务。当业务服务器装置接受了指示时,在呼叫通信中,对呼叫通信终端装置641a、被呼叫通信终端装置641b的用户的通话声音进行录音。\n[0100] 在图7所示的例子中,业务服务器装置从呼叫通信终端装置641a、被呼叫通信终端装置641b的电话线路获取通话声音而分别进行录音。图2所示的声音识别部对所录音的通话声音进行形态学分析等而检测在通话声音中包含意味着“日程调整”的声音。由于在通话声音中包含有“日程调整”,因此判断为指示了执行抽出呼叫通信终端装置641a、被呼叫通信终端装置641b的用户的日程中双方都空闲的日期时刻及其时间段的任务。\n[0101] 并且,例如图2所示的信息管理使能器214作为日程信息管理部来发挥功能,获取登记在呼叫通信终端装置641a、被呼叫通信终端装置641b中的用户的日程数据。信息管理部214从所获取的日程数据抽出没有登记有2个用户的预定安排的日子及其时间段。将所抽出的日期时刻作为包含文本数据的图像数据发送到呼叫通信终端装置641a、被呼叫通信终端装置641b双方。\n[0102] 根据如上所述的结构,对于呼叫通信终端装置641a、被呼叫通信终端装置641b的用户,能够简单且无误地调整日程,而且能够提供与直接面对面进行日程调整相同的具有现场感的交流。\n[0103] (v)业务提供程序\n[0104] 在以上说明的业务服务器装置中,在能够通过声音进行通信的声音通信终端装置间的通信中,执行用于提供与基于声音的通信不同的任务的业务的业务提供程序。该业务提供程序是使计算机实现如下所述的功能的程序:接受在声音通信期间执行其他任务的指示的指示接受功能;在多个上述声音通信终端装置间的声音通信中对说话者的声音进行录音的录音功能;在通过上述指示接受功能而接受了上述指示时,根据通过上述录音功能录音的声音来执行该任务的任务执行功能;制作包含通过在上述任务执行功能中执行任务而得到的文本或声音的任务数据的任务数据制作功能;向进行声音通信的声音通信终端装置、或向与声音通信终端装置关联且能够进行基于文本的通信的文本通信终端装置提供任务数据的功能。\n[0105] 另外,本发明的范围不限定于图示并记载的例示的实施方式,还包含提供与本发明作为目的的效果均等的效果的所有实施方式。而且,本发明的范围不限定于通过权利要求划定的发明特征的组合,能够通过在所有公开的各个特征中的特定特征的所有期望的组合来划定。\n[0106] 工业上的可利用性\n[0107] 本发明提供对支持使用了智能受机等的交流最佳的业务提供装置、业务提供方法以及业务提供程序。\n[0108] 标号说明:\n[0109] 200 业务服务器装置\n[0110] 201 电话/呼叫控制使能器\n[0111] 202 声音合成使能器\n[0112] 203 声音识别使能器\n[0113] 204 文本翻译使能器\n[0114] 205、206、261 使能器组\n[0115] 208 设备管理控制使能器\n[0116] 209 在场使能器\n[0117] 210 电话簿使能器\n[0118] 211 SNS使能器\n[0119] 212 发报文使能器\n[0120] 213 共同体管理使能器\n[0121] 214 信息管理使能器\n[0122] 215 编辑使能器\n[0123] 216 字体转换使能器\n[0124] 217 图像·影像识别使能器\n[0125] 218 会话合作使能器\n[0126] 219 要点管理使能器\n[0127] 221 加入者简介积蓄部\n[0128] 222 认证许可部\n[0129] 223 收费处理部\n[0130] 224 通信控制部\n[0131] 225、226、227 业务应用部\n[0132] 230 网络\n[0133] 241a、641a 呼叫通信终端装置\n[0134] 241b、641b 被呼叫通信终端装置
法律信息
- 2020-05-15
未缴年费专利权终止
IPC(主分类): H04M 3/493
专利号: ZL 201280002191.4
申请日: 2012.05.24
授权公告日: 2015.06.24
- 2015-06-24
- 2013-08-28
实质审查的生效
IPC(主分类): H04M 3/493
专利申请号: 201280002191.4
申请日: 2012.05.24
- 2013-07-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-05-11
|
2009-11-02
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |