对文本进行自动注音处理及显示的方法和装置

发明专利有效专利

申请号：
CN201410032479.7
IPC分类号：G06F17/21;G06F17/28
申请日期：
2014-01-23
申请人：
北京百度网讯科技有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	对文本进行自动注音处理及显示的方法和装置
申请号	CN201410032479.7	申请日期	2014-01-23
法律状态	授权	申报国家	中国
公开/公告日	2014-05-14	公开/公告号	CN103793364A
优先权	暂无	优先权号	暂无
主分类号	G06F17/21 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06F 电数字数据处理（基于特定计算模型的计算机系统入G06N） G06F17/00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法〔6〕 G06F17/20 处理自然语言数据的（语言分析或综合入G10L）〔6〕 G06F17/21 文本处理（G06F 17/27、G06F 17/28优先）〔6〕	IPC分类号	G;0;6;F;1;7;/;2;1;;;G;0;6;F;1;7;/;2;8查看分类表>
申请人	北京百度网讯科技有限公司	申请人地址	北京市海淀区上地十街10号百度大厦2层变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	北京百度网讯科技有限公司	当前权利人	北京百度网讯科技有限公司
发明人	韩中华;何中军;吴华;王海峰
代理机构	北京清亦华知识产权代理事务所（普通合伙）	代理人	宋合成

摘要

本发明提出一种对文本进行自动注音处理及显示的方法和装置，其中，对文本进行自动注音处理的方法包括：基于隐码模型将源语言的文本转换为目标语言的注音文本；获得需求用户的标识信息；接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。本发明的对文本进行自动注音处理的方法可以根据外文源语言文本自动生成易理解的或易发音的中文注音文本，并主动将中文注音文本提供给需求用户，便于需求用户轻松的学习外文源语言歌曲的发音，用户体验度高，并且成本低。

1.一种对文本进行自动注音处理的方法，其特征在于，包括：
基于隐码模型将源语言的文本转换为目标语言的注音文本，其中所述基于隐码模型将源语言的文本转换为目标语言的注音文本，包括在线处理和线下处理，所述隐码模型为：
其中，为源语言序列，为目标语言序列，为
源语言到源语言音素的概率，为源语言音素到目标语言音素的概率，为目标语言音素到目标语言序列的概率，为目标语言音素，为转移概率，π为统计语言模型得到的初始状态，
为目标语言音素到目标语言的概率，为语言模型的概率；
获得需求用户的标识信息，其中，接收所有用户通过客户端发送的文本需求信息，统计每个用户需求文本的语言类型包括所述源语言的所述文本需求信息的次数，将所述次数大于预定次数的用户确定为所述需求用户；或者根据预设条件确定所述需求用户；以及接收当前用户通过客户端发送的当前文本需求信息，根据所述标识信息确定所述当前用户为所述需求用户，根据所述当前文本需求信息向所述客户端发送对应的注音文本，以用于向所述当前用户进行展现，其中，在所述根据所述标识信息确定所述当前用户为所述需求用户之前，所述方法还包括：确定接收到的所述当前文本需求信息中包含的需求文本的语言类型为所述源语言。
2.如权利要求1所述的方法，其特征在于，所述文本需求信息中包含需求文本的语言类型和名称。
3.一种对注音文本进行显示的方法，其特征在于，包括：
向服务器发送当前用户的当前文本需求信息；
接收所述服务器发送的注音文本，以预定方式显示所述注音文本，以用于向所述当前用户进行展现，其中，当所述注音文本为注音歌词时，所述以预定方式显示所述注音文本包括：在原歌词下方显示所述注音文本；或者获得所述当前用户的切换请求，在显示所述原歌词的位置显示所述注音文本，其中，在所述在显示所述原歌词的位置显示所述注音文本之后，所述方法还包括：获得所述当前用户的切换请求，在显示所述注音文本的位置显示所述原歌词；
其中，所述注音文本为所述服务器根据所述当前文本需求信息基于隐码模型转换后得到的注音文本，基于隐码模型将所述当前文本需求信息转换为注音文本，包括在线处理和线下处理，所述隐码模型为：其中，为源语言序
列，为目标语言序列，为源语言到源语言音素的概率，为源语言音素
到目标语言音素的概率，为目标语言音素到目标语言序列的概率，为目标语言音素，为转移概率，π为统计语言模型得到的初始状态，
为目标语言音素到目标语言的
概率，为语言模型的概率。
4.如权利要求3所述的方法，其特征在于，所述当前文本需求信息中包含的需求文本的语言类型为源语言。
5.一种对文本进行自动注音处理的装置，其特征在于，包括：
注音模块，用于基于隐码模型将源语言的文本转换为目标语言的注音文本，其中所述基于隐码模型将源语言的文本转换为目标语言的注音文本，包括在线处理和线下处理，所述隐码模型为：其中，为源语言序列，为目标语言序列，
为源语言到源语言音素的概率，为源语言音素到目标语言音素的概率，为目标语言音素到目标语言序列的概率，为目标语言音素，为转
移概率，π为统计语言模型得到的初始状态，
为目标语言音素到目标语言的概率，为语言模型的概率；
获得模块，用于获得需求用户的标识信息，其中，接收所有用户通过客户端发送的文本需求信息，统计每个用户需求文本的语言类型包括所述源语言的所述文本需求信息的次数，将所述次数大于预定次数的用户确定为所述需求用户；或者根据预设条件确定所述需求用户；以及
收发模块，用于接收当前用户通过客户端发送的当前文本需求信息，根据所述标识信息确定所述当前用户为所述需求用户，根据所述当前文本需求信息向所述客户端发送对应的注音文本，以用于向所述当前用户进行展现；
其中，所述收发模块，还用于：在根据所述标识信息确定所述当前用户为所述需求用户之前，确定接收到的所述当前文本需求信息中包含的需求文本的语言类型为所述源语言。
6.如权利要求5所述的装置，其特征在于，所述文本需求信息中包含需求文本的语言类型和名称。
7.一种对注音文本进行显示的装置，其特征在于，包括：
发送模块，用于向服务器发送当前用户的当前文本需求信息；
显示模块，用于接收所述服务器发送的注音文本，以预定方式显示所述注音文本，以用于向所述当前用户进行展现，其中，当所述注音文本为注音歌词时，所述显示模块，具体用于：在原歌词下方显示所述注音文本；或者获得所述当前用户的切换请求，在显示所述原歌词的位置显示所述注音文本，所述显示模块，还用于：在显示所述原歌词的位置显示所述注音文本之后，获得所述当前用户的切换请求，在显示所述注音文本的位置显示所述原歌词；
其中，所述注音文本为所述服务器根据所述当前文本需求信息基于隐码模型转换后得到的注音文本，基于隐码模型将所述当前文本需求信息转换为注音文本，包括在线处理和线下处理，所述隐码模型为：其中，为源语言序列，
为目标语言序列，为源语言到源语言音素的概率，为源语言音素到
目标语言音素的概率，为目标语言音素到目标语言序列的概率，为目标语言音素，为转移概率，π为统计语言模型得到的初始状态，
为目标语言音素到目标语言的
概率，为语言模型的概率。
8.如权利要求7所述的装置，其特征在于，所述当前文本需求信息中包含的需求文本的语言类型为源语言。

对文本进行自动注音处理及显示的方法和装置\n技术领域\n[0001] 本发明涉及计算机技术领域，尤其涉及一种对文本进行自动注音处理的方法和装置以及一种对注音文本进行显示的方法和装置。\n背景技术\n[0002] 随着信息的获取越来越便利，很多歌唱爱好者开始对各种外文歌曲感兴趣，但却常常被各种不了解的文字所困扰。\n[0003] 为了便于歌唱爱好者理解歌曲内容，相关技术中，各种音乐播放器或视频播放器对于外文歌曲，通常在播放时同步显示相应语言或经过翻译的Lrc（Lyric，歌词）格式的歌词。\n[0004] 上述相关技术的缺点是：对于完全不知道如何发音的歌唱爱好者，例如对于不懂外文的中国一般学习者，无论播放器的音频或视频提供的是歌词原文还是经过翻译的歌词，都是没有意义的。另外，向懂外文但发音不准的中国学习者提供歌词原文或经过翻译的歌词，并不能解决中国学习者在学习唱外文歌曲时的发音问题。\n[0005] 因此，迫切需要解决用户无法理解相关技术中提供的外文歌词，或无法根据该外文歌词进行准确的发音等问题。\n发明内容\n[0006] 本发明旨在至少解决上述技术问题之一。\n[0007] 为此，本发明的第一个目的在于提出一种对文本进行自动注音处理的方法。该对文本进行自动注音处理的方法可以根据外文源语言文本自动生成易理解的或易发音的中文注音文本，并主动将中文注音文本提供给需求用户，便于需求用户轻松的学习外文源语言歌曲的发音，用户体验度高，并且成本低。\n[0008] 本发明的第二个目的在于提出一种对注音文本进行显示的方法。该对注音文本进行显示的方法可以使得用户根据需求和习惯灵活的选择中文注音文本的显示方式，使用方便，可操作性好，并且用户体验度高。\n[0009] 本发明的第三个目的在于提出一种对文本进行自动注音处理的装置。\n[0010] 本发明的第四个目的在于提出一种对注音文本进行显示的装置。\n[0011] 为了实现上述目的，本发明第一方面实施例的对文本进行自动注音处理的方法，包括以下步骤：基于隐码模型将源语言的文本转换为目标语言的注音文本；获得需求用户的标识信息；以及接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。\n[0012] 本发明实施例的对文本进行自动注音处理的方法在接收到当前用户通过客户端发送的当前文本需求信息之后，根据已经获得的需求用户的标识信息确定当前用户为需求用户，进而根据当前文本需求信息向客户端发送基于隐码模型对当前文本进行转换后的注音文本。该对文本进行自动注音处理的方法可以根据源语言文本自动生成注音文本并主动将注音文本提供给需求用户，获取方便。\n[0013] 为了实现上述目的，本发明第二方面实施例的对注音文本进行显示的方法，包括以下步骤：向服务器发送当前用户的当前文本需求信息；接收服务器发送的注音文本，以预定方式显示注音文本，以用于向当前用户进行展现；其中，注音文本为服务器根据当前文本需求信息基于隐码模型转换后得到的注音文本。\n[0014] 本发明实施例的对注音文本进行显示的方法通过向服务器发送当前用户的当前文本需求信息来获得注音文本，进而以预定的方式显示该注音文本。该对注音文本进行显示的方法使用方便，可操作性好。\n[0015] 为了实现上述目的，本发明第三方面实施例的对文本进行自动注音处理的装置，包括：注音模块，用于基于隐码模型将源语言的文本转换为目标语言的注音文本；获得模块，用于获得需求用户的标识信息；以及收发模块，用于接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。\n[0016] 本发明实施例的对文本进行自动注音处理的装置在收发模块接收到当前用户通过客户端发送的当前文本需求信息之后，根据获得模块已经获得的需求用户的标识信息确定当前用户为需求用户，进而根据当前文本需求信息向客户端发送注音模块基于隐码模型对当前文本进行转换后的注音文本。该对文本进行自动注音处理的装置可以根据源文本自动生成注音文本并主动将注音文本提供给需求用户，获取方便。\n[0017] 为了实现上述目的，本发明第四方面实施例的对注音文本进行显示的装置，包括：\n发送模块，用于向服务器发送当前用户的当前文本需求信息；显示模块，用于接收服务器发送的注音文本，以预定方式显示注音文本，以用于向当前用户进行展现；其中，注音文本为服务器根据当前文本需求信息基于隐码模型转换后得到的注音文本。\n[0018] 本发明实施例的对注音文本进行显示的装置通过发送模块向服务器发送当前用户的当前文本需求信息，进而显示模块以预定的方式显示服务器发送的注音文本。该对注音文本进行显示的装置使用方便，可操作性好。\n[0019] 本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。\n附图说明\n[0020] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中，\n[0021] 图1是根据本发明一个实施例的对文本进行自动注音处理的方法的流程图；\n[0022] 图2是根据本发明另一个实施例的对文本进行自动注音处理的方法的流程图；\n[0023] 图3是根据本发明再一个实施例的对文本进行自动注音处理的方法的流程图；\n[0024] 图4是根据本发明一个实施例的对注音文本进行显示的方法的流程图；\n[0025] 图5是根据本发明另一个实施例的对注音文本进行显示的方法的流程图；\n[0026] 图6是根据本发明一个实施例的注音文本的显示界面一的示意图；\n[0027] 图7是根据本发明一个实施例的注音文本的显示界面二的示意图；\n[0028] 图8是根据本发明一个实施例的由原歌词切换至注音文本的显示界面一的示意图；\n[0029] 图9是根据本发明一个实施例的由原歌词切换至注音文本的显示界面二的示意图；\n[0030] 图10是根据本发明一个实施例的由原歌词切换至注音文本的显示界面三的示意图；\n[0031] 图11是根据本发明再一个实施例的对注音文本进行显示的方法的流程图；\n[0032] 图12是根据本发明另一个实施例的由注音文本切换至原歌词的显示界面一的示意图；\n[0033] 图13是根据本发明另一个实施例的由注音文本切换至原歌词的显示界面二的示意图；\n[0034] 图14是根据本发明另一个实施例的由注音文本切换至原歌词的显示界面三的示意图；\n[0035] 图15是根据本发明一个实施例的对文本进行自动注音处理的装置的结构示意图；\n以及\n[0036] 图16是根据本发明一个实施例的对注音文本进行显示的装置的结构示意图。\n具体实施方式\n[0037] 下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。\n[0038] 在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本发明的描述中，除非另有明确的规定和限定，术语“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。\n[0039] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。\n[0040] 下面参考附图描述本发明实施例的对文本进行自动注音处理的方法和装置以及对注音文本进行显示的方法和装置。\n[0041] 图1是根据本发明一个实施例的对文本进行自动注音处理的方法的流程图，该实施例从服务器侧进行描述。\n[0042] 如图1所示，对文本进行自动注音处理的方法包括以下步骤：\n[0043] S11，基于隐码模型将源语言的文本转换为目标语言的注音文本。\n[0044] 在本发明的实施例中，可以将源语言的文本自动注音为目标语言，其中，源语言可以为英文、日语等外文，目标语言可以为中文，文本可以为歌词。另外，在本发明的一个实施例中，可以在线下集中基于隐码模型将源语言的文本转换为目标语言的注音文本，从而可以避免多次重复转换，大大节约了计算成本和计算能力。\n[0045] 具体地，在本发明的一个实施例中，隐码模型可以为：\n[0046]\n[0047] 其中，为源语言序列，为目标语言序列，为源语言到源语言音素的概率，为源语言音素到目标语言音素的概率，为目标语言音素到目标语言序\n列的概率，为目标语言音素，为转移概率，π为统计语言模型\n得到的初始状态，为目标语言\n音素到目标语言的概率，为语言模型的概率。需要说明的是，该隐码模型的求解过程即是求的最大概率，而由于的最大概率与目标语言序列相关，基于隐码模型生成的注音文本为序列标注文本。进一步地，在本发明的一个实施例中，基于语言模型对源语言例如日语的文本进行转换获得的目标语言例如中文的注音文本和基于隐码模型对源语言例如日语的文本进行转换获得的目标语言例如中文的序列标注文本以及源语言文本如下：\n[0048] 源语言：アイしてる\n[0049] 语言模型：阿姨系带路\n[0050] 隐码模型：阿姨兮带路\n[0051] 比较上述在长短语级别上的源语言文本对应的语言模型的注音文本和隐码模型的序列标注文本，可以发现，虽然隐码模型的序列标注文本只是在语言模型的注音文本的基础上调整系为兮，但隐码模型的序列标注文本较语言模型的注音文本在语感上和语意上都更为通顺，从而更容易被用户所理解和记忆。另外，需要说明的是，隐码模型的序列标注文本还具有在短语级别和句子级别上，语感和语义也更为通顺的优点。\n[0052] S12，获得需求用户的标识信息。\n[0053] 具体地，在本发明的另一个实施例中，如图2所示，获得需求用户的标识信息即步骤S12可以采用以下两种方式实现：\n[0054] S121，接收所有用户通过客户端发送的文本需求信息，统计每个用户需求文本的语言类型包括源语言例如外文的文本需求信息的次数，将次数大于预定次数的用户确定为需求用户。\n[0055] 需要说明的是，在本发明的一个实施例中，文本需求信息中可以包含需求文本的语言类型和名称等。\n[0056] 具体地，用户可以通过客户端例如在线音乐服务客户端或在线视频服务客户端等来选择在线服务内容例如外文歌曲分类中的外文歌曲或外文视频分类中的外文视频等并发送请求，进而客户端根据用户的选择发送文本需求信息，且当用户发送的文本需求信息中的需求文本的语言类型包括源语言时，统计包括源语言的文本需求信息的次数，且当该次数大于预定次数例如5次时，确定该用户为经常选择源语言在线服务内容的用户，并标识该用户为注音文本需求用户。\n[0057] S122，根据预设条件确定需求用户。\n[0058] 需要说明的是，预设条件可以为通过客户端例如在线音乐服务客户端或在线视频服务客户端等首次选择在线服务内容例如外文歌曲分类中的外文歌曲或外文视频分类中的外文视频等的用户，以及已经确定母语为非源语言的用户等。\n[0059] 上述步骤S121和步骤S122为并列步骤。\n[0060] S13，接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。其中，如图3所示，在本发明的再一个实施例中，步骤S13可以包括以下子步骤：\n[0061] S131，接收当前用户通过客户端发送的当前文本需求信息。\n[0062] S132，确定接收到的当前文本需求信息中包含的需求文本的语言类型为源语言。\n[0063] 在步骤S131接收到当前用户通过客户端发送的当前文本需求信息之后，若步骤S132确定接收到的当前文本需求信息中包含的需求文本的语言类型为源语言，则进入步骤S133。\n[0064] S133，根据标识信息确定当前用户为需求用户。\n[0065] S134，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。\n[0066] 需要说明的是，在确定接收到的当前文本需求信息中包含的需求文本的语言类型为源语言，并根据标识信息确定当前用户为需求用户之后才向客户端发送当前文本需求信息对应的注音文本，可以极大的节约网络传输成本。另外，步骤S134根据当前文本需求信息主动向客户端发送对应的注音文本，可以便于主动寻找注音文本的需求用户和不主动寻找注音文本的需求用户例如已经形成特定习惯的用户，都可以轻松方便地获得注音文本，其中已经形成特定习惯的用户可以为通过学习源语言例如日语的发音来学习源语言的歌曲或视频等的用户。\n[0067] 进一步地，在本发明的一个实施例中，根据当前文本需求信息向客户端发送对应的注音文本的同时，还可以向客户端发送源语言文本，并且注音文本的数据格式和源语言文本的数据格式可以为Lrc格式或其它格式。\n[0068] 本发明实施例的对文本进行自动注音处理的方法在接收到当前用户通过客户端发送的当前文本需求信息之后，确定接收到的当前文本需求信息中的语言类型为源语言，并根据已经获得的需求用户的标识信息确定当前用户为需求用户，进而根据当前文本需求信息向客户端发送基于隐码模型对当前文本进行转换后的注音文本。该对文本进行自动注音处理的方法可以根据外文源语言文本自动生成易理解的或易发音的中文注音文本，并主动将中文注音文本提供给需求用户，便于需求用户轻松的学习外文源语言歌曲的发音，用户体验度高，并且成本低。\n[0069] 本发明第二方面实施例还提出一种对注音文本进行显示的方法，该方法从客户端侧进行描述，如图4所示，该方法包括以下步骤：\n[0070] S41，向服务器发送当前用户的当前文本需求信息。\n[0071] 需要说明的是，在本发明的一个实施例中，当前文本需求信息中包含的需求文本的语言类型为源语言例如日语等外文。\n[0072] S42，接收服务器发送的注音文本，以预定方式显示注音文本，以用于向当前用户进行展现。其中，注音文本为服务器根据当前文本需求信息基于隐码模型转换后得到的注音文本。具体地，对隐码模型的具体说明同步骤S11的对应说明，以下不再赘述。进一步地，在本发明的另一个实施例中，如图5所示，步骤S42可以分为以下三个子步骤：\n[0073] S421，接收服务器发送的注音文本。\n[0074] S422，以预定方式显示注音文本，以用于向当前用户进行展现。\n[0075] 另外，在本发明的一个实施例中，如图5所示，当注音文本为注音歌词时，以预定方式显示注音文本即步骤S422可以采用以下两种方式实现：\n[0076] S423，在原歌词下方显示注音文本。\n[0077] 具体地，在本发明的一个实施例中，在PC（Personal Computer，个人计算机）、手机和平板电脑等移动设备上，在原歌词下方显示注音文本的显示界面如图6所示。图6中，原歌词的语言为日文，注音文本的语言为中文，并且显示内容按注音文本的一行与对应的原歌词的一行交替顺序排列显示。另外，在本发明的一个实施例中，在卡啦OK模式下，在原歌词下方显示注音文本的显示界面如图7所示。图7中，原歌词的语言为日文，注音文本的语言为中文，并且显示内容为一行注音文本和一行对应的原歌词，原歌词在注音文本下方，后续的显示内容依次类推在界面上进行显示。需要说明的是，在卡啦OK模式下注音文本与原歌词无法同时滚动。需要进一步说明的是，在原歌词下方显示注音文本可以便于源语言和对应的注音文本同时展现，并且无需对播放软件进行任何调整即可实现，应用方便简单。\n[0078] S424，获得当前用户的切换请求，在显示原歌词的位置显示注音文本。\n[0079] 具体地，在本发明的一个实施例中，如图8和图9所示，用户可以在PC、手机和平板电脑等移动设备上和在卡啦OK模式下通过单击或双击鼠标或通过单击或双击触摸屏等动作来发出切换请求，进而根据切换请求在显示原歌词的位置显示注音文本。\n[0080] 需要说明的是，上述步骤S423和S424为两种并列的显示方式。\n[0081] 进一步地，在本发明的一个实施例中，用户可以在PC、手机和平板电脑等移动设备上通过在触摸屏上滑动手指或其它动作来发出切换请求，进而根据切换请求在显示原歌词的位置显示注音文本。具体地，如图10所示，用户可以通过在触摸屏上向左滑动手指来发出切换请求，进而根据切换请求在显示原歌词的位置显示注音文本。\n[0082] 进一步地，在本发明的再一个实施例中，如图11所示，在在显示原歌词的位置显示注音文本即在步骤S424之后，该方法还可以包括：\n[0083] S425，获得当前用户的切换请求，在显示注音文本的位置显示原歌词。\n[0084] 具体地，在本发明的另一个实施例中，如图12和图13所示，用户可以在PC、手机和平板电脑等移动设备上和在卡啦OK模式下通过单击或双击鼠标或通过单击或双击触摸屏等动作来发出切换请求，进而根据切换请求在显示注音文本的位置显示原歌词。\n[0085] 进一步地，在本发明的另一个实施例中，用户可以在PC、手机和平板电脑等移动设备上通过在触摸屏上滑动手指或其它动作来发出切换请求，进而根据切换请求在显示注音文本的位置显示原歌词。具体地，如图14所示，用户可以通过在触摸屏上向右滑动手指来发出切换请求，进而根据切换请求在显示原歌词的位置显示注音文本。上述以多种预定方式显示注音文本可以使得在发送注音文本后，需求用户可以根据个人需要和爱好来使用和显示注音文本，从而从心理上更容易接受和习惯这种主动提供注音文本的方式，并且多种显示方式也可以为用户带来更好的体验。\n[0086] 本发明实施例的对注音文本进行显示的方法，通过向服务器发送当前用户的当前文本需求信息来获得注音文本，进而以预定的方式显示该注音文本。该对注音文本进行显示的方法可以使得用户根据需求和习惯灵活的选择中文注音文本的显示方式，使用方便，可操作性好，并且用户体验度高。\n[0087] 本发明第三方面实施例还提出一种对文本进行自动注音处理的装置，如图15所示，该对文本进行自动注音处理的装置包括：注音模块10、获得模块20和收发模块30。其中，注音模块10用于基于隐码模型将源语言的文本转换为目标语言的注音文本。获得模块20用于获得需求用户的标识信息。收发模块30用于接收当前用户通过客户端发送的当前文本需求信息，根据标识信息确定当前用户为需求用户，根据当前文本需求信息向客户端发送对应的注音文本，以用于向当前用户进行展现。需要说明的是，在本发明的一个实施例中，文本需求信息中可以包含需求文本的语言类型和名称等。需要进一步说明的是，本发明实施例的对文本进行自动注音处理的装置可以将源语言的文本自动注音为目标语言，其中，源语言可以为英文、日语等外文，目标语言可以为中文，文本可以为歌词。另外，在本发明的一个实施例中，注音模块10可以在线下集中基于隐码模型将源语言的文本转换为目标语言的注音文本，从而可以避免多次重复转换，大大节约了注音模块10的计算成本和计算能力。\n[0088] 具体地，在本发明的一个实施例中，隐码模型可以为：\n[0089]\n[0090] 其中，为源语言序列，为目标语言序列，为源语言到源语言音素的概率，为源语言音素到目标语言音素的概率，为目标语言音素到目标语言\n序列的概率，为目标语言音素，为转移概率，π为统计语言模型\n得到的初始状态，为目标语言\n音素到目标语言的概率，为语言模型的概率。需要说明的是，该隐码模型的求解过程即是求的最大概率，而由于的最大概率与目标语言序列相关，基于隐码模型生成的注音文本为序列标注文本。进一步地，在本发明的一个实施例中，基于语言模型对源语言例如日语的文本进行转换获得的目标语言例如中文的注音文本和基于隐码模型对源语言例如日语的文本进行转换获得的目标语言例如中文的序列标注文本以及源语言文本如下：\n[0091] 源语言：アイしてる\n[0092] 语言模型：阿姨系带路\n[0093] 隐码模型：阿姨兮带路\n[0094] 比较上述在长短语级别上的源语言文本对应的语言模型的注音文本和隐码模型的序列标注文本，可以发现，虽然隐码模型的序列标注文本只是在语言模型的注音文本的基础上调整系为兮，但隐码模型的序列标注文本较语言模型的注音文本在语感上和语意上都更为通顺，从而更容易被用户所理解和记忆。另外，需要说明的是，隐码模型的序列标注文本还具有在短语级别和句子级别上，语感和语义也更为通顺的优点。\n[0095] 另外，在本发明的一个实施例中，获得模块20具体用于接收所有用户通过客户端发送的文本需求信息，统计每个用户需求文本的语言类型包括源语言的文本需求信息的次数，将次数大于预定次数的用户确定为需求用户，或者用于根据预设条件确定需求用户。具体地，用户可以通过客户端例如在线音乐服务客户端或在线视频服务客户端等来选择在线服务内容例如外文歌曲分类中的外文歌曲或外文视频分类中的外文视频等，进而客户端根据用户的选择发送文本需求信息，获得模块20在接收到文本需求信息后，对需求文本的语言类型包括源语言的文本需求信息的次数进行统计，且当该次数大于预定次数例如5次时，获得模块20确定该用户为经常选择源语言在线服务内容的用户，并标识该用户为注音文本需求用户。此外，需要说明的是，预设条件可以为通过客户端例如在线音乐服务客户端或在线视频服务客户端等首次选择在线服务内容例如外文歌曲分类中的外文歌曲或外文视频分类中的外文视频等的用户，以及获得模块20已经确定母语为非源语言的用户等。\n[0096] 进一步地，在本发明的一个实施例中，收发模块30还用于在根据标识信息确定当前用户为需求用户之前，确定接收到的当前文本需求信息中包含的需求文本的语言类型为源语言。\n[0097] 需要说明的是，在收发模块30确定接收到的当前文本需求信息中包含的需求文本的语言类型为源语言，并根据标识信息确定当前用户为需求用户之后才向客户端发送当前文本需求信息对应的注音文本，可以极大的节约网络传输成本。另外，收发模块30根据当前文本需求信息主动向客户端发送对应的注音文本，可以便于主动寻找注音文本的需求用户和不主动寻找注音文本的需求用户例如已经形成特定习惯的用户，都可以轻松方便地获得注音文本，其中已经形成特定习惯的用户可以为通过学习源语言例如日语的发音来学习源语言的歌曲或视频等的用户。进一步地，在本发明的一个实施例中，收发模块30根据当前文本需求信息向客户端发送对应的注音文本的同时，还可以向客户端发送源语言文本，并且注音文本的数据格式和源语言文本的数据格式可以为Lrc格式或其它格式。\n[0098] 本发明实施例的对文本进行自动注音处理的装置，在收发模块接收到当前用户通过客户端发送的当前文本需求信息之后，确定接收到的当前文本需求信息中的语言类型为源语言，进而根据获得模块已经获得的需求用户的标识信息确定当前用户为需求用户，并根据当前文本需求信息向客户端发送注音模块基于隐码模型对当前文本进行转换后的注音文本。该对文本进行自动注音处理的装置可以根据外文源语言文本自动生成易理解的或易发音的中文注音文本，并主动将中文注音文本提供给需求用户，便于需求用户轻松的学习外文源语言歌曲的发音，用户体验度高，并且成本低。\n[0099] 另外，本发明第四方面实施例还提出一种对注音文本进行显示的装置，如图16所示，该对注音文本进行显示的装置包括：发送模块101和显示模块102。其中，发送模块101用于向服务器103发送当前用户的当前文本需求信息。显示模块102用于接收服务器103发送的注音文本，以预定方式显示注音文本，以用于向当前用户进行展现。其中，注音文本为服务器103根据当前文本需求信息基于隐码模型转换后得到的注音文本。需要说明的是，在本发明的一个实施例中，当前文本需求信息中包含的需求文本的语言类型为源语言例如日语等外文。\n[0100] 进一步地，在本发明的一个实施例中，当注音文本为注音歌词时，显示模块102具体用于在原歌词下方显示注音文本，或者用于获得当前用户的切换请求，在显示原歌词的位置显示注音文本。需要说明的是，显示模块102在原歌词下方显示注音文本可以便于源语言和对应的注音文本同时展现，并且无需对播放软件进行任何调整即可实现，应用方便简单。具体地，在本发明的一个实施例中，用户可以在PC、手机和平板电脑等移动设备上和在卡啦OK模式下，通过单击或双击鼠标或通过单击或双击触摸屏或在触摸屏上滑动手指等动作来发出切换请求，进而显示模块102根据切换请求在显示原歌词的位置显示注音文本。\n[0101] 进一步地，在本发明的另一个实施例中，显示模块102还可以用于在显示原歌词的位置显示注音文本之后，获得当前用户的切换请求，在显示注音文本的位置显示原歌词。具体地，在本发明的另一个实施例中，用户可以在PC、手机和平板电脑等移动设备上和在卡啦OK模式下，通过单击或双击鼠标或通过单击或双击触摸屏或在触摸屏上滑动手指等动作来发出切换请求，进而显示模块102根据切换请求在显示注音文本的位置显示原歌词。\n[0102] 需要说明的是，上述显示模块102以多种预定方式显示注音文本可以使得发送模块101在发送注音文本后，需求用户可以根据个人需要和爱好来使用和显示注音文本，从而从心理上更容易接受和习惯这种主动提供注音文本的方式，并且显示模块102的多种显示方式也可以为用户带来更好的体验。\n[0103] 本发明实施例的对注音文本进行显示的装置，通过发送模块向服务器发送当前用户的当前文本需求信息，进而显示模块以预定的方式显示服务器发送的注音文本。该对注音文本进行显示的装置可以使得用户根据需求和习惯灵活的选择中文注音文本的显示方式，使用方便，可操作性好，并且用户体验度高。\n[0104] 应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。\n[0105] 在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。\n[0106] 尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN103309855A	2013-09-18	2013-06-18	汉语与外语自动实时语音翻译并标注字幕的音像录播设备无效专利	江苏华音信息科技有限公司
2	CN1945562A	2007-04-11	2005-10-09	训练音译模型、切分统计模型以及自动音译的方法和装置失效专利	株式会社东芝
3	CN102982025A	2013-03-20	2011-09-02	一种搜索需求识别方法及装置有效专利	北京百度网讯科技有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供