1.一种在具有触摸屏的电子智能设备中获取词条的方法,包括:
接收在具有文本信息的用户界面上进行的预定操作,所述预定操作为沿文字方向的滑动操作;
获取通过所述预定操作选中的文本信息;
对获取到的文本信息进行切词;
确定该切词结果中的新词和/或热词,以利用确定的新词/热词更新输入法字典,其中,获取通过所述预定操作选中的文本信息的步骤包括:
获取滑动操作的起点和终点;
将起点和终点之间的文本信息确定为选中的文本信息,
其中,将起点和终点之间的文本信息确定为选中的文本信息的步骤包括:
获取所述用户界面的显示字体的字高;
根据获取到的字高及起点和终点的纵坐标,确定滑动操作在所述用户界面中对应的行;
根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息,
其中,确定该切词结果中的热词的步骤包括:
根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;
将热度不小于预设热度阈值的词条确定为热词,
其中,利用如下公式来计算词条的热度:
词条的热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频),
其中,单个词条的得分=最近一天的词频/单个词条的总词频。
2.如权利要求1所述的方法,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
3.如权利要求2所述的方法,其特征在于,获取通过所述预定操作选中的文本信息的步骤包括:
将闭合形状包围的文本信息确定为选中的文本信息。
4.如权利要求1~3任一项所述的方法,其特征在于,确定该切词结果中的新词的步骤包括:
将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
5.一种在具有触摸屏的电子智能设备中获取词条的装置,包括:
接口单元,用于接收在具有文本信息的用户界面上进行的预定操作,所述预定操作为沿文字方向的滑动操作;
获取单元,用于获取通过所述预定操作选中的文本信息;
切词单元,用于对获取到的文本信息进行切词;
确定单元,用于确定该切词结果中的新词和/或热词,以利用确定的新词/热词更新输入法字典,
其中,所述获取单元获取滑动操作的起点和终点,将起点和终点之间的文本信息确定为选中的文本信息,
其中,所述获取单元获取所述用户界面的显示字体的字高,根据获取到的字高及起点和终点的纵坐标,确定滑动操作在所述用户界面中对应的行,根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息,其中,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词,其中,所述确定单元利用如下公式来计算词条的热度:
词条的热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频),
其中,单个词条的得分=最近一天的词频/单个词条的总词频。
6.如权利要求5所述的装置,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
7.如权利要求6所述的装置,其特征在于,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。
8.如权利要求5~7任一项所述的装置,其特征在于,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
在具有触摸屏的电子智能设备中获取词条的方法及装置\n技术领域\n[0001] 本发明涉及一种在具有触摸屏的电子智能设备中获取词条的方法及装置,尤其涉及一种在具有触摸屏的电子智能设备中根据用户在具有文本信息的用户界面上进行的预定操作获取新词、热词的技术。\n背景技术\n[0002] 目前,简、繁、日、韩等输入法系统基本上都是采用字典(即词库)以及字典中包含的词频信息向用户展现各类候选词的排序,因此输入法首选词准确率的高低直接决定了这类输入法输入的准确率的高低。现有技术为提高首选词的准确率,主要采用以下技术手段来实现,例如,在输入法中加载各类专业细胞字典,通过服务器更新输入法字典,进而扩充字典中的包含的各类词条,可以说,这些方法虽然可以在一定程度上提高输入法首选词的准确率,但是随着互联网日新月异的发展,对于一些在互联网中实时出现的新词、热词来说,这些方法对网络中出现的新词、热词的技术处理上显得相对滞后。\n[0003] 随着各种智能上网设备的飞速发展,通过微博、微信、博客等各种通信客户端工具进行网络交流成为人们日常生活中必不可少的通信交流手段,因此一些新词在互联网不断涌现,例如,赶脚、有木有、肿么了、给力等,而一些特定词条的热度会随着某个重大事件的突然出现而在某个时间段内不断出现,例如,台风海燕等,因此,这些新词和热词是随着时间的推移而实时变化的,但是,采用上述方法难以将这些新词、热词及时整理和扩充到字典中,从而难以进一步提高输入法首选的准确率,这影响了人们对信息输入的体验。\n发明内容\n[0004] 本发明的目的在于提供一种在具有触摸屏的电子智能设备中获取词条的方法及装置,不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率。\n[0005] 根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的方法,包括:接收在具有文本信息的用户界面上进行的预定操作;获取通过所述预定操作选中的文本信息;对获取到的文本信息进行切词;确定该切词结果中的新词和/或热词。\n[0006] 优选地,所述预定操作为沿文字方向的滑动操作。\n[0007] 优选地,获取通过所述预定操作选中的文本信息的步骤包括:获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。\n[0008] 优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。\n[0009] 优选地,获取通过所述预定操作选中的文本信息的步骤包括:将闭合形状包围的文本信息确定为选中的文本信息。\n[0010] 优选地,确定该切词结果中的新词的步骤包括:获取该切词结果中的任一词条;将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。\n[0011] 优选地,确定该切词结果中的热词的步骤包括:根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。\n[0012] 根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的装置,包括:接口单元,用于接收在具有文本信息的用户界面上进行的预定操作;获取单元,用于获取通过所述预定操作选中的文本信息;切词单元,用于对获取到的文本信息进行切词;\n确定单元,用于确定该切词结果中的新词和/或热词。\n[0013] 优选地,所述预定操作为沿文字方向的滑动操作。\n[0014] 优选地,所述获取单元获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。\n[0015] 优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。\n[0016] 优选地,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。\n[0017] 优选地,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。\n[0018] 优选地,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。\n[0019] 有益效果\n[0020] 与现有技术相比,本发明具有以下优点:本发明不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率,从而进一步增强了用户体验。\n附图说明\n[0021] 通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:\n[0022] 图1是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的方法的流程图;\n[0023] 图2是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的装置的结构框图;\n[0024] 图3是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图;\n[0025] 图4是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图;\n[0026] 图5是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过绘制的闭合曲线获取词条的屏幕截图。\n具体实施方式\n[0027] 以下,将参照附图来详细说明本发明的实施例。\n[0028] 图1示出了本发明一种在具有触摸屏的电子智能设备中获取词条的方法的优选实施例的流程图。图2示出的一种在具有触摸屏的电子智能设备中获取词条的装置可用于实现图1中所述的方法。\n[0029] 参照图1,在110中,所述装置接收在具有文本信息的用户界面上进行的预定操作。\n[0030] 在120中,所述装置获取通过所述预定操作选中的文本信息。\n[0031] 该用户界面可以是用户在智能设备中正在浏览的网页的界面,也可以是电子邮件或其他文本编辑应用(如:pdf、txt等),对此本发明不做限制,只要是能够向所述用户展示文本信息的用户界面即可。\n[0032] 根据本发明的一个示例性实施例,所述预定操作为沿文字方向的滑动操作。\n[0033] 该文字方向可以是横向,也可以是竖向,还可以是与水平方向呈预设角度的斜向,对此本发明不作限制,只要所述预定操作沿文字方向的滑动即可。需要说明的是,沿文字方向的滑动操作可以是用户在触摸屏上绘制的单划线,也可以是双划线,还可以是波浪线,对此本发明也不作限制,只要沿文字方向的滑动操作能够指示选中的文本信息即可。另外,还需要进一步说明的是,沿文字方向的滑动操作可以是在智能设备显示的任意一段文本信息的下方,也可以穿越智能设备显示的任意一段文本信息,对此本发明也不作限制。\n[0034] 图3示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图。图中所示的3A为所述装置在具有触摸屏的电子智能设备中绘制的单划线;图中所示的3B为所述装置在具有触摸屏的电子智能设备中绘制的双划线;图中所示的\n3C为所述装置在具有触摸屏的电子智能设备中绘制的波浪线。\n[0035] 具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。\n[0036] 更为具体地,所述装置将起点和终点之间的文本信息确定为选中的文本信息的具体步骤为:所述装置获取智能设备用户界面的显示字体的字高;根据获取到的字高及起点和终点的纵坐标,确定划动操作在智能设备用户界面中对应的行;根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信息。\n[0037] 以下结合具体实施例对上述实施过程进行详细说明,如果沿文字方向的滑动操作为单划线,则所述装置通过如下过程获取通过所述预定操作选中的文本信息:\n[0038] 1、所述装置可通过系统提供的操作API(Application Programming Interface,应用程序编程接口)获得下划线起点和终点的屏幕坐标:(X1,Y1)和(X2,Y2)。\n[0039] 2、所述装置可通过系统提供的API获得智能设备用户界面中各行字体的字高H,根据起点和终点的屏幕坐标确定下划线所在的行。\n[0040] 3、所述装置获取该行的文本数据流,通过对该行包含的文本信息(字或者符号)进行循环计算,计算下划线在起点和终点之间的文本信息。\n[0041] 需要说明的是,所述装置还可在上述实施方法进行适当变形,采用各种现有技术获得通过绘制下划线、双划线以及波浪线等各种沿文字方向滑动选中的文本信息。\n[0042] 图4示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图。图中所示的4A为所述装置在具有文本信息的用户界面上选中的部分文本信息。\n[0043] 具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置从所述设备的剪切板中获取用户在具有文本信息的用户界面上选中的文本信息;将所述获取到的文本信息确定为选中的文本信息。\n[0044] 此外,所述装置还可以采用各种现有技术将沿文字方向滑动选中的文本信息确定为选中的文本信息。\n[0045] 根据本发明的一个示例性实施例,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。\n[0046] 其中,所述闭合形状可以是完全闭合的曲线,也可以是半闭合的曲线,只要该闭合形状能够包围住智能设备在用户界面中显示的部分或全部文本信息即可。\n[0047] 图5示出了本发明在具有触摸屏的电子智能设备中通过绘制的闭合形状获取词条的屏幕截图。图中所示的5A为所述装置在具有触摸屏的电子智能设备中绘制的完全闭合曲线;图中所示的5B为所述装置在具有触摸屏的电子智能设备中绘制的半闭合曲线。\n[0048] 具体地,根据本发明所述预定操作为在具有文本信息的用户界面上绘制的闭合形状的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置将闭合形状包围的文本信息确定为选中的文本信息。\n[0049] 具体实施时,所述装置可以获取该闭合形状在具有文本信息的用户界面上包围的局部屏幕截图;对获取到的局部屏幕截图进行文本识别;将识别的文本信息确定为选中的文本信息。\n[0050] 此外,所述装置还可以采用各种现有技术获取该闭合形状选中的文本信息,例如,所述装置还可以根据该闭合形状的位置及大小确定该闭合形状选中的文本信息。\n[0051] 在120中,所述装置对获取到的文本信息进行切词。\n[0052] 具体实施时,所述装置可采用各种现有技术对获取到的文本信息进行切词,例如,基于字符串匹配的分词方法、基于理解的分词方法以及基于统计的分词方法,对此本发明不再赘述。\n[0053] 在130中,所述装置确定该切词结果中的新词/热词。\n[0054] 具体地,根据本发明的一个示例性实施例,所述装置确定切词的结果中的新词的具体步骤为:所述装置获取该切词结果中的任一词条;如果该词条没有出现在预置的输入法字典中,则将该词条确定为新词。\n[0055] 具体实施时,所述装置可将该词条与预置的输入法字典中的各个词条进行比对,以确定该词条是否为新词。\n[0056] 需要指出的是,预置的输入法字典可以在云端,也可以在本地设备中。\n[0057] 具体实施时,根据本发明预置的输入法字典在云端的示例性实施例,所述装置将\n120中的切词得到的多个词条上传到云端,通过云端将所述装置上传的词条与所述云端预置的输入法字典中的各个词条进行比较,如果上传的词条没有出现在云端的输入法字典中,则将上传的词条标记为新词,然后将所述新词反馈给所述装置对应的客户端,以便其更新该客户端所在设备中预置的输入法字典,也可以将该新词反馈给多个客户端,以便多个客户端所在设备中预置的输入法字典得到更新。\n[0058] 具体实施时,根据本发明预置的输入法字典在本地的示例性实施例,所述装置将\n120中的切词得到多个词条与本地设备预置的输入法字典中的词条进行比较,如果上传的词条没有出现在本地设备预置的输入法字典,则将上传的词条标记为新词,并添加至本地设备预置的输入法字典。\n[0059] 具体地,根据本发明的一个示例性实施例,所述装置确定切词结果中的热词的具体步骤为:所述装置获取该切词结果中的任一词条;根据从预置的输入法字典获取该词条在最近预设时间段内出现的词频信息,确定该词条的热度;将热度不小于预设热度阈值的词条确定为热词。\n[0060] 更为具体地,根据本发明的一个示例性实施例,所述装置可采用加权打分法确定该词条的热度。具体的计算公式如下:\n[0061] 词条热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/(所有词条的平均词频+单个词条的总词频)\n[0062] 其中,单个词条的得分=最近一天的词频/单个词条的总词频。\n[0063] 以下结合具体的实施例对上述实施过程进行详细说明,假设有四个词A、B、C、D在\n2013-11-10和2013-11-11这两天内出现的次数的如下如下表所示:\n[0064]\n词条 2013-11-10 2013-11-11 两天的和 2013-11-12\nA 35 100 135 0.74\nB 140 150 290 0.52\nC 1 4 5 0.8\nD 150 700 850 0.82\n平均值 320 0.72\n[0065] 从表格中显示的数据可以看出,所述装置根据2013-11-10和2013-11-11这两天的历史数据分别计算出这四个词在2013-11-12出现的概率分别为0.74、0.52、0.8、0.82,此时,可假设已经有320个人预先给每个词都打了0.72分,A词还有额外的135个人打分,每个人都给了0.74分,按照前面所述的计算公式,这四个词的最终得分(即热度)分别为:\n[0066] A:(0.72*320+0.74*135)/(320+135)=0.725\n[0067] B:(0.72*320+0.52*290)/(320+290)=0.625\n[0068] C:(0.72*320+0.8*5)/(320+5)=0.721\n[0069] D:(0.72*320+0.82*850)/(320+850)=0.793\n[0070] 按照热度大小排序如下:\n[0071] D>A>C>B\n[0072] 可以看出,词条D出现的频率最高,因此排名也最靠前,如果该词条的热度不小于预设热度阈值,所述装置可将其从云端下发给各个客户端的输入法字典进行使用。\n[0073] 具体实施时,根据本发明预置的字典在云端的示例性实施例,所述装置将120中的切词得到的多个词条上传到云端,通过云端计算上传词条的热度,并将热度值高的词条作为热词下发给所述装置所在的客户端的输入法字典,也可以下发给多个客户端的输入法字典,以共享该资源,本地设备上的输入法根据下发词条的热度,更新所述设备中预置的输入法字典,并在用户输入信息时,将热确定的热词作为首选推荐给用户,从而进一步提高了用户在信息输入时的准确率。\n[0074] 具体实施时,根据本发明预置的字典在本地的示例性实施例,所述装置直接计算切词结果中各词条的热度,并将不小于预设热度阈值的词条确定为热词。所述设备上的输入法根据计算的热度,更新所述设备中预置的字典,并在用户输入信息时,将确定的热词作为首选推荐给用户。\n[0075] 此外,所述装置也可以直接将切词结果中各词条的热度更新至输入法字典,输入法根据字典中各词条的热度对候选词进行排序,热度值高的词条将作为首选出现在输入法候选框中,从而进一步提高首选的准确率。\n[0076] 除了上述实施方法外,本发明还可以采用各种现有技术计算词条的热度,对此本发明不作限制,还可以再本发明实施例基础上进行适当的变形以实现本发明。\n[0077] 图2示出了本发明一种在具有触摸屏的电子智能设备中获取词条的装置的优选实施例结构框图。\n[0078] 参照图2,所述装置至少包括接口单元201、获取单元202、切词单元203以及确定单元204。\n[0079] 其中,接口单元201,用于接收在具有文本信息的用户界面上进行的预定操作。\n[0080] 获取单元202,用于获取通过所述预定操作选中的文本信息。\n[0081] 切词单元203,用于对获取到的文本信息进行切词。\n[0082] 确定单元204,用于确定该切词结果中的新词和/或热词。\n[0083] 根据本发明的一个示例性实施例,所述预定操作为沿文字方向的滑动操作。\n[0084] 该文字方向可以是横向,也可以是竖向,还可以是与水平方向呈预设角度的斜向,对此本发明不作限制,只要所述预定操作沿文字方向的滑动即可。需要说明的是,沿文字方向的滑动操作可以是用户在智能设备中绘制的单划线,也可以是双划线,还可以是波浪线,对此本发明也不作限制,只要沿文字方向的滑动操作能够指示选中的文本信息即可。另外,还需要进一步说明的是,沿文字方向的滑动操作可以是在智能设备显示的任意一段文本信息的下方,也可以穿越智能设备显示的任意一段文本信息,对此本发明也不作限制。\n[0085] 具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例,所述获取单元202获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。\n[0086] 根据本发明的一个示例性实施例,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。\n[0087] 其中,所述闭合形状可以是完全闭合的曲线,也可以是半闭合的曲线,只要该闭合形状能够包围住智能设备在用户界面中显示的部分或全部文本信息即可。\n[0088] 具体地,根据本发明所述预定操作为在具有文本信息的用户界面上绘制的闭合形状的示例性实施例,所述获取单元202将闭合形状包围的文本信息确定为选中的文本信息。\n[0089] 具体地,根据本发明的一个示例性实施例,所述确定单元204将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。\n[0090] 具体地,根据本发明的一个示例性实施例,所述确定单元204根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。\n[0091] 由此可见,与现有技术相比本发明不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法字典中,同时还进一步提高了输入法首选的准确率,从而进一步增强了用户体验。\n[0092] 需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或一组步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。\n[0093] 上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问并且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。\n[0094] 尽管已参照优选实施例表示和描述了本发明,但本领域技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行各种修改和变换。
法律信息
- 2017-05-31
- 2014-05-07
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310752329.9
申请日: 2013.12.31
- 2014-04-09
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2012-07-25
|
2012-02-13
| | |
2
| |
2010-12-22
|
2010-09-21
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |