著录项信息
专利名称 | 行为和情境数据分析的系统和方法 |
申请号 | CN200980160175.6 | 申请日期 | 2009-05-08 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-05-16 | 公开/公告号 | CN102460431A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 佐科姆有限公司 | 申请人地址 | 芬兰埃斯波
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 佐科姆有限公司 | 当前权利人 | 佐科姆有限公司 |
发明人 | 汉努·维尔卡萨洛 |
代理机构 | 北京康信知识产权代理有限责任公司 | 代理人 | 余刚;吴孟秋 |
摘要
本发明涉及一种管理无线设备例如智能电话的观察数据的服务器装置(112),包括数据输入逻辑,用于从数个无线设备(102,104,106)获得观察数据并从数个其它外部数据源获得可选补充数据,所获得的数据包括关于无线设备的行为原始数据、情境原始数据和可选技术原始数据;数据挖掘逻辑,用于基于对所获得的观察数据和可选补充数据的处理和分析建立数个诸如数据表或数据库的派生数据单元,所述处理和分析包括聚合和可选关联、聚类和/或因子分解过程,其中至少一个派生数据单元包括使用指标,该使用指标具有与一个或多个无线设备的及其用户的一个或多个应用或其它特征有关的情境维度和可选技术维度;数据存储,用于存储所获得的数据和数个派生信息单元,以及用于将派生数据提供给其它实体的数据分发逻辑。分发逻辑可以通过根据查询参数从一个或多个派生数据单元提供派生信息而服务于由外部实体构建的数据查询。给出了通过服务器装置执行的相应方法。
1.一种用于管理无线设备的观察数据的服务器装置,包括:
数据输入逻辑(300),用于从数个所述无线设备获得观察数据,所获得的数据包括关于所述无线设备的行为数据和情境数据;
数据挖掘逻辑(500),用于基于对所获得的观察数据的处理和分析建立数个派生数据单元,所述处理和分析包括基于所述观察数据进行聚类以及基于一个或多个模块度值进行的集群的数据聚合,其中至少一个派生数据单元包括使用指标,所述使用指标具有与一个或多个无线设备的及其用户的一个或多个应用有关的情境维度,
数据存储(400),用于存储所获得的数据(402)和所述数个派生数据单元,以及数据分发逻辑(600),用于将派生数据提供给一个或多个外部实体。
2.根据权利要求1所述的服务器装置,所述数据分发逻辑被配置成执行选自于由以下动作组成的组中的至少一个动作:通过根据查询参数提供一个或多个派生数据单元中的派生信息服务于由外部实体构建的数据查询,以及根据预定推送逻辑将来自一个或多个派生数据单元的派生信息推送至外部实体。
3.根据前述任一项权利要求所述的装置,被配置成根据基于派生数据单元确定的所述无线设备的用户的行为和/或情境特性,生成适应网络服务或无线设备的应用的派生数据。
4.根据权利要求1或2所述的装置,被配置成根据基于派生数据单元确定的用户的行为和/或情境特性生成派生数据,使得从无线设备的用户的立场进行个人化广告。
5.根据权利要求1或2所述的装置,被配置成将无线设备平台和/或所使用的应用的指示映射到所述平台和/或应用的另一更通用指示,以能够将与相似平台和/或应用关联的数据逻辑分组在一起,所述指示在所述获得的数据中接收。
6.根据权利要求1或2所述的装置,被配置成根据应用或包括多个应用的应用类别确定强度变量,所述强度变量是无线设备用户或多个用户在关于所选时间单位的时域中的活动指示符。
7.根据权利要求1或2所述的装置,被配置成确定应用的使用频率。
8.根据权利要求1或2所述的装置,其中,所述处理和分析包括选自于由以下组成的组中的至少一个过程:关联、聚类和因子分解。
9.根据权利要求8所述的装置,被配置成对获得的数据应用聚类算法用于将无线设备用户的行为分割,以形成行为一致的用户组;应用因子分解以归类应用和/或内容;或应用模式识别以获得实体、用户和/或应用之间的关系。
10.根据权利要求1或2所述的装置,其中,所述观察数据包括选自由以下元素组成的组中的至少一个元素:与通信动作有关的数据;应用使用数据;麦克风使用数据;扬声器/音频输出数据;照相机使用数据;用户输入数据;用户界面使用数据;日历条目相关数据;音频和/或视频录制;位置数据;时间数据;关闭设备的标识数据;设备状态数据;蜂窝塔信号强度数据;吞吐率数据;信噪比数据;关于互联网使用的数据和关于数据使用的数据。
11.根据权利要求1或2所述的装置,被配置成确定无线设备用户或用户组的描述性行为统计,包括通信动作的位置散布、关于通信动作发起者、应答者、近端和/或远程位置的位置散布。
12.根据权利要求1或2所述的装置,被配置成确定应用或应用类别的使用强度变量或使用频率变量,并被配置成在其上创建派生因子。
13.根据权利要求1或2所述的装置,被配置成基于可用应用使用信息,利用应用和/或活动执行开始和停止时间来计算数个第一类应用或活动的使用会话持续时间,其中通常以应用在后台运行的方式使用所述第一类应用或活动,并且用户界面层上的整体活动是低级的,以及被配置成从所述用户界面层信息确定第二类应用或活动的使用会话持续时间。
14.根据权利要求1或2所述的装置,被配置成确定用户行为的统计模型,以根据应用的位置和/或使用,估计用户或用户组在特定时刻的状态。
15.根据权利要求1或2所述的装置,被配置成以补充数据丰富所述观察数据。
16.一种用于培育由数个无线设备提供的观察数据的方法,包括:
-从数个无线设备获得并存储(816)观察数据,所获得的数据包括关于所述无线设备的行为数据和情境数据;
-基于对所获得的观察数据进行的处理和分析,建立并存储(818)数个派生数据单元,所述处理和分析包括基于所述观察数据进行聚类以及基于一个或多个模块度值进行的集群数据聚合,其中至少一个派生数据单元包括使用指标,所述使用指标具有与一个或多个无线设备及其用户的一个或多个应用有关的情境维度,以及
-将一个或多个派生数据单元中的派生数据提供给一个或多个外部实体(820)。
行为和情境数据分析的系统和方法\n技术领域\n[0001] 本发明总体上涉及无线设备和通信网络。具体地,本发明涉及对由无线设备进行的行为观察、情境观察以及可选技术观察进行集中处理和解释。\n背景技术\n[0002] 用于经TV和无线电终端分析人的行为和使用习惯的解决方案已经存在一段时间,而且更近一些,引入测量互联网中在线使用的各种解决方案。然而,许多人将越来越多的会面时间花费在其上的媒体实际上是无线设备,例如移动电话。较新的电话(所谓的智能电话)愈加能够执行除仅仅是通信功能之外的其它任务。例如,在不谈及各种可用的通信服务的情况下,能够用这些设备进行网上冲浪、享受多媒体内容(例如音乐)、玩游戏和访问地图。简而言之,在特别的情境和技术的环境中,在智能电话中发生许多不同种的使用,该智能电话的全球畅销度不断增加,并且作为媒体的重要性也相应地提高。\n[0003] 因此,可以看出,未来趋势相当明显,各种智能电话可能成为人们每天不得不随身携带的唯一数字设备。智能电话将用作通信设备、验证工具、表、数字钱包以及钥匙等。在该场景中,智能电话还可被开发为全天候的生活观察器(observers of life)。智能移动设备可能最适合成为通用数字(生活)观察器,能够追踪位置、温度、移动、通信活动、接近其他人、社交互动等。因为不同类型的观察器实体和传感器可以嵌入或连接至智能电话,因而对可能的观察没有严格限制。因此,在使用智能电话时,情景环境是特别强大的。例如,将来智能电话可以收集到包含每天全面的音频和视频记录的丰富的数据供应,因此使得用户能够生成他们日常生活的数字存储。甚至当前的智能电话应用可被配置成通过公共可用的应用程序接口追踪情境,例如位置和时间。可在智能电话中收集到的数据自然可在同一设备中本地使用。例如,获得的温度数据可显示在电话的屏幕上。然而,一些数据至少有时候值得发送给远程实体。\n[0004] 现有技术的众多装置明确地提出开发关于无线设备中数据使用的信息,以作为回报提供个人化服务。例如,公开US 2004181604披露了一种用于增强提供给通信设备的内容的关联性的方法,包括:经通知服务向通信设备推送与多个主题有关的内容通知;接收来自通信设备的内容使用信息;基于通信设备的内容使用信息修改为通信设备所确定的主题;\n以及经通知服务向通信设备推送与修改主题有关的内容通知。\n[0005] 尽管各种现有技术解决方案提及到从无线设备收集数据,但其并没有真正地提供用于进行数据分析、探测和开采的可行手段。例如,这些解决方案简单地披露了从无线设备收集一些预定的数据项,或用简单的统计工具对例如互联网的使用执行一般分析。此外,高度依赖于手动作业的当前技术或多或少以使用情况为中心,根据固定且基本无记忆的方案通常只能监控非常有限量的事件,并且在狭窄的分析范围内按照原样存储和分发所收集的数据。\n发明内容\n[0006] 本发明的目标是至少减少一些现有技术解决方案的缺陷,并提供用于监控和分析无线设备的使用和情境的智能、灵活、高效和自适应的集中替代物。该目标通过可实施为服务器装置(例如其中的软件架构)的本发明自动数据挖掘引擎和相关平台来实现。所创作的服务器装置可被配置成执行由多个无线设备提供的行为、情境以及优选还有技术观察的处理和解释、自动数据挖掘引擎的操作以及通过应用编程接口(API)向外部系统进行的派生信息的分发。服务器装置可应用于通常具有显著实际关联的现在和未来的各种分析和/或控制应用。\n[0007] 因此,在本发明的一方面中,用于管理诸如智能电话的无线设备的观察数据的服务器装置,包括:\n[0008] 数据输入逻辑,用于从数个无线设备获得观察数据,并从数个其它外部数据源获得可选补充数据,所获得的数据包括与无线设备有关的行为、情境和可选技术的原始数据,[0009] 数据挖掘逻辑,用于基于对获得的观察和可选补充数据进行的处理和分析建立数个派生数据单元(derived data element),例如数据表或数据库,所述处理和分析包括聚合以及可选关联、聚类(clustering)和/或因子分解过程,其中至少一个派生数据单元包括带有与一个或多个无线设备及其用户的一个或多个应用或其它特征有关的情境维度和可选技术维度的使用指标,\n[0010] 数据存储,用于存储所获得的数据和数个派生信息单元,以及\n[0011] 数据分发逻辑,用于向一个或多个其它实体提供派生数据。\n[0012] 在一个实施方式中,数据分发逻辑可例如分别根据推送逻辑设定或查询参数通过提供来自一个或多个派生数据单元的派生信息,向另一实体推送数据,或服务于由另一实体构建的数据查询。\n[0013] 情境维度可指的是情境元素,例如时间或位置,其中建立与情境元素有关的行为使用数据。相应地,技术维度可指的是技术数据。\n[0014] 因此,本发明的服务器装置的各种实施方式优选利用可从一个或多个无线设备基本连续输入至其的多维整体数据流。该数据流可包括行为数据项(例如,特定应用会话的启动时间戳,和/或经设备的用户界面的按键动作)、技术数据项(例如,语音呼叫期间数据会话的载体或信号强度、数据吞吐量、崩溃日志)和/或情境数据项(例如,时间数据、当前电池电量或当前位置,例如当前活跃的网络小区)。这些不同类型的数据项可包括在同一数据传输或多个数据传输中。因此,服务器装置优选被配置成处理进入的行为、情境和/或技术数据(例如,执行数据过滤或聚类)、使该数据丰富(例如,在应用名称和类别上添加元数据)、分析该数据(例如,执行行为和情境模式的识别)、创建集中动态智能(例如,在新的应用已被人们采用(换言之,发生显著偏离过去的行为)时接收自动管理警报)和/或优选通过应用编程接口(API)向外部系统提供派生信息,其中API可实现推送功能和/或以规则间隔进行查询或基于分离的触发动态查询。进一步地,服务器装置优选有利于使用(新)应用开采派生信息,例如行为和情境广告应用,并可易于与它们整合。除可编程智能之外,服务器装置可在理解可影响整个分析平台的输出的无线设备使用模式的改变、数据处理中的技术问题、丢失数据点等时包括机器学习和自适应性启发法。\n[0015] 因此,输入数据可首先由运行在无线设备中所应用的观察器逻辑的实例远程建立,为此目的,可应用一些商业可用解决方案来代替专用的解决方案。通常,观察层(源数据)上的一个数据实体(例如被输入的应用会话开始处的日志行)指的是一个或多个数据项的数据点(例如测量值),其中数据点可关联于例如一个动作或事件,而且其它配置也是可行的。例如,带有应用的时间戳和标识符(ID,例如名称和/或软件标识码)的设备应用的激活可表示为一个数据行(例如,行为信息),语音呼叫信噪比的触发测量可形成另一行(例如,技术信息),以及网络的活跃蜂窝塔(cell tower)中的改变可引起又一行(例如,情境信息)。在第一示例中,紧接着应用会话开始的日志行包含一个数据点(会话开始),其可由例如两个以上数据项(应用名称、其应用标识码、时间戳和/或日期戳)构成。\n[0016] 数据流或数据供应将通过服务器装置的输入接口输入到服务器装置。除输入数据之外,数据输入接口可优选智能培育(cultivate)数据、匹配和/或组合数据,从而将原始层级数据库的使用最优化。一个示例是前述的数据项丰富:例如,可向与所观察到的应用使用会话有关的项提供位置信息,例如当前蜂窝塔标识码(例如较早观察),该位置信息可稍后用于例如将使用统计与地理坐标匹配。所利用的逻辑可以是易懂可扩展的,于是数据输入接口中的数据处理是情境多于行为。换言之,在接收到数据后,数据输入模块根据预定标准(例如,动作的时间间隔)将例如互为顺向的数据输入日志行组合,和/或向该数据输入日志行添加状态信息(例如当前蜂窝塔指标(其存储在始终可用的状态变量中)),而不是立即执行高级分析或模式识别。例如,在前述第一示例中,如果在分离的会话之间仅有例如一秒的预定间隔(例如,最可能的是用户在先启用日历后刚刚关闭在用户界面中自动启动的锁键应用,并且例如该锁键应用会话在过滤进入的应用日志时被“去除”),那么数据处理逻辑能够将日历应用的两个顺向会话组合一起。\n[0017] 由于已存在于输入接口中的数据处理通常能够实时完成,而减少了进一步的微层级数据处理负荷(源自集中数据库),因此该数据处理是有益的。通过进行某些动作(如将顺向行组合一起(例如,如果它们表示同一会话)),可提高数据的可靠性和价值。进一步地,数据输入模块可从原始数据计算即时的动态统计。动态统计可提供有价值的多条信息用于管理,而完全不利用历史或时间序列数据(与之相比,在派生统计中,在进行任一特别处理时,几乎一切都可基于聚合、标准化和/或平均对许多日志行进行高效处理)。关于动态统计,例如,在从某用户接收到进入数据时,计数器可被更新,以指示在特定时段(例如一天)期间存在来自该特定用户的一些新数据,并且对于该用户可更新为接收到的最后数据的时间戳。\n通过这些动态统计,可更容易遵循系统通常怎样工作,以及数据收集的状态是什么。\n[0018] 考虑服务器装置中数据存储的不同实施方式,原始数据可存储在可构成更大数据存储的一部分的原始层级数据储存库中。该数据有利地存储在相关数据库中,并且原始数据被频繁地提供给数据挖掘引擎,以进行分析和高级处理。除存储原始数据之外,数据存储还存储最终的派生信息,即数据挖掘模块基于进行的分析所产生的数据。该派生信息优选为外部系统可直接使用的格式。例如,称为数据仓库的逻辑实体可用于存储直接可用的派生信息,该派生信息包括统计,如每个用户或数个用户的应用使用活动图,并且这样的信息可用于产生聚合图,例如计算移动互联网浏览器在市场中可用的不同设备平台上的畅销度。\n[0019] 由此,数据仓库有利地存储派生数据单元,并提供对数据仓库的访问,使得有利于并加速服务器装置的用户对各种数据查询的高效执行,进一步使得能够进行更复杂的查询和以推送模式向外部实体提供数据。外部实体可包括例如与本发明的服务器装置物理静止结合的外部逻辑实体,或还有物理分离的服务器实体。例如,可以基于识别当前在国外和/或在过去一年期间至少每周使用该设备的日历应用的这些无线设备用户,来执行查询和数据提供。事实上,整个数据存储的大多数数据表或其它数据实体是原始数据项之外的数据。\n实际上,期望产生数个派生数据库,并且数据挖掘引擎可连续和/或以离散的时段对原始数据进行处理,然后,数据挖掘引擎将最终的信息存储在仓库的派生表或其它数据单元中。因此,派生表可包括例如每个用户的应用使用的日常统计,而在原始数据储存库中所有信息可保留在会话层上,例如不聚合。基于接收到的查询,可选择、处理和/或结合派生数据以用于输出。\n[0020] 因此,数据挖掘引擎分立的或连续挖掘原始数据储存库,并从原始数据提取有用信息。进一步地,数据挖掘引擎可采集和/或聚合已派生的数据实体(例如派生数据表),或原始数据和已派生的数据实体的结合以获得另外的派生数据实体。数据挖掘引擎优选包括定制算法和过程,该定制算法和过程可在不工作时被有利地更新、最优化、(完全)自动化,和/或使能为能够基于从无线设备到达系统的数据生成统计、指示符、气压表、聚合图(例如总结动作)、平均(聚合的一种形式)和/或其它重要派生数据单元以及可选的其它元素。进一步地,数据挖掘引擎可对进入的数据进行因子和聚类分析、执行关联演算、识别模式、学习(即适应其行为),使数据丰富和/或以其它方式使通常较小意义的原始数据更智能,该原始数据由无线设备收集,包括行为、技术和/或情境数据。\n[0021] 数据分发API可逻辑创建在平台剩余部分的顶部上,以在提供数据时高效地方便平台的实际应用程序和平台的使用情况。使能API以服务于请求数据的外部客户端,即服务器装置的用户。该请求类型被标准化,通常包括无线设备/无线设备用户标识符、时段和/或所需统计的识别符。除信息递送的拉动模型(pull model)之外或代替该模型,根据需要,通过定义的触发条件,API可向一个或多个接口推送信息。例如,和基于位置的移动广告平台的交互可通过API由基于位置的触发逻辑实施。\n[0022] 关于本发明的各种实施方式的一般利用,其使得能够进行自动行为、技术和情境搜索,包括为各种不同目的进行的数据收集和分析,该各种不同目的从定向的行为移动广告或交通控制(基于例如情境,如无线设备用户的位置分析,例如位置追踪和/或预测)到监控工业和设备/应用(类型)使用趋势的更成本有效和可靠的方式。所构思的服务器装置优选被设计为经兼容的数据接口容易功能性可连接到诸如网络可操作的无线设备和其它实体的数据输入元件,其中兼容的数据接口使其在各种情形下特定可应用,其中基于通过无线设备提供的相应原始数据的行为、技术和/或情境信息可被利用。\n[0023] 服务器装置被使能为在理解数据的性质和典型流的同时,对从无线设备获得的原始数据进行自动处理和分析,并被最优化以对具有包括其情境性质的各种特定特性的这种交易数据进行处理,该数据初始是隐私的并是用户特定的,因此有利于以更高的准确度计算例如用户特定行为和/或情境向量。结果,服务器装置能够管理原始数据和利用的数据挖掘算法引起的累积智能;能够用作数据的交换所;了解数据的意义以及以最优和技术可扩展的方式存储和处理数据,从为所提出的相关问题提供完全不同于早先解决方案的途径。\n有利地,服务器装置产生各种派生信息,例如派生数据表和/或数据库,使得在接收到数据查询后,可通过同样提供这样的派生信息或通过使其首先迅速转为期望形式来简要提供相关回答。\n[0024] 第二,实施方式可被设计成能够对基本同时来自多个(例如,几十个、几百个、几千个甚至更多)无线设备的间歇和连续数据传输进行处理。更具体地,首先以原始层级格式处理数据,此后可将数据存储在例如临时组织的数据库中,包括例如聚合(如平均或产生不同频率或计数图)的数据挖掘处理被配置成基于该数据库计算各种派生数据表和/或概括统计,例如其通常比原始数据对该装置的用户更有用。所应用的数据分析技术相比于手动作业优选为自动,能够以连续方式(例如数据输入和预处理)和分立方式(更高级的分析)运行,最好补充支持到达装置中的数据的整个范围并保持统计更新。数据挖掘引擎和整体装置通过设计都是可扩展的,而不是仅由一个模块构成,可存在用于不同类型任务的特定模块。由于智能(数据输入、存储和挖掘)、模块化结构和内建数据分发API的若干层,因此整体装置相比现有技术解决方案更容易按比例放大。\n[0025] 本发明的实施方式建议使用专属于无线设备的行为指标,其还可包括技术数据和情境数据。行为指标传达信息而不仅仅是数据,因此向整个平台的应用提供更多的价值。特别地,行为指标可包括无线设备的应用和/或其它特征的使用强度、无线设备的应用和/或其它特征的使用频率、和/或用于无线设备的应用和/或特征的使用指标的轨迹(例如情境统计)、和/或无线设备的应用和/或特征的粘附性(stickiness)和采用率。还可在使所获得的信息储存库与实际应用(例如移动广告平台或诸如网络资源分配系统的网络管理平台)整合时最优化指标。根据无线设备中可利用的交易数据的性质可将丰富化、诸如平均聚合的处理剪裁,并且数据挖掘引擎有利地利用在可靠计算指标时所需要的数个附加单元,例如应用目录(数据库)和情境数据库。数据挖掘引擎优选基于行为启发法自学习。由于优选为连续学习/自适应和/或标准化数据输入而不是仅仅为一个更非常通用或特定情况的数据挖掘工具,因此该引擎还可跨接不同无线设备平台工作。\n[0026] 仍进一步地,所利用的数据库结构(即,数据存储)的不同实施方式可最好设计成能够在多个层上处理数据。例如,原始层级的数据可独立于更高层级平均和/或利用已算出的派生元素(例如行为指标)的其它聚合处理进行聚合。\n[0027] 然而,除其它可应用处理算法之外,数据挖掘引擎的各种实施方式可包括数个不同的统计算法,其用于例如识别模式和/或从数据提取其它潜在有意义的信息。这些分析算法可包括例如用于订户的行为分割的数个聚类算法、用于将应用和内容归类的因子分析法和/或用于将相关信息提供给模式识别引擎的关联分析处理。\n[0028] 最后,本发明的数据分发层的各种实施方式可提供用于使从无线设备提取的数据的使用模块化并使数据挖掘系统与不同实际应用结合的独特方式。所定义的API便于在装置内对数据进行独立的处理和分析,并最好以推送或拉动的模式将数据提供给外部系统和实体(其可仍与服务器物理整合)。这些外部系统和实体可以是例如移动广告平台或网络管理平台。\n[0029] 在另一方面中,一种用于培育由数个无线设备提供的观察数据的方法,包括:\n[0030] -从数个无线设备获得并存储观察数据,并从数个其它外部数据源获得并存储可选补充数据,所获得的数据包括与无线设备有关的行为、情境和可选技术的原始数据,[0031] -基于对所获得的观察和可选补充数据进行的处理和分析建立并存储数个派生数据单元,所述处理和分析包括聚合和可选关联、聚类和/或因子分解过程,其中至少一个派生数据单元包括使用指标,该使用指标具有与一个或多个无线设备及其用户的一个或多个应用或其它特征有关的情境维度和可选技术维度,以及\n[0032] -将来自一个或多个派生数据单元的派生数据提供给一个或多个其它实体,例如通过根据查询参数提供来自一个或多个派生数据单元的派生信息服务于由外部实体创建的数据查询。\n[0033] 对于本文中普遍使用的术语,“行为数据”涉及无线设备的终端用户的实际使用习惯和行为。行为数据可反映例如应用的使用、通信模式、内容消费和/或与设备用户界面的交互。在该特定情境中,由无线设备提供的行为数据同样对于具体平台是相当特有的(例如,可用的智能电话设备平台,例如Google Android、RIM Blackberry、Windows Mobile、Symbian S60、Apple iPhone),并且以该方式与从其它来源获得的行为数据不可比较。源自无线设备的技术数据可包括例如蜂窝塔信号强度的测量值、数据会话中的吞吐率以及语音呼叫信噪比。从无线设备获得的技术数据可自然补充或与重叠行为和/或情境数据。例如,所使用的无线设备平台在技术数据和情境数据下都是适合的。无线设备提供的情境数据可进一步包括例如位置、时间(即,时间情境)的标签、周围设备ID(例如,蓝牙和WiFi设备)和/或设备状态(例如,背光和电池状态)。\n[0034] 生活消息来源(life feed)可以指的是响应于监视人们日常生活而能够产生的任何信息,例如,包括关于位置、移动、活动和日历条目的数据。除了各种动作和事件,生活消息来源还可包括用户生成内容,诸如博客条目和照片。移动生活消息来源可以定义为能够从无线设备提供的数据中产生的生活消息来源。如此前所讨论,当前的无线设备或其未来形式可以被视为最好的全面生活观察器,并因此还可以被视为生活消息来源最好的自动生成器。本发明的服务器装置能够接收根据至少部分生活消息来源所形成的数据,并分析和/或处理该数据。例如,分析结果和/或处理数据可提供给第三方,例如移动广告商或网络管理实体,或提供回到无线设备或由无线设备用户确定的其它目的地(例如社交媒体服务)。\n[0035] API被定义为应用编程接口,例如,是一个软件模块提供给其它模块的接口,通常被构建用于分发数据。例如,API可以支持其它系统的查询并随后响应于该查询而根据该查询的细节提供数据。API还可用于定义单个系统的模块间的通信和互操作性。\n[0036] “(移动)代理”被定义为无线设备中的一组规则(例如,至少一个应用),优选地,能够在后台上无缝且自动(即,无干扰(无中断)其它应用)执行。代理被使能为执行操作,并与诸如互联网的外部实体或与其它应用通信。\n[0037] 在本文中,观察器被定义为能够基于(例如)查询和无线设备操作系统能力的使用生成数据项的处理。观察器功能上是传感器并且有时也可以物理上是传感器,其能自动感应(例如)蜂窝基站使用(例如,当设备从一个塔的覆盖跳至下一个的时候)时所识别的变化。观察器还可以指的是用户生成内容(例如,博客条目)的信道。\n[0038] 触发是指触发(引起)某动作的规则和处理。具体地,触发定义了如何在无线设备中更有效且自动地进行观察。触发能够基于时间间隔、情境变化和观察、外部请求或内部请求,例如,在一些其它数据点需要更多数据的情况下。\n[0039] 本文中所使用“智能(intelligence)”的概念指的是协调相关实体的整个处理或单独微处理(例如,触发逻辑)的一组规则、算法、数据库和/或处理。例如,智能使相关系统更灵巧地工作,以更优化的方式节省能量并提高准确性。智能能够基于固定的和/或自学、自适应算法,也能够基于外部输入。\n[0040] 本文中的“服务器”通常是指经由一个或多个诸如互联网的网络可接入的和存在于该一个或多个网络中的节点或至少是若干节点的逻辑聚合。服务器能服务于客户端,例如,无线设备中运行的移动代理以及诸如各种网络服务的其他实体。因此,客户端可以与一个或多个中央服务器通信。客户端-服务器架构是互联网中构建系统的常用拓扑。\n[0041] 用于本文中的“处理(processing)”的概念是指可对数据执行的各种动作。这些动作包括数据转换、转变、公式化、组合、混搭丰富、关联、聚类、因子分解、标准化和/或过滤以及其它。一些形式的处理在本发明各种实施方式中被主动使用,包括组合和混搭(例如,将数据点链接在一起并建立相关数据结构)、转换(例如,从诸如观察到的位置点的原始层级、未聚类数据项产生有意义的信息实体流)、丰富(例如,添加元数据并使数据比原始数据丰富)和/或过滤(例如,省去不相关或不再需要的数据)。\n[0042] 本文中将“智能电话”定义为能够运行和操作系统的无线设备,该系统便于附加应用的安装,并能够使分组数据连接到诸如互联网的目标网络。\n[0043] 本文中所使用的病毒式广告(viral advertising)或地缘社交推荐(geo-social recommendations)关于用户可发送至其他用户或由本发明的服务器装置(或通过用于从服务器装置获得数据的其他实体)直接发送给目标人群(的无线设备)的广告或其它相应信息,与特定情境、位置相关,和/或自动建议由用户发送给其它用户或以吸引人的方式捆绑至其它情境弹出。\n[0044] 本文中的“听众测量”和“行为搜索”用来描述为了理解具体平台(例如TV、无线电、互联网或无线设备平台)的使用模式,测量人的使用习惯和消费行为的途径。\n[0045] 本文中的表达“多个”(a plurality of)是指从二(2)开始的任意整数,例如,二、三或四。\n[0046] 本文中的表达“数个”(a number of)是指从一(1)开始的任意整数,例如,一、二或三。\n[0047] 表达“数据传输”可以指基于特定实体在有关数据传输动作分析下的角色(即,发送者的角色、接收者的角色或二者)来发送数据、接收数据或这两者。\n[0048] 在本发明的一个实施方式和实际使用情况中,服务器装置被配置成为网络和/或无线设备(本地)服务和/或为需要适应于用户行为和情境的应用提供有价值数据。例如,该装置可用于向用户的(本地)无线设备自动通知用户的特定行为分割,以使得该设备随后能够例如经设备的菜单中突出显示的有用应用提供个人化使用体验。例如,对于活跃多媒体用户,可在用户界面中自动建议或突出显示某些新多媒体特征。该装置可基于内部触发器(例如计时器和/或触发逻辑)和/或响应于查询,向外部实体提供适应性数据。\n[0049] 本发明的另一补充或可替换实施方式和实际使用情况涉及社交媒体或当今人们在其上花费许多时间的计算机网络中部署的其它服务。通过借助于本发明的服务器装置能够分析诸如当前位置的情境模式和/或诸如音乐享受活动的行为模式,服务的用户界面可被自动定制成反映用户可利用的这种信息,从而有利于进行大量的自动定制。\n[0050] 在本发明的进一步补充或可替换的实施方式和实际使用情况中,本服务器装置可用作用于向终端用户提供与其它人共享内容并交互的可能性的社交媒体服务中的外接式装置。行为统计(例如人每天行进的平均距离,或人在一般的一个月期间收听的(音乐)艺术家的数量)是该装置向无线设备的用户提供的有用的统计,以丰富和补充人在这些服务中共享的一般内容。\n[0051] 还是在本发明的进一步补充的或可替换的实施方式和实际使用情况中,移动广告是所选择的目标应用。优选地,广告是目标明确的、被及时、情境和/或行为地最优化为适合广告的特定接收方。通过本发明,移动广告可以以这样要求中的任一个的方式实施。另外,由于本发明的被集中化以及通过优选可扩展API支持数据提供的性质,所建议的装置与外部广告系统至少可功能性整合。\n[0052] 另外,本文中公开了在服务器装置中以自动化方式执行前述任务的方法的明确示例。\n附图说明\n[0053] 下面,将参照附图更详细地描述本发明,其中\n[0054] 图1从功能性角度示出了本发明的总体概念;\n[0055] 图2以更技术的方式示出了本发明的实施方式的不同特征;\n[0056] 图3是根据本发明的服务器装置的一个实施方式的组合框图和流程图;\n[0057] 图4是可应用于服务器装置中的数据输入接口的一个实施方式的组合框图和流程图;\n[0058] 图5是可应用于服务器装置中的数据输入接口的一个实施方式的组合框图和流程图;\n[0059] 图6是可应用于服务器装置中的数据存储的一个实施方式的组合框图和流程图;\n[0060] 图7是可应用于服务器装置中的数据分发API的一个实施方式的组合框图和流程图;\n[0061] 图8表示通过服务器装置执行的根据本发明的方法的流程图。\n具体实施方式\n[0062] 参考前述内容并具体参考图1,首先以概念的意义示出关于本发明的整体架构。所公开的系统分为两个部分,即:移动(代理)部,分别在用户102b、104b、106b的一个或多个无线设备102、104、106中执行;以及服务器装置部112,包括被功能上配置为建立本发明的服务器实体的一个或多个服务器设备。用户102b、104b、106b分别在不同环境和场景中生活并使用他们的(个人)无线设备102、104、106,其中无线设备可通过应用用于获取移动数据的公共可用或专用的解决方案监控该环境和场景。服务器装置112通常连接到通信网络110,经由可以是例如蜂窝或无线局域网的一个或多个接入网络108a、108b也可为无线设备102、\n104、106提供对通信网络110的接入。例如,诸如服务/服务器的外部实体114可经由网络110连接到服务器装置112,以从服务器装置112获得数据和/或向服务器装置112提供补充数据(提示箭头118),诸如天气、位置或其它情境信息。矩形116示出了服务器装置112提供给一个或多个外部实体114以在不同应用中使用的数据的示例。服务器装置112中的数据根据本文中所描述的原理从由无线设备102、104、106和可选的其它实体的移动代理提供的原始数据产生。原始数据可经过不同的处理,因子分解、聚合、聚类、丰富化、过滤等算法,结果获得派生数据。派生数据可表示与例如根据需要所选择的一个用户或一组用户有关的数字,其中例如该数字可包括相关动作或事件的强度频率或使用频率(如在116示出)。派生数据可以以数字/文本的方式(例如,经图表)以及或以曲线图的方式(例如经曲线图)可视化。\n[0063] 因此,本发明的不同实施方式部分通过无线设备102、104、106来实现,无线设备\n102、104、106优选通过软件和可选硬件(例如传感器)感测功能自动收集大量的行为、技术和/或情境数据(即,观察数据),并在最佳时刻进一步将所搜集到的数据的至少部分自动传输至一个或多个服务器112。移动代理软件可用于该目的。能够向服务器装置112提供数据的无线设备102、104、106(例如,智能电话或能够通信的PDA(个人数字助理))可特别地包括观察逻辑,用于进行与无线设备及其观察环境的变化(例如,某事件或动作的发生)有关的观察;以及数据处理逻辑,用于存储、可选预处理、分析和/或聚合所搜集的观察数据的观察数据点以经无线收发器向服务器112同步传输观察数据。观察逻辑可配置在每个无线设备\n102、104、106中,以智能触发和多数情况下被动的方式运行在后台,并且具有最小电池消耗和容积使用,但仍具有对关于与设备相关联的数据的相关数据点全面的数据获取能力。事件可包括例如基本上不是用户发起的事情(例如电池状态或(例如蜂窝塔或GPS所识别的)位置的变化),至少不是设备的用户直接发起的事情。动作可包括基本是用户发起的有目的性的活动和事情,例如使用网络浏览器、移动、阅读消息等。为了便利,一些事情也可认为符合上述事情种类中的两者。\n[0064] 尽管纯粹只是示例性的,但作为实际使用情况,一旦识别到活动的基站已经发生改变,就可以进行相关观察,使得带有像信号强度和定时超前的所需参数的基站细节将被扫描。因此,相关数据点可写入数据日志中。观察逻辑可以基于以下各项来收集数据点:通信动作(例如,发起呼叫,应答呼叫,发送诸如SMS(短消息服务)、MMS(多媒体消息服务)或电子邮件消息的消息、接收相应消息等)、传感器数据(例如,温度、加速度、位置(通过例如GPS(全球定位系统)/小区识别/三角测量获得的定向和/或定位)、光强度)、应用使用、麦克风使用、诸如音乐再现的扬声器/音频输出、照相机使用、任何用户输入或一般动作、日历条目(其添加/删除和/或实际完成/启动),并且原则上该观察可以从简单的温度类型日志变化到全天音频和视频记录,例如,在设备中自动观察(记录)的音频和视频记录。\n[0065] 优选地,无线设备被配置成在合适的时刻向服务器推送数据。例如,嵌入在设备中的相关智能(逻辑)可确定从设备向服务器传输经处理的数据的最佳时间。可以使用情景触发(例如,位置变化)、行为触发(例如,用户动作)、时间限制(例如,定期传输)、紧急情况传输(例如,在电话附近观察到火)、成本有效(数据的某个阈值收集到本地存储器后进行传输时,限制传输成本)以及电池优化(尽可能多地节省电池)来实现智能。优选地,智能逻辑能够从收集的数据、观察到的模式和/或来自诸如服务器的外部实体的输入中学习并且也能适应情景维度。\n[0066] 根据本发明的任一实施方式的无线设备包括至少一个无线通信收发器。收发器的非限制示例包括GSM(全球移动通信系统)收发器、GPRS(通用分组无线业务)收发器、EDGE(基于全球演进的增强型数据速率业务)收发器、UMTS(通用移动通信系统)收发器、WCDMA(宽带码分多址)收发器、PDC(个人数字蜂窝电话)收发器、PHS(个人手持电话系统)收发器以及WLAN(无线LAN,无线局域网)收发器。收发器(诸如以上列出的收发器)可以被配置为与预定通信网络(基础设施)合作。该网络还可以连接至其它网络并提供万能转换装置用于在两个端点之间建立电路交换和/或分组交换连接。此外/可替换地,该设备可以包括无线收发器,诸如用于点对点通信以及(例如)用于微微网/分散网的蓝牙适配器。另外,终端可以包括用于有线连接以及与外部实体有关的通信的接口,诸如USB(通用串行总线)接口或火线接口。\n[0067] 图2就某一可行实施方式示出了本发明的各个技术方面和相关无线设备。服务器装置112的数据源(例如,无线设备102、104、106)通常配备有能够处理指令和其它数据的一个或多个处理设备,例如一个或多个微处理器、微控制器、DSP(数字信号处理器)、可编程逻辑芯片等。因此,作为功能实体的处理实体220物理上可包括例如多个互相协作的处理器和/或连接到中央处理单元的数个子处理器。处理实体220被配置成执行存储在存储器222中的代码,代码可指代与用于向服务器装置112提供观察数据的移动代理软件架构206有关的指令和数据。软件206可利用专用或共用处理器来执行其任务。类似地,存储器实体222可在一个或多个物理存储器芯片或其它存储器元件间划分。存储器222可进一步指代并包括其它存储介质,例如优选的可移除存储卡、软盘、CD-ROM或诸如硬盘驱动器的固定存储介质。存储器222本质上可以是非易失性的,例如ROM(只读存储器)和/或易失性的,例如RAM(随机存取存储器)。\n[0068] 用户界面(UI)226可以包括显示器,和/或连接至外部显示器或数据投影仪的连接器,以及键盘/小键盘或被配置为向设备102、104、106的用户102b、104b、106b提供可行数据可视化的其它适用的控制输入装置(例如,触摸屏或声控输入,或单独的键/按钮/旋钮/开关)和设备控制装置。UI 226可以包括一个或多个用于声音输出的扬声器器和诸如D/A(数字-模拟)转换器的关联电路,以及用于声音输入的带有A/D转换器的麦克风。另外,设备\n102、104、106包括通信接口,例如无线电部224,其包括用于与其他设备和/或网络基础设施进行一般通信的无线收发器;以及可选的其它无线或有线数据连接装置(例如一个或多个无线电收发器或有线接口(例如,火线或USB(通用串行总线)),以与诸如终端设备、外围设备或网络基础设施的其它设备进行通信。技术人员应该清楚,设备102、104、106可以包括众多附加的功能和/或结构元件以提供有益通信、处理或其他特征,因此本发明不应理解为以任何方式限制附加元件的存在。\n[0069] 因此,服务器装置112可包括一个或多个计算机设备234,其包括通信接口254,例如诸如以太网适配器的LAN(局域网)适配器;用于处理数据的处理实体,例如至少一个处理器250;用于存储数据的存储器252;服务器端软件架构258和UI 256。服务器装置内部构件的不同实施方式将在下文中更详细地描述。\n[0070] 软件功能性206和/或258可实施为分别通过处理器220和250执行的一个或若干个互相通信的软件应用。因此,任一计算机软件(产品)可设置在诸如存储卡、存储棒、光盘(例如CD-ROM或DVD)或一些其它存储载体的载体介质上。实施应用所需要的指令可以为可执行的或以其它压缩格式存储在载体介质中,使得软件可以经由载体介质传送到目标设备并安装在其中,例如,安装在该目标设备的硬盘中,或例如直到执行时才通过向目标设备的存储器222、252加载相关指令来在目标设备中直接从载体介质中执行。可替换地,软件206、258可以通过无线收发器或通过有线通信连接隔空传输到目标设备。\n[0071] 图3示出了根据本发明的服务器装置的一个实施方式的组合框图和流程图。如在上文中所说明的,移动代理可观察每个无线设备中的事件、动作和/或性质,并可选地对所观察的数据执行预处理,并一般地管理与数据处理和至由一个或多个至少功能连接的服务器设备操作的服务器装置的数据传输有关的基于无线设备的智能。在服务器端,数据输入接口300负责接收并优选预处理通过无线设备收集的行为、情境和/或技术数据,并负责通过向数据存储模块400提供数据而将数据存储在在一个或多个原始层级数据库中。数据输入接口300还可从数据挖掘引擎500接收和/或更新关于例如怎样处理数据的指令,这由引擎500和数据输入接口300之间的箭头示出。数据存储模块400可处理原始数据和派生数据,即,其优选存储通过数据输入接口300处理的所有原始数据,并另外进一步管理通过数据挖掘引擎500处理和分析的数据,即派生数据。数据存储模块400保持所谓的数据仓库,其可基本上存储包括稍后将通过数据提供和分发API 600提供给外部实体的派生数据的相关信息。数据存储模块400还包括其它需要的数据表,例如用于应用的映射表、国家代码(MCC)和可动态更新的操作代码(MNC)。例如,数据挖掘引擎500可处理由数据存储模块400提供的原始数据,并在每个分析循环之后将处理数据和分析结果(即,派生数据)提供回到存储模块\n400。\n[0072] 在图4中,示出了数据输入接口(模块)300的一个实施方式的组合框图和流程图。\n分析器301从外部系统(通常从安装在无线设备中的移动代理)或经诸如数据服务器的中间或其它系统接收诸如数据日志的数据,并优选读取不同种类的数据日志格式(例如,数据中的一些可通过XML规范定义),同时可选地在需要时进行解压缩和/或译码数据。有利地,分析器301可通过监控例如数据值(例如其遵循预定范围)进一步检测和省去(即,滤出)破坏的数据。数据输入接口300由保存关于数据输入接口300操作所遵循的规则和处理的知识的智能引擎305(即相关逻辑)进行指导。智能引擎305可被数据挖掘引擎控制,如下文中说明的和通过箭头“规则”示出的。分析器301可为每组进入数据分配唯一的用户标识码(即进入数据的基本标识符)。由于在涉及特定用户的数据点时仅需要使用这样的用户标识码,因此这有利于稍后在系统中进行更高效的数据处理。预处理组件302可优选以连续方式对分析器301提供给其的数据执行操作。预处理可包括例如丰富(例如,向进入数据点添加蜂窝塔指标)和/或数据点的排序(如果尚未按年代顺序接收数据)。动态统计模块303可基本在数据到达后从原始数据流派生和/或更新简单易懂的统计,从而更新例如存储在系统中的每个用户的状态(例如,在接收到数据点时对于各用户更新这样的数据是最当前的),由此保持对例如在过去(例如12小时)多少人接收到一些数据进行追踪。动态统计通常可以是用于管理目的的简单计数器,并且不需要高级聚合和统计计算(与之相比,派生数据点可利用历史数据和聚合过程)。动态统计还可用作某些活动的触发(如通过数据分发模块输出的自动化数据)。原始数据输出模块304可对原始数据到接下来将回顾的数据存储模块的数据储存库的通信进行处理。\n[0073] 在图5中,示出了数据存储模块400的一个实施方式的组合框图和流程图。动态统计实体401的输入端接收数据输入接口300发送的简要更新,例如用于向系统提供数据的各个用户(或设备)的状态。这些数据点实际上可在至少逻辑上保持更高层级数据而非原始数据的数据仓库实体403中立即更新。尽管优选通过数据输入接口300对不同的数据流进行(预)处理,但是不同的数据流被接收于原始数据储存库402中。原始数据储存库402优选地存储所有原始数据和通过使用例如通过用户标识码算得的掩蔽标识码来高效地存储指标数据,因此能够在存储大量隐私数据时使用物理上分离的数据库。\n[0074] 通过使用掩蔽法和利用最优数据库架构,如果收集到隐私数据(例如电子邮件地址和名称),那么可将隐私数据和搜索数据(行为、技术、情境数据)分离。在分析中可仅需要搜索数据。也可为数据挖掘引擎的需要和备份的目的调整标引(indexing)、缓冲、复制和/或其它数据库配置。数据库设计便于在使用数据时有效地最优使用存储器容量和最优化潜伏期以及其它重要因素。在请求并接收回处理数据(即派生数据)和数据仓库403中的存储的分析结果后,原始数据被提供给数据挖掘引擎。因此,数据仓库403可保持培育的信息,即,已被处理成可在实际应用中立即利用的形式,或进一步用诸如聚类、或统计处理(例如平均或其它类型的聚合)的期望算法进行更快处理的形式的数据。存储在数据仓库403中的数据可可选地通过可被配置成考虑数据输出动作的超高速缓存、缓冲和/或可扩展性的分离模块(数据输出端404)提供给数据分发和提供模块。在许多情况下,数据仓库403物理上可以以跨接若干服务器设备的方式分发。\n[0075] 在图6中,示出了数据挖掘引擎500的一个实施方式的组合框图和流程图。原始数据可首先存储在原始数据模块501中,例如仅用于临时存储来自数据仓库的数据的一组数据库中,以进行分析。因此,模块501用作最优加载数据到数据处理功能的缓冲器。数据处理模块502执行从无线设备平台获得的行为、情境和/或技术数据所需的许多特定处理和分析。例如,应用会话日志的处理可以是一个相当具体的处理,并在许多情况下数据处理模块\n502考虑进行复杂处理。数据处理模块502可以执行与例如数据的时间定向(例如应用于年代顺序的数据集上的特定处理规则)有关的相关处理,或尚未对数据进行的一些所需的预处理活动的其他复制或调整。与之相比,数据分析模块503可执行非微层级处理的操作,例如平均、其它聚合、关联、聚类、因子分析等。数据挖掘智能引擎(逻辑块)504可指导数据处理和数据分析,并另外地还指导数据输入接口。由于智能引擎优选为中央定位,所以容易更新,使得变化可在分析过程中被基本立即采用。例如,处理数据通过处理后数据模块506传输回到数据存储,并进一步传输到其数据仓库。数据挖掘过程可为例如昨天接收到的所有数据运行,但如果在其开始时在参数中指出更大片数据,那么该数据挖掘过程也可为更大片数据运行(例如处理原始数据存储中的所有原始数据)。数据挖掘过程可被自动地唤回(revoke)以例如每晚处理和分析过去三天的数据,从而自动地保持分析数据的更新。\n[0076] 在图7中,给出了数据提供和分发API 600的一个实施方式的组合框图和流程图。\n数据分发控制603可保持模块的配置(意指例如关于怎样传输和提供数据的规则)以及可选的例如隐私设定,可选地包括关于与各个外部系统有关的数据处理的许可。触发器602可被配置成指导数据查询模块601。触发逻辑遵循例如控制模块603所分配的逻辑,于是数据查询的触发主动产生(数据从数据库主动地轮询),或通过重定向和协调外部请求产生。数据查询模块601管理与将数据导向数据提供模块604的数据储存库的接口,数据提供模块604保持经由他们的数据接口向外部实体(例如移动广告平台)提供数据时所需要的各种接口。\n[0077] 接下来,将说明对存储在一个或多个原始层级数据库中的原始层级数据进行的可应用处理的一些实施方式。数据输入接口有利地被配置成平稳和高效地运作,例如由于数据输入处理和相关缓冲的分布式独立结构,使得能够从若干无线设备以标准化格式(如XML(可扩展标记语言)格式)基本同时地输入数据。例如,数据输入接口可逐个读取所接收到的无线设备数据日志行。为了支持整体装置的可扩展性和/或互操作性,数据输入接口可被配置成例如正好在分析器中识别熟悉的应用名称和应用标识号。分析器可负责对从外部系统输入的数据进行实时处理、理解输入数据的形式、结构和/或内容。如果应用是已知的(所识别和分类的名称和应用ID号),那么重命名(应用命名的一致化)和/或归类可在任何数据存储在数据库中之前已经在分析器中执行。有效地,在该示例中,应用可通过名称和/或通过不同的应用标识码标识。分离的应用映射文件可存在于服务器存储器中,并且其可与进入数据和现存标识符(名称和应用ID)匹配,以执行处理(重命名)和添加元数据(应用类别)。\n服务器上的映射文件优选可自动(与外部系统接口)或手动地动态更新。\n[0078] 分析器(和/或预处理块)还可在读取数据(例如用户位置)时,将情境信息保持在缓冲器中,并且向观察附加情境元数据,因此,该观察准备就绪而能够例如将先前开始的应用的名称映射到数据,从而识别例如应用的执行(开始)时间之间的差(例如,其可用于计算应用会话的持续时间)。可基本同时有利地分析其存储器中的若干数据点(例如数据行)的分析器还能够识别复制数据或错误数据供应项(其可通过监控若干随后行来识别)。可进一步实时执行情境丰富。可进一步使分析器负责在将数据存储到原始数据储存库时优选完成数据的原始层级过滤和处理。这些活动可包括例如某些类型数据点的去除。处理的规则可存储在数据输入接口的智能引擎中,并优选地动态变化。\n[0079] 公开了本发明的数据挖掘活动的一些可行的实施方式。具体地,说明了如何处理应用会话日志以使数据更可靠和有意义。应用会话日志是行为源数据的相当重要部分。一个挑战是存在多种可用的数据点。数据收集系统(例如无线设备中的数据收集系统)可记录应用处理的开始和停止,以及在用户界面上分离地进行应用激活和最小化。另外,所有不同无线设备平台都可使相同或相似应用具有唯一名称和应用标识码。另外,应用的命名还取决于例如设备的语言。通过以应用日志为例,本发明的数据处理引擎能够基于例如指纹(感测进入数据以及例如相关IP分组报头信息),识别用于提供数据的特定无线设备平台(例如Windows Mobile、Symbian S60或Apple iPhone),以从原始数据创建有意义数据项(例如利用应用开始和停止项来创建包括开始时间和持续时间的新应用会话项),并将具有由平台(甚至在后台分析中)以集中方式处理的相干的、通用的标识码的所有应用事件映射。如果观察到新的、仍未识别的应用名称,那么可(例如通过电子邮件)向开发者发起分离的请求,以将这些应用映射到现有数据库。应用处理中的其它选择用于在分析器中执行这些活动中的全部或一些。在数据挖掘引擎的数据处理模块中(不在接收数据时)执行处理的优点在于,例如如果映射表中的信息改变,或如果更复杂的过程(例如使已经算出的行为指标与交易数据结合,以执行标准化)需要完成,那么数据处理引擎甚至可用来运行已存储数据的补丁,并向该过程花费更多的时间。通过定义,分析器可仅在接收数据时工作,并且不被启动来处理已存在于数据库中的数据。因为分析器实施的实时要求,所以分析器的实施比数据处理引擎的实施更简单。\n[0080] 数据处理引擎可被配置成比较例如应用的执行开始时间,和/或计算应用的运行时间。对于一些应用(如音乐播放器),处理开始时间和停止时间可用于计算会话的持续时间,这是因为音乐播放器通常处于后台,而没有任何单独的用户界面层级活动。对于大多数其它应用,例如日历和文档查看应用,应用的性质规定自然是根据用户界面层级活动日志来测量持续时间。\n[0081] 数据挖掘引擎和尤其例如其数据处理引擎可例如将屏保、锁键和菜单处理排除在数据集之外,并然后创建更精确的会话层级变量,例如应用的会面时间或可靠运行时间,而不使系统处理和其它干扰数据点偏离结果。在实践中,系统在某些过程中利用有助于简化和过滤例如应用或互联网使用(URL)日志的黑名单。数据处理引擎还能够监控例如随后的SMS或其它消息,以将接收到的与发出的SMS或其它消息具有特别关系的消息分组为相同关系,因此识别聊天定向的会话和/或回复消息。另外,例如SMS或其它消息的打开、阅读和/或删除时间可通过启发方法映射到接收消息的时间,以方便进行多种持续时间定向的统计。\n然而,例如在某时段期间接收多个电子邮件或其它消息可映射到发送消息应用的特定会话,由此使应用会话层级发送消息和微层级发送消息两者的比较成为可能。\n[0082] 第三,将关于分立的聚合过程对分析过程的一些示例进行详细说明。具体地,说明仅通过诸如由本文中所描述的处理提供的平均、统计的聚合可派生出什么类型的领悟(insight)。数据聚合的一个主要焦点在于计算强度变量,例如通过相应的使用时间(例如每选择时间单位(例如小时、周、月等)的使用分钟)测出的活动测量值、每时间单位的会话数和/或每时间单位的事件或动作数。通过强大的聚合过程可为每个用户、多个用户、每个应用(例如日历应用)、每个应用类别(例如电子邮件应用)和/或设备特征(例如USB连接)类别跨情境计算这些变量。为了有利于可扩展性,数据分析过程的递归处理可首先计算各个动作层级上的强度变量,其可用作更高层级平均的源数据。强度变量可存储在数据仓库中,例如描述用户标识号、日期、时间和/或动作/事件的细节(例如应用名称(如日历或语音呼叫)、其标识号、类别信息(如应用分类组),以及会话层级详情(如会话持续时间或文本消息长度))的一个数据行。这些更微层级派生数据实体可被频繁处理(例如每晚)和/或根据需要被处理。利用可基于参数(例如,需要的数据点类型、用户标识信息和日期范围)规则地或通过分离的触发逻辑而运行的可扩展聚合引擎,现有数据可被处理并被转换为新数据实体(例如表格,例如每天为每个用户呈现日历应用活动数的表格)。通过更进一步聚合数据,例如该数据表可被处理为识别在某时刻(例如在特定日期)使用日历的不同用户的数量,或可替换地,可在研究下的时段内计算对于每个用户日历应用开始的算术平均数。因为微层级数据处在尽管精确但调和的形式,所以多种聚合(例如平均)方法可用于可扩展方式,以派生使用行为和情境模式的有意义统计。可从原始数据派生的使用强度图除外的一些实际行为应用层级各个统计包括例如应用的使用频率(例如在平均月期间,应用在多少不同天数使用)和应用的重要性(例如,用户花费在设备的特定的总时间中,多长时间用于例如对平均的特别应用)。\n[0083] 第四,提供关于所使用的数据库的可能结构的一些实际解释,以解释其中如何支持可扩展性。以原始层级格式存储在数据库中的数据优选但并不是必须的为Unicode格式,并且在存储数据时最好利用各种关系。例如,处理无线设备应用信息的典型方式是为原始层级数据存储中所包含的每个应用处理执行开始数据行附加唯一的应用标识号。可建立分离数据库以存储与应用标识码相关的元数据,包括例如名称、应用类型和应用类别信息。另一示例来自情境信息的存储。例如,对于每个日期和小时以及对于每个用户,可计算变量以识别所在的国家,以及可能的一些元数据例如该国家是否为用户的祖国。通过进行原始层级数据点与该分离的情境数据表简单的匹配,可将情境信息附加到原始层级数据点。这样的派生数据表可用于例如对于不同情境(例如家庭和漫游情境)分离地聚合跨应用类别的总应用会面时间。在数据库架构中,原始层级会话和活动日志,以及最重要映像文件优选保持与派生数据表分离或至少是可分离的。派生数据(表)可利用包括诸如平均功能的聚合从原始层级数据(表)算出。例如,在使用移动应用的情境下,派生数据表可包括含有关于每个用户每个日期与设备的平均日常总会面时间(例如,以分钟给出)的数据表,或传达在诸如日历的每周期间每个用户使用的不同应用的平均数的数据表。\n[0084] 诸如数据表的派生数据实体通常基于原始数据算出,以可将就近的数据在许多场合下添加为随附较早数据(并添加到较早数据的“末端”)的意义来说是动态的,尽管有时较早数据可至少被部分替代,例如在例如表中不需要时间维度的情况下。在传送外部系统所需要的有意义信息(如,行为统计)和实际应用的意义上,派生数据表包含有价值的更高层级信息代替仅仅是原始数据。另外,派生数据实体(例如,数据表)及其一些内容可以以优选的(例如标准化)格式输出到可视化引擎,以便于信息的可视化和显现。派生数据表呈现行为关键性能指标(KPI),例如每时间单位花费在特定应用的平均时间(例如,每周的使用分钟),或平均粘附性(例如试用用户主动连续使用应用的相对比例)或普及率(例如对应用感兴趣的人群中实际使用该应用的人群的比例)。\n[0085] 下面,给出了用于用户和内容的因子分解和聚类的示例性实施方针。行为、技术和/或情境数据的因子分解意指降低数据的不必要准确度,同时还跨维度识别模式。例如,可对于每个用户计算各种描述性行为统计,包括例如用户每天或在一些其它时段期间为音乐应用平均花费的分钟数或其它时间单位,或所有出境语音呼叫的比例。通过使用跨某特定数量的描述性统计的因子分析法,可找出与原始变量相关的更高层级因子,同时创建对变量之间相互联系和关联性的更高级理解。实际应用用于分析应用类别(例如语音、即时的消息发送、电子邮件消息发送、音乐、视频、地图、图像、办公等)的使用频率变量,并在其上创建因子,例如以从音乐、图像和/或视频应用使用变量完全自动地派生通用多媒体使用指标。除应用之外,基于派生数据表给出的因子分析可应用于例如不同的通信装置、消费者内容的类型(音乐),或例如在互联网中浏览的网站的类型。\n[0086] 例如,从分割的角度来看,可将多个用户聚类而形成行为相干组。行为分割是动态的而不是静态分割模式(例如,基于人口统计学或态度(用户的意图和满足)因子的静态分割模式),并且从包括例如移动广告的许多目标应用的角度来是潜在更有意义的途径。行为(例如多媒体、数据和/或通信服务使用)分割还可与情境统计(例如在周末发生的移动的量)结合。在聚类的初始阶段,图示的节点可表示例如用户,并且节点之间的权重可以是皮尔逊相关系数(或等效物),并且基于例如由所使用的平台提供的行为指标(例如每周的应用使用时间:每周的浏览器、语音、消息发送和地图应用使用分钟)算得。在这里的示例中,用于描述节点之间的边缘的原始数据可以是多维的,即可计算节点之间的多个权重。\n[0087] 在自动聚类方面,描述用于分析由平台产生的图示的基于模块度方法的实施方式。模块度可定义为如下。用eij表示图示中连接从社区i到社区j顶点的边的分数的一半,前提是i≠j。选取一半分数而不是全部分数是因为标准要求eij+eji等于总分数。另外用eii表示社区i内部边缘的分数。\n[0088] 使用该表示法,总和为\n[0089]\n[0090] 等于落入所有边缘的社团内的边缘分数,而\n[0091]\n[0092] 则为从组i中顶点发出的边缘端的分数。现在,如果所有边缘都随机连接,那么在社区i里其分数为ai2。这使得将模块度Q定义为\n[0093]\n[0094] 如果边缘是随机的,那么模块度等于零,而值Q>0表示聚类的结构。通常,约Q>\n0.3或0.4的值可被认为是显著聚类的迹象。\n[0095] 使模块度最优化所使用的方法如下工作。首先,让每个顶点形成其自身的社区。考虑将两个社区聚合为一个的全部可能,并在这些联结之后计算模块度。选择具有最高模块度的社区并且使这些社区聚合一起。为新的一组社区迭代地重复该过程,直到不再有一对两个集群联合起来可以增加模块度。然后,在这点上的社区是按照算法将原始图示划分为多个社区的最优划分。\n[0096] 用dij表示测量组j中节点i的测量值。通过用测量组平均值除以该值\n[0097]\n[0098] 其中Np是节点数量,定标测量值βij可定义为\n[0099]\n[0100] 形成向量\n[0101]\n[0102] 描述单独节点k的模式。在此处,Na是测量组的数量。使用这些矢量,可能按照下文说明来定义用于节点k和l的相似系数。\n[0103] 使用这些相似系数,可以用带有(例如)通过使用皮尔逊相关系数确定的权重wij的节点k和l之间的边缘创建完全连接的加权图。该算法考虑了边缘的权重。这只简单地将因素eij重新定义为\n[0104]\n[0105] 其总和遍及所有对顶点。例如,纽曼算法可以用于产生节点到群的划分。\n[0106] 进一步地,解释根据本发明所使用的样式识别模型的实施方式,表明如何促进装置的自学习能力。在该示例中,研究用户的应用日志,并具体分析从一个应用到下个应用的跳跃。\n[0107] 用户有时完全凭感觉或根据他们想要使智能电话处于的分立使用情形可将应用切换至另一应用。然而,在许多情况下,使用会话紧紧连连结在一起,例如在用照相机拍照之后,无线设备用户会希望通过多媒体消息发送将该照片发送给其朋友。通过提供应用使用的历史模式,包括关于应用的身份和/或类型、会话持续时间和/或暂时邻近应用的身份和类型的信息,可基于例如Markov模型和/或神经网络创建使用行为的统计模型。通过最终的概率模型,可在任何特定时间算出每个用户的状态的合理估计,例如预测用户还将使用同一应用多长时间,或在当前活动之后发起某会话(例如照相机会话)的个人概率。可为若干用户的聚合确定类似估计。基于行为和情境模型以及引入本发明实施方式的数据处理能力,这些种类的模式识别和预测模型在向用户发送预测广告或其它个人化数据时具有直接应用,或甚至在实际移动发生之前可能将人群的移动模式(人的数量、方向、时间、位置)通信到例如市政当局,以便于例如交通控制中的直接应用。\n[0108] 接下来,将关于与外部实体(例如包括广告和社交媒体系统的不同外部系统)的实际结合,详细说明API实施步骤。数据分发API优选基于数据库的虚拟化和可扩展集群,并利用语义数据库模型进行使用,该模型能够实现从直接到更复杂的、语义表达的各种查询。数据分发API有利促进数据分发的推送和拉动模式。无论怎样至少支持任一模式。另外,其基于通用隐私设定、用户特定设定、数据共享条件和/或平台的拥有者或管理员定义的其它集中数据管理设定,集中管理每个用户的数据。数据分发API确保数据以正确格式有效流入合适的接口。数据可以各种格式输出。广泛使用的标准(诸如XML和GeoRSS(RSS,简单信息聚合))可用于预定义的数据流。另外,通过应用API的可用请求格式,可在API和例如通信网络中广泛使用的外部服务之间轻易地创建数个定制接口。一些示例性数据请求(查询)类型包括:\n[0109] 1.特定行为统计(例如平均应用,例如在诸如周末的时段期间网络浏览器使用、活动)\n[0110] 2.状态信息检索(无线设备用户的位置、情境和/或简档状态)\n[0111] 3.当前处于某情境(位置、应用会话)下的无线设备用户的ID\n[0112] 4.在某时段期间至少一次使用网络浏览器的无线设备用户的ID\n[0113] 5.特定无线设备用户或用户组曾经或在预定时段期间到访过的国家列表和/或数量\n[0114] 6.在某时刻(例如星期五下午)时特定无线设备用户最常在的位置\n[0115] 7.估计(预测)在期望时段(例如一小时)中特定无线设备用户的位置的可能性[0116] 8.在某时段期间从特定位置提供的图像内容\n[0117] 9.基于应用使用模式优选频繁(例如每晚)更新的无线设备用户的最近行为简档[0118] 单独的或以期望的组合所包括的作为查询的一部分的一些参数包括:\n[0119] 1.无线设备用户标识\n[0120] 2.时间表示(时间情境)\n[0121] 3.位置(情境)(过去、当前、未来)\n[0122] 4.状态信息(例如“移动”、“忙碌”)\n[0123] 5.情境(语义,例如,家、学校、办公室、公交车)\n[0124] 6.行为模式(应用使用)\n[0125] 数据分发API使得外部窗口小部件或应用都能进行在数据库中的查询。例如,特定应用可以构建用于社交媒体(联网)或其他服务,其自身带有用户界面和将由本发明的装置通过数据分发API提供的数据进行标示的功能。数据分发API不表明如何使用数据。相反地,它指定多用接口以使得更易于在派生数据的智能且优化的数据库进行查询\n[0126] 数据分发API通常创建在诸如数据表的派生数据单元的顶部。潜在地,API层的最广泛使用的实际应用包括朝向移动广告平台的接口,其中更新的用户情境和行为简档可以规则的间隔(例如每x分钟,例如x为六十)发送至移动广告平台。其它示例包括朝向社交媒体服务和其它网络服务创建的接口,在创建新特征时、在为每个用户动态调整用户界面时、在缩减内容时以及在用更动态数据代替静态数据丰富化用户数据库时,社交媒体服务和其它网络服务可利用时间行为和情境数据来改善服务端用户体验。数据分发API的目的在于支持可基于进入数据流动态更新的经处理和派生的行为和情境统计,以及以可扩展和灵活的方式向这些系统和接口分发信息,从而使装置的价值最大化。\n[0127] 图8是根据本发明的方法实施方式的流程图。\n[0128] 在814,获得根据本发明实施方式的服务器装置,并例如通过相关软件的安装和执行将该服务器装置配置成管理无线设备的观察数据。在816,从数个无线设备获得观察(原始)数据。可选地,还从数个其它外部数据源(例如,提供位置信息的元数据)接收补充数据。\n在818,基于对所获得的观察数据和可选补充数据进行的处理和分析创建数个派生数据单元,所述处理和分析包括聚合与可选的关联、聚类和/或因子分解过程,其中至少一个派生数据单元包括使用指标,该使用指标具有与一个或多个无线设备及其用户的一个或多个应用或其它特征相关的情境维度和可选技术维度。观察(原始)数据和派生数据都可存储在至少功能连接至服务器装置并形成数据存储的一个或多个位置中。在820,通过根据查询参数从一个或多个派生数据单元提供派生信息,为由外部实体表达的数据查询服务。另外或可替换地,可通过推送模式向其它元件提供派生数据。虚线示出不同阶段的灵活可重复性。本领域技术人员意识到,所示出的流程图实际上仅仅是示例性的,并且方法步骤的性质和数量可动态和/或根据使用情况特定调整,而忽略其相互顺序。\n[0129] 因此,本发明描述了最佳的技术架构和相关方法,从而根据本发明的每个实施方式和使用场景,能够将行为和情境数据自动转换为更有意义的信息,例如人-时间-情境-应用空间中的期望统计。\n[0130] 本发明范围在下列权利要求书中可见。虽然前文详细说明了各种实施方式,本领域技术人员应该理解,在不背离本文所述以及由所述权利要求书定义的本发明核心的前提下,可对本文明确公布的方案作出不同修改。
法律信息
- 2018-01-19
- 2012-06-27
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 200980160175.6
申请日: 2009.05.08
- 2012-05-16
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-07-16
|
2006-07-07
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |