著录项信息
专利名称 | 一种应用自动推荐的方法及装置 |
申请号 | CN201110444798.5 | 申请日期 | 2011-12-27 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-07-11 | 公开/公告号 | CN102567511A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 奇智软件(北京)有限公司 | 申请人地址 | 北京市朝阳区酒仙桥路14号兆维大厦4层东侧单元
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 奇智软件(北京)有限公司 | 当前权利人 | 奇智软件(北京)有限公司 |
发明人 | 叶松;秦吉胜;常富洋 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 赵娟 |
摘要
本申请提供了一种应用自动推荐的方法和装置,其中,所述方法包括:接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识;根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息;根据所述用户行为信息确定向用户推荐的应用类别;在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用;按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐。本申请能够满足用户的个性化需求,并提高推荐效率和覆盖率。
1.一种应用自动推荐的方法,其特征在于,包括:
接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识;
根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息,还包括用户的本地操作行为信息,和/或,用户的网上操作行为信息;所述用户的本地操作行为信息和/或网上操作行为信息中带有分类标签信息;
根据所述用户行为信息确定向用户推荐的应用类别;
在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用;
按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐;
其中,所述根据用户行为信息确定向用户推荐的应用类别的步骤包括:
从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次;
将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则;
从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别;
根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序;
提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数;
若提取不足预设数量的前n个应用类别,则按照云端所统计的网络用户实际使用次数最多的应用类别或最新设置的应用类别作为向用户推荐的应用类别进行补齐。
2.如权利要求1所述的方法,其特征在于,还包括:
采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。
3.如权利要求1所述的方法,其特征在于,通过以下步骤生成某个应用类别的应用数据集:
获取同一应用类别的应用,所述应用具有分类标签;
在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度;
获取所述待推荐应用的质量评分参数;
分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;其中,所述m为大于1的正整数;
将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。
4.如权利要求3所述的方法,其特征在于,所述在应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用的步骤包括:
根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用;
在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。
5.如权利要求4所述的方法,其特征在于,所述在应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用的步骤还包括:
获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于1的正整数;
将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集;
计算每个主应用单独出现的次数,生成频繁1项集;
根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序;
将所提取的满足第一预设数量的待推荐应用,以及,所述按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。
6.一种应用自动推荐的装置,其特征在于,包括:
请求接收模块,用于接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识;
在先行为信息提取模块,用于根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息,还包括用户的本地操作行为信息,和/或,用户的网上操作行为信息;所述用户的本地操作行为信息和/或网上操作行为信息中带有分类标签信息;
应用类别确定模块,用于根据所述用户行为信息确定向用户推荐的应用类别;
匹配应用获取模块,用于在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用;
应用推荐模块,用于按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐;
其中,所述应用类别确定模块包括:
第一特征提取子模块,用于从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次;
转换子模块,用于将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则;
第二特征提取子模块,用于从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别;
排序子模块,用于根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序;
类别选定子模块,用于提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数;
应用类别补齐模块,用于当提取不足预设数量的前n个应用类别时,则按照云端所统计的网络用户实际使用次数最多的应用类别或最新设置的应用类别作为向用户推荐的应用类别进行补齐。
7.如权利要求6所述的装置,其特征在于,还包括:
行为统计模块,用于采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。
8.如权利要求6所述的装置,其特征在于,还包括:
应用数据集生成模块,用于生成各个应用类别的应用数据集:具体包括:
同类应用获取子模块,用于获取同一应用类别的应用,所述应用具有分类标签;
相似度计算子模块,用于在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度;
质量评分参数获取子模块,用于获取所述待推荐应用的质量评分参数;
待推荐应用提取子模块,用于分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;
其中,所述m为大于1的正整数;
应用数据集形成子模块,用于将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。
9.如权利要求8所述的装置,其特征在于,所述匹配应用获取模块包括:
主应用统计子模块,用于根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用;
待推荐应用确定子模块,用于在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。
10.如权利要求9所述的装置,其特征在于,所述匹配应用获取模块还包括:
主应用选取子模块,用于获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于1的正整数;
频繁2项集计算子模块,用于将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集;
频繁1项集计算子模块,用于计算每个主应用单独出现的次数,生成频繁1项集;
置信度计算子模块,用于根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序;
匹配应用确定子模块,用于将所提取的满足第一预设数量的待推荐应用,以及,所述按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。
一种应用自动推荐的方法及装置 \n技术领域\n[0001] 本申请涉及信息处理技术领域,特别是涉及一种应用自动推荐的方法和一种应用自动推荐的装置。 \n背景技术\n[0002] 互联网是人们获取信息的一个重要途径,传统互联网的主要特点在于用户寻找自己感兴趣的事物时,需要通过浏览器进行大量的搜索,同时需要人工地过滤掉大量不相关的结果,操作繁琐,且耗费时间和精力。 \n[0003] 随着互联网技术的飞速发展,人们对各种网络应用(Application)的需求也越来越广泛,但随着需求的增加,人们在终端客户机中安装的终端应用也越来越多,各种应用在客户端的部署越来越臃肿庞大,这不但造成对终端资源的浪费,而且也不便于管理。即使采用客户端-服务器架构进行部署管理,服务器端在完成客户端的部署后也缺乏对后续使用的管理能力。 \n[0004] 尽管现在出现了所谓“瘦客户端(Thin Client)”的概念,瘦客户端将其鼠标、键盘等输入传送到服务器处理,服务器再把处理结果回传至客户端显示。但这种处理模式受制于网络传输速度,以及服务器的处理能力等限制,因此,更多的是应用于企业级的商用局域网中,目前还不适合普通用户的娱乐需求。 \n[0005] 为使用户获得更好的使用体验,现有技术提出了为用户提供感兴趣的应用自动推荐的方案,即通过获知用户的兴趣所在,主动为其推荐、提供其感兴趣的应用。然而,这种应用推荐的方式,主要都是通过编辑人员手工推荐的,这种编辑人员手工推荐的方式,主要存在以下缺陷: \n[0006] 1、效率过低,对于应用的推荐覆盖率太低,例如,对于平台上数十万的应用,每天采用人工推荐,也只能推荐几百个。如若想推荐全部应用实际上无法实现,而且覆盖率太低,因为所占比例太低。 \n[0007] 2、这种推荐完全是基于编辑人员的统一推荐原则进行,对于每个用户都一样,无法满足用户个性化的需求。因为有些推荐的应用对于某些用户而言是合适的,而对于某些用户却是不喜欢的。 \n[0008] 因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种应用自动推荐的机制,以满足用户的个性化需求,并提高推荐效率和覆盖率。 \n[0009] 发明内容\n[0010] 本申请所要解决的技术问题是提供一种应用自动推荐的方法,用以满足用户的个性化需求,并提高推荐效率和覆盖率。 \n[0011] 本申请还提供了一种应用自动推荐的装置,用以保证上述方法在实际中的应用及实现。 \n[0012] 为了解决上述问题,本申请实施例公开了一种应用自动推荐的方法,包括: [0013] 接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识; [0014] 根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息,还包括用户的本地操作行为信息,和/或,用户的网上操作行为信息;所述用户的本地操作行为信息和/或网上操作行为信息中带有分类标签信息; \n[0015] 根据所述用户行为信息确定向用户推荐的应用类别; \n[0016] 在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用; \n[0017] 按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐; \n[0018] 其中,所述根据用户行为信息确定向用户推荐的应用类别的步骤包括: [0019] 从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次; \n[0020] 将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则; \n[0021] 从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别; \n[0022] 根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序; \n[0023] 提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数; \n[0024] 若提取不足预设数量的前n个应用类别,则按照云端所统计的网络用户实际使用次数最多的应用类别或最新设置的应用类别作为向用户推荐的应用类别进行补齐。 [0025] 优选的是,所述的方法,还可以包括: \n[0026] 采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。 [0027] 优选的是,通过以下步骤可以生成某个应用类别的应用数据集: \n[0028] 获取同一应用类别的应用,所述应用具有分类标签; \n[0029] 在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度; \n[0030] 获取所述待推荐应用的质量评分参数; \n[0031] 分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;其中,所述m为大于1的正整数; \n[0032] 将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。 [0033] 优选的是,所述在应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用的步骤可以包括: \n[0034] 根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用; \n[0035] 在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。 \n[0036] 优选的是,所述在应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用的步骤还可以包括: \n[0037] 获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于1的正整数; \n[0038] 将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集; \n[0039] 计算每个主应用单独出现的次数,生成频繁1项集; \n[0040] 根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序; \n[0041] 将所提取的满足第一预设数量的待推荐应用,以及,所述按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。 \n[0042] 本申请实施例同时公开了一种应用自动推荐的装置,包括: \n[0043] 请求接收模块,用于接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识; \n[0044] 在先行为信息提取模块,用于根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息,还包括用户的本地操作行为信息,和/或,用户的网上操作行为信息;所述用户的本地操作行为信息和/或网上操作行为信息中带有分类标签信息; \n[0045] 应用类别确定模块,用于根据所述用户行为信息确定向用户推荐的应用类别; [0046] 匹配应用获取模块,用于在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用; \n[0047] 应用推荐模块,用于按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐; \n[0048] 其中,所述应用类别确定模块包括: \n[0049] 第一特征提取子模块,用于从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次; \n[0050] 转换子模块,用于将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则; \n[0051] 第二特征提取子模块,用于从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别; \n[0052] 排序子模块,用于根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序; \n[0053] 类别选定子模块,用于提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数; \n[0054] 应用类别补齐模块,用于当提取不足预设数量的前n个应用类别时,则按照云端所统计的网络用户实际使用次数最多的应用类别或最新设置的应用类别作为向用户推荐的应用类别进行补齐。 \n[0055] 优选的是,所述的装置,还包括: \n[0056] 行为统计模块,用于采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。 \n[0057] 优选的是,所述的装置,还可以包括: \n[0058] 应用数据集生成模块,用于生成各个应用类别的应用数据集:具体包括: [0059] 同类应用获取子模块,用于获取同一应用类别的应用,所述应用具有分类标签; [0060] 相似度计算子模块,用于在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度; \n[0061] 质量评分参数获取子模块,用于获取所述待推荐应用的质量评分参数; [0062] 待推荐应用提取子模块,用于分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;其中,所述m为大于1的正整数; \n[0063] 应用数据集形成子模块,用于将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。 \n[0064] 优选的是,所述匹配应用获取模块可以包括: \n[0065] 主应用统计子模块,用于根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用; \n[0066] 待推荐应用确定子模块,用于在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。 [0067] 优选的是,所述匹配应用获取模块还可以包括: \n[0068] 主应用选取子模块,用于获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于\n1的正整数; \n[0069] 频繁2项集计算子模块,用于将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集; \n[0070] 频繁1项集计算子模块,用于计算每个主应用单独出现的次数,生成频繁1项集; [0071] 置信度计算子模块,用于根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序; \n[0072] 匹配应用确定子模块,用于将所提取的满足第一预设数量的待推荐应用,以及,所述按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。 \n[0073] 与现有技术相比,本申请具有以下优点: \n[0074] 本申请基于已向用户推荐过的应用,分析用户针对所述在先推荐应用的操作信息,结合用户的网上操作行为信息和/或本地操作行为信息,确定用户行为信息所偏好的应用类别,然后在对应应用类别的应用数据集中,根据上述用户针对所述在先推荐应用的操作信息,结合用户的网上操作行为信息和/或本地操作行为信息,提取最符合用户兴趣的应用,将这些应用放入对应应用类别的文件夹中进行推荐,从而在应用和用户之间建立联系,充分满足了用户的个性化需求,并有效提高了应用的推荐效率和覆盖率。 [0075] 再者,本申请以用户界面作为入口,直接在界面上或通过界面上的链接通过应用文件夹图标向用户推荐应用,以便用户更快更容易的获取所需的应用,方便了用户操作;并且,通过图标作为应用入口的方式可以提示用户对该应用的使用,但在用户真正选择使用之前,并不实际安装该应用对应的配置文件,这样,可以在使用前并不过多占用客户端资源。此外,用户界面中的图标可以由网络侧中心服务器集中部署或推送,这就防止了恶意程序在界面中随意添加恶意图标,进一步提高了安全性。 \n附图说明\n[0076] 图1是本申请的一种应用自动推荐的方法实施例的步骤流程图; \n[0077] 图2是本申请的一种应用自动推荐的装置实施例的结构框图。 \n具体实施方式\n[0078] 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。 \n[0079] 本申请实施例的核心构思在于,基于已向用户推荐过的应用,分析用户针对所述在先推荐应用的操作信息,结合用户的网上操作行为信息和/或本地操作行为信息,确定用户行为信息所偏好的应用类别,然后在对应应用类别的应用数据集中,根据上述用户针对所述在先推荐应用的操作信息,结合用户的网上操作行为信息和/或本地操作行为信息,提取最符合用户兴趣的应用,将这些应用放入对应应用类别的文件夹中进行推荐,从而在应用和用户之间建立联系。 \n[0080] 参照图1,其示出了本申请的一种应用自动推荐的方法实施例的步骤流 程图,具体可以包括如下步骤: \n[0081] 步骤101、接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识; \n[0082] 在具体实现中,用户启动客户端可触发应用获取请求,用户也可以手动触发应用获取请求,本申请对此不作限制。 \n[0083] 步骤102、根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息; \n[0084] 所述用户特征库中可以记录如下信息:用户标识Mid,用户行为信息的分类标签tag,以及,对应的操作频次weight。 \n[0085] 在本申请的一种优选实施例中,所述用户的行为信息可以包括用户的本地操作行为信息,和/或,用户的网上操作行为信息,以及,用户针对在先推荐应用的操作信息。所述用户的本地操作行为信息和网上操作行为信息通常会带有分类标签(tag)信息,例如,对于用户在本地操作所打开的视频,带有火影忍者、动漫、连续剧、幻想、冒险、岸本齐史等分类标签信息;或如,对于用户在网上所访问的网址,带有视频、电影、喜剧电影、喜剧之王等分类标签信息。所述应用也具有应用类别和分类标签的信息。 \n[0086] 所述用户的本地操作行为信息和网上操作行为信息可以由安装在用户设备上的客户端软件进行采集,其中,所述用户设备可以包括计算机、笔记本电脑、手机、PDA、平板电脑等各类智能终端。以下提供几种采集用户的本地操作行为信息,和/或,用户的网上操作行为信息的示例: \n[0087] 例1,通过浏览器采集用户一段时间内的网上操作行为信息,包括访问的网址及相应的访问次数等; \n[0088] 如通过浏览器采集用户15天内的网上操作行为信息为: \n[0089] \n[0090] 例2,通过安装在用户设备上的安全软件采集用户的本地操作行为信息,如通过\n360网盾采集用户15天内的网上操作行为信息和本地行为信息为:打开暴风影音及其次数,打开某个游戏及其次数等。 \n[0091] 当然,上述采集的方法及采集的信息均只用作示例,本领域技术人员根据实际情况采用任一种方式采集所需的用户行为信息均是可行的,本申请实施例对此无需加以限制。 \n[0092] 步骤103、根据所述用户行为信息确定向用户推荐的应用类别; \n[0093] 在本申请的一种优选实施例中,所述步骤103具体可以包括如下子步骤: [0094] 子步骤S11、从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次; \n[0095] 子步骤S12、将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则; \n[0096] 子步骤S13、从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别; \n[0097] 子步骤S14、根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序; \n[0098] 子步骤S15、提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数。 \n[0099] 在实际中,可以根据由技术人员预先设置应用类别,通过分析用户行为信息,获得用户行为信息符合的应用类别。例如,预先设置的应用文件夹基本分类有20个,而通过分析用户行为信息,发现有一些基本分类对于当前用户是不需要的,则可以划分用户行为信息所归属的应用类别为更加贴近用户之前行为习惯的3个或者5个。例如,视频、游戏、教育等。 \n[0100] 为使本领域技术人员更好地理解本申请,以下通过一个具体示例说明根据用户行为信息确定向用户推荐的应用类别的过程: \n[0101] 数据来源: \n[0102] (1)最近15天的网盾数据:Data11; \n[0103] (2)最近15天的用户使用安全桌面的应用添加或点击日志:Data12; \n[0104] Data11的数据格式为: \n[0105] 用户标识Mid 分类标签Interest 第一操作频次weight1 \n[0106] Data11的数据示例如下: \n[0107] 0000175873530b93d848614a0c188c5b novel-dm 1; \n[0108] 000020218613d5fc8e05c314dba32956 comic-dm 4; \n[0109] 00002e3bb9037870973b328078971c98 4399-dm 1; \n[0110] Data12的数据格式为: \n[0111] 原始日志 \n[0112] Data12的数据示例如下: \n[0113] 123.97.168.210--[15/Oct/2011:23:00:01+0800]″GET/stat.html?type =open&action=yingyongdianji&fangshi=2&Appid=102000032&fenleiid =4&from=0&leixing = 2&style= fullscreen&uid= 1&pid =softmgr&m = 45c06dc58f5ccb64c162b646fcecc541&modulever=1.4.0.1103&appver =1.4.0.1103HTTP/1.1 ″ 200 \n0″-″″Mozilla/4.0(compatible;MSIE 7.0;Windows NT 6.1;Trident/4.0;GTB7.1;\nSLCC2;.NET CLR 2.0.50727;.NET CLR 3.5.30729;.NET CLR 3.0.30729;Media Center PC 6.0)″ \n[0114] Step1:将从网盾数据Data11中提取分类标签Interest,通过预设的转换规则表(yunCatToZhuoMianCat.conf)转换为应用文件夹分类体系下的用户兴趣的基本分类,即将所述类标签转换为对应的应用类别。所述预设的转换规则表yunCatToZhuoMianCat.conf格式中可以包括:分类标签、应用类别名称AppName以及应用类别标识Appid的信息,如下表所示: \n[0115] \n[0116] Data11转换的结果如下表所示: \n[0117] \n Mid Interest AppName Appid Weight1\n 000020218613d5fc8e05c314dba32956 comic-dm 时尚娱乐 8 4\n 0000175873530b93d848614a0c188c5b novel-dm 小说 11 1\n 00002e3bb9037870973b328078971c98 4399-dm 游戏 5 1\n[0118] Step2:通过解析原始日志Data12,计算每个Mid在最近15天内点击或添加各个应用的操作频次(第二操作频次),并根据Appid_name分类对照表,确定用户兴趣所对应的应用类别。 \n[0119] 其中,Appid_name分类对照表格式如下: \n[0120] 应用标识Appid应用类别标识fenleiid分类标签tag应用名称AppName。 \n[0121] Appid_name分类对照表的数据示例如下: \n[0122] 100026002 5 小游戏 其它 棋牌 卡通 英语 单人 拖拉机 \n[0123] 100013330 4 电视剧 古装 剧情 宫心计 \n[0124] 100114314 6 健康 家庭医生 自诊 家庭医生 \n[0125] 100114370 6 美食 红烧肉 菜谱 食谱 做饭 红烧肉的做法 \n[0126] 100013349 4 电视剧 军事 悬疑 告密者 \n[0127] 若通过解析原始日志Data12,计算每个Mid在最近15天内点击或添加各个应用的操作频次(第二操作频次Weight2)的数据如下表所示: \n[0128] \n[0129] 对照上述Appid_name分类对照表,确定用户兴趣所对应的应用类别如下表所示: [0130] \n Mid fenleiid Weight2\n 00008fc5c27c3354e1e0c9b6b7527dd9 5 1\n 0000b5d11c0c8ea46817fc32f467c3ba 4 3\n 0001555e4ea2b299b6fbc55f46eeb771 6 4\n[0131] Step3:把Step1和Step2的结果按照第一操作频次和第二操作频次进行加权平均,然后按照最终得分进行排序,取top9为向用户推荐的应用类别,即最终展示的分类应用文件夹的应用类别。 \n[0132] 例如:对于某一个Mid而言,Step1的结果为:type1点击n1次,type2点击n2次,type3点击n3次......; \n[0133] step2结果为:type1行为N1次,type2点击N2次,type3点击N3次......则score1=n1*0.6+N1*0.4,score2=n2*0.6+N2*0.4,score3=n3*0.6+N3*0.4...... [0134] 按score进行排序,取前9位的应用类别为向当前用户推荐的应用类别。 [0135] 在具体实现中,若对用户行为信息进行分析所划分的应用类别无法达到指定数量,如若采用上例只能生成三个类别,无法满足9个应用类别的需求,则可以按照云端所统计的网络用户实际使用次数最多的应用类别或最新设置的应用类别作为推荐的应用类别进行补齐。 \n[0136] 当然,上述划分用户行为信息所归属类别的方法仅仅用作示例,本领域技术人员根据实际情况采用一种方式都是可行的,例如,不提取主分类标签,直接将用户行为信息所带的标签按照预置规则转换为应用类别;或者,直接提取分类标签作为应用类别等,本申请对此不作限制。 \n[0137] 步骤104、在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用; \n[0138] 所述应用(Application)是指用户在网络上所使用的各种服务,如应用程序、网页、视频、小说、音乐、游戏、新闻、购物和邮箱等。应用数据集包含多个应用,来源于各个开放平台。在本申请实施例中,应用会带上类别信息(应用类别)和一些分类标签。 [0139] 在申请的一种优选实施例中,可以通过以下子步骤生成某个应用类别的应用数据集: \n[0140] 子步骤S21、获取同一应用类别的应用,所述应用具有分类标签; \n[0141] 子步骤S22、在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度; \n[0142] 子步骤S23、获取所述待推荐应用的质量评分参数; \n[0143] 子步骤S24、分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;其中,所述m为大于1的正整数; \n[0144] 子步骤S25、将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。 \n[0145] 上述优选实施例即针对同一应用类别的应用,根据其分类标签计算应用之间的相似性,形成一个包括主应用和待推荐应用的应用数据集。 \n[0146] 为使本领域技术人员更好地理解本申请,以下通过一个具体示例说明上述生成应用数据集的过程。 \n[0147] 1).根据应用的应用类别以及应用的分类标签tag计算应用app之间的相似度: [0148] 输入数据的数据格式为:Appid fenleiID tag1 tag2 tag3 tag4 tag5 tag6 tag7 tag8......; \n[0149] 结果文件Data1的数据格式为:主应用标识(主Appid)待推荐应用标识(待推荐Appid)相似度Similarity \n[0150] 相似度计算方法为: \n[0151] 在相同的应用类别内,以前i个tag作为类标记,在相同的标记内,app进行两两组合,计算其相似度,计算公式为:Similarity=i/(n1+n2-i);其中, n1为app1(应用1)后面tag的个数,n2为app2(应用2)后面tag的个数;i最小为2,最大为n1,进行循环遍历。例如: \n[0152] 输入数据为: \n[0153] 100030071 4 电影 剧情 喜剧 爱情 吴辰君 刘彦君 谢晓明 其它2010 大陆 [0154] 100030073 4 电影 剧情 喜剧 动作 金荷娜 姜志焕 申太罗 其它2009 韩国 [0155] 100030074 4 电影 悬疑 科幻 惊悚 尼古拉斯·凯奇 钱德勒·坎特布瑞亚历克斯·普罗亚斯 其它 2009 美国 \n[0156] 结果文件Data1为: \n[0157] 100030071 100030073 0.25 \n[0158] 100030071 100030074 0.11 \n[0159] 100030073 100030074 0.11 \n[0160] 2).在同一个主Appid内,对待推荐Appid按相似度以及Appid的质量得分(每日下载量、用户评分)进行综合排序,即Appid相似度*相似度权重+Appid质量得分*(1-相似度权重),截取综合得分最高的前50个待推荐Appid,然后合并为一行; \n[0161] 输入数据:Data1(上一步的结果文件) \n[0162] 输出数据Data2的格式如下:主Appid待推荐Appid1待推荐Appid2待推荐\nAppid3待推荐Appid4...... \n[0163] 例如: \n[0164] 输入数据Data1为: \n[0165] 100030071 100030073 0.25 \n[0166] 100030071 100030074 0.11 \n[0167] 100030073 100030074 0.11 \n[0168] 100030073 100030071 0.25 \n[0169] 100030074 100030071 0.11 \n[0170] 100030074 100030073 0.11 \n[0171] 输出数据Data2为: \n[0172] 100030071 100030073 100030074...... \n[0173] 100030073 100030071 100030074...... \n[0174] 100030074 100030071 100030073...... \n[0175] 在申请的一种优选实施例中,所述步骤104可以进一步包括如下子步骤: [0176] 子步骤S31、根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用; \n[0177] 子步骤S32、在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。 \n[0178] 为使本领域技术人员更好地理解本申请,以下通过一个具体示例说明上述子步骤S31-S32。 \n[0179] Step1: \n[0180] 3).根据Mid的应用操作行为日志,统计Mid添加或者点击每个app的次数; [0181] 输入数据:Mid添加或者点击应用的日志记录(最近30天的应用操作行为日志); [0182] 输出数据Data3的格式为:Mid 主Appid(点击或者添加的app的id) \n[0183] weight3(第三操作频次) \n[0184] 若输入数据为: \n[0185] 27.185.166.230--[20/Aug/2011:10:11:47+0800]″GET/stat.html?type =open&action=yingyongdianji&fangshi=2&Appid=103352&fenleiid=10001&from=0&leixing=1&style=fullscreen&uid=1&pid=h_home_inst&m=71ddd8f9f1c8\n4e16438ef109f4b6d77b&modulever=1.4.0.1041&appver=1.4.0.1041 HTTP/1.1″200 \n0 ″ - ″ ″ Mozilla/4.0(compatible;MSIE 7.0;Windows NT 6.0;SLCC1;.NET CLR2.0.50727;Media Center PC 5.0;.NET CLR 3.5.30729;.NET CLR 3.0.30618)″ [0186] 111.127.218.150--[20/Aug/2011:10:11:47+0800]″GET/stat.html?type=open&action=tianjiayingyong&Appid=100018815&fenleiid=4&sort=%b6%af%bb%ad&from=5&style=fullscreen&uid=1&pid=h_home_inst&m=9e236bafe13c\n8348247781c2d0fab7a7&modulever=1.0.2.1025&appver=1.4.0.1040 HTTP/1.1″200 \n0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT 5.1;SV1;4399Box.909)″ [0187] 58.50.201.130--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type =open&action=yingyongdianji&fangshi=2&Appid=103352&fenleiid=10001&from= 6&leixing = 1&style = iphone&uid = 1&pid = h_home&m = 3d3e77348ff2fbfa\n6af7c3751a00edae&modulever = 1.4.0.1040&appver = 1.4.0.1040HTTP/1.1 ″ 200 \n0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT 5.1)″ \n[0188] 110.178.40.7--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type =open&action=yingyongdianji&fangshi=2&Appid=100000525&fenleiid =4&from=0&leixing=2&style=fullscreen&uid=1&pid=softmgr&m =f16b5a2c01d64fcfa3ff5f035ce74677&modulever=1.4.0.1041&appver=1.4.0.1041 HTTP/1.1″ 200 \n0″-″″Mozilla/4.0(compatible;MSIE 7.0;Windows NT 5.1;Trident/4.0)″ [0189] 58.50.201.130--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type= open&action = zuixiaohuazhuomian&count = 90468&uid = 1&pid = h_home&m= 3d3e77348ff2fbfa6af7c3751a00edae&modulever = 1.4.0.1040&appver =\n1.4.0.1040HTTP/1.1″200 0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT \n5.1)″ \n[0190] 输出数据Data3为: \n[0191] 0004a218f3b8a96b59f67a8f14be5e98 100000289 102 \n[0192] 0004ce91dc7726afdc420a97ad050f5a 100103087 1 \n[0193] 0004cfe7c72aa83bfa20e561b6a00823 102020214 2 \n[0194] 0004ec5290131cf7fa6d5a18833e06a5 102005903 3 \n[0195] 0004f55c24b9fb8745b6d7595d94972d 120033743 1 \n[0196] 00051004579f67de2066dc94f8952fd4 100000275 5 \n[0197] 00054c7ba3cf1b45330444cbb737cac4 100114758 4 \n[0198] 4).根据Data2和Data3,通过主app进行匹配,然后根据权重排序 \n[0199] Mid1 fenleiid1 Appid1 Appid2 Appid3 Appid4......weight \n[0200] Mid1 fenleiid2 Appid11 Appid22 Appid33 Appid44......weight \n[0201] 根据权重大小,权重越大,该类里面截取app越多,采用随机截取的方式,总共截取50个Appid,然后以Mid和fenleiid为关键字进行合并,生成结果文件为 \n[0202] Mid1 fenleiid Appid1 Appid2 Appid3 Appid4......Appid20 \n[0203] 例如: \n[0204] 输入数据:Data2和Data3 \n[0205] 其中,Data2为: \n[0206] 001(100 101 102 103 104 105 106 107 108 109......) \n[0207] 002(201 202 203 204 205 206 207 208 209 210......) \n[0208] 003(301 302 303 304 305 306 307 308 309 310......) \n[0209] 008(801 802 803 804 805 806 807 808 809 810......) \n[0210] 假设上述Data2中括号内的部分为与主app相似度最高的前50个Appid \n[0211] Data3为: \n[0212] Xx1 00 15 \n[0213] Xx1 002 3 \n[0214] Xx1 003 2 \n[0215] Xx1 008 5 \n[0216] 通过Appid_name分类对照表,映射出其类别,获得Data33为: \n[0217] Xx1 1 001 5 \n[0218] Xx1 1 002 3 \n[0219] Xx1 1 003 2 \n[0220] Xx1 2 008 5 \n[0221] 中间输出数据: \n[0222] 第1条数据:Xx1 1 100 101 102 103 104 105 106 107 108 109......5 [0223] 第2条数据:Xx1 1 201 202 203 204 205 206 207 208 209 210......3 [0224] 第3条数据:Xx1 1 301 302 303 304 305 306 307 308 309 310......2 [0225] 第4条数据:Xx1 2 801 802 803 804 805 806 807 808 809 810......5 [0226] 按照权重计算方法: \n[0227] 第1条数据中随机抽取5/(5+3+2)*20=10个Appid; \n[0228] 第2条数据中随机抽取3/(5+3+2)*20=6个Appid; \n[0229] 第3条数据中随机抽取2/(5+3+2)*20=4个Appid; \n[0230] 最终输出数据为: \n[0231] Xx1 1 100 101 102 103 104 105 106 107 108 109 204 205 206 207 208 \n209306 307 308 303 \n[0232] Xx2 2 801 802 803 804 805 806 807 808 809 810...... \n[0233] 更为优选的是,所述步骤104可以进一步包括如下子步骤: \n[0234] 子步骤S33、获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于1的正整数; [0235] 子步骤S34、将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集; \n[0236] 子步骤S35、计算每个主应用单独出现的次数,生成频繁1项集; \n[0237] 子步骤S36、根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序; \n[0238] 子步骤S37、将所提取的满足第一预设数量的待推荐应用,以及,所述 按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。 \n[0239] 本实施例的核心构思之一在于,基于用户添加或者点击应用的行为即其对应用的偏好找到相似的应用,然后根据用户的历史偏好即历史添加或者点击的应用,向其推荐相似的应用。从计算的角度看,就是将所有用户对某个应用的偏好作为一个向量来计算应用之间的相似度,得到应用的相似应用后,根据用户历史的偏好预测当前用户还没有表示偏好的应用,计算得到一个排序的应用列表作为推荐。 \n[0240] 为使本领域技术人员更好地理解本申请,以下通过一个具体示例说明上述子步骤S33-S37。 \n[0241] Step2: \n[0242] 1).根据Mid添加和点击应用的行为日志,统计Mid添加或者点击每个app的次数; \n[0243] 输入数据:Mid添加或者点击应用日志(最近30天的应用操作行为日志); [0244] 输出数据Data1的格式为:Mid主Appid(点击或者添加的app) \n[0245] weight3(第三操作频次) \n[0246] 例如:输入数据为: \n[0247] 27.185.166.230--[20/Aug/2011:10:11:47+0800]″GET/stat.html?type =open&action=yingyongdianji&fangshi=2&Appid=103352&fenleiid=10001&from=\n0&leixing=1&style=fullscreen&uid=1&pid=h_home_inst&m=71ddd8f9f1c84e1\n6438ef109f4b6d77b&modulever=1.4.0.1041&appver=1.4.0.1041 HTTP/1.1″2000″-″″Mozilla/4.0(compatible;MSIE 7.0;Windows NT 6.0;SLCC1;.NET CLR2.0.50727;\nMedia Center PC 5.0;.NET CLR 3.5.30729;.NET CLR 3.0.30618)″ \n[0248] 111.127.218.150--[20/Aug/2011:10:11:47+0800]″GET/stat.html?type=open&action=tianjiayingyong&Appid=100018815&fenleiid=4&sort=%b6%af%bb%ad&from=5&style=fullscreen&uid=1&pid=h_home_inst&m=9e236bafe13c\n8348247781c2d0fab7a7&modulever=1.0.2.1025&appver=1.4.0.1040 HTTP/1.1″200 \n0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT 5.1;SV1;4399Box.909)″ [0249] 58.50.201.130--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type =open&action=yingyongdianji&fangshi=2&Appid=103352&fenleiid=10001&from= 6&leixing = 1&style = iphone&uid = 1&pid = h_home&m = 3d3e77348ff2fbfa\n6af7c3751a00edae&modulever = 1.4.0.1040&appver = 1.4.0.1040HTTP/1.1 ″ 200 \n0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT 5.1)″ \n[0250] 110.178.40.7--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type =open&action=yingyongdianji&fangshi=2&Appid=100000525&fenleiid =4&from=0&leixing=2&style=fullscreen&uid=1&pid=softmgr&m =f16b5a2c01d64fcfa3ff5f035ce74677&modulever=1.4.0.1041&appver=1.4.0.1041 HTTP/1.1 ″200 \n0″-″″Mozilla/4.0(compatible;MSIE 7.0;Windows NT 5.1;Trident/4.0)″ [0251] 58.50.201.130--[20/Aug/2011:10:11:47+0800] ″ GET/stat.html ? type= open&action = zuixiaohuazhuomian&count = 90468&uid = 1&pid = h_home&m= 3d3e77348ff2fbfa6af7c3751a00edae&modulever = 1.4.0.1040&appver =\n1.4.0.1040HTTP/1.1″200 0″-″″Mozilla/4.0(compatible;MSIE 6.0;Windows NT \n5.1)″ \n[0252] 输出数据Data1为: \n[0253] 00062ee80feec92758b8be8d3e4b9c16 100113997 2 \n[0254] 0006d880a38f687c3fca10e8c4efa227 102019670 2 \n[0255] 0007400ba8300fc80b7210a0e66de257 102022805 2 \n[0256] 0007bda041324ee53b83f0343daf84d2 102005801 2 \n[0257] 00080118032d30ad28a9bce8232d17c8 100013133 3 \n[0258] 0008020587ea4fecf08ad58b09ef5904 110195914 2 \n[0259] 00082bf0489199360bce8a06693ef3f5 100115004 3 \n[0260] 与Appid_name对照表进行映射,找出各个Appid对应的应用类别,结果如下: [0261] 00062ee80feec92758b8be8d3e4b9c16 1 100113997 2 \n[0262] 0006d880a38f687c3fca10e8c4efa227 1 102019670 2 \n[0263] 0007400ba8300fc80b7210a0e66de257 2 102022805 2 \n[0264] 0007bda041324ee53b83f0343daf84d2 9 102005801 2 \n[0265] 00080118032d30ad28a9bce8232d17c8 6 100013133 3 \n[0266] 0008020587ea4fecf08ad58b09ef5904 6 110195914 2 \n[0267] 00082bf0489199360bce8a06693ef3f5 4 100115004 3 \n[0268] 2).在同一个Mid和feileid内,对其点击或者添加过的app按点击或者添加次数进行排序,取前20的Appid,并归入一行。 \n[0269] 输入数据:Data1(上一步的输出数据) \n[0270] 输出数据Data2的数据结构为:Mid fenleiid Appid1 weight1 Appid2weight2 Appid3 weight3...... \n[0271] 例如:输入数据: \n[0272] 00082bf0489199360bce8a06693ef3f5 1 100115004 3 \n[0273] 00083ebafe4eb71596f45dfa821f73d5 1 102028904 5 \n[0274] 000887c0d3498c7c43cecb566a6333e4 8 102020030 3 \n[0275] 0008ce3ae13aa6332794861b275861ad 10 102005157 2 \n[0276] 输出数据Data2为: \n[0277] 007a2663bac10378bcaa874be36a2d97 1 102006053 2 102028976 \n1100000913 1 \n[0278] 007abe31b117a554df0fefc2a91200c2 2 120042762 11 102023358 \n2100000568 2 102010364 1 100115004 1 \n[0279] 007b3dc8a31a6627a6e2468f789aa078 8 102007826 19 102020628 \n6102007664 6 102028968 4 100012183 3 100012315 3102043563 2 \n102022076 2 102000032 2 102031006 2110004672 2 102007377 2 101000009 \n2 110091072 2100030320 2 102044509 2 102043791 2 102044243 \n2102044665 2 100040423 2 \n[0280] 007bb8043a487ed3a690aa6d461a3c10 10 102019572 3 \n[0281] 007d072a6bfe28591f0eb4c5d533784c 18 100000525 31 10000028919 \n101000053 16 102005903 6 100000625 4 102020030 4102020628 3 120055003 \n3 100000913 3 102001686 2100034506 2 102005985 2 100000801 2 \n102044292 2110153628 2 100115575 2 100045261 2 100115650 2100103773 \n2 100102029 2 \n[0282] 3).在同一对Mid和fenleiid内,Appid两两配对,记共同出现1次,然后以两个Appid为1类,计算两个Appid同时出现的总次数,生成频繁2项集。 \n[0283] 输入数据:Data2(上一步的输出数据) \n[0284] 输出数据Data3的数据结构为:Appid1 Appid2 weight(出现次数) \n[0285] 例如:输入数据 \n[0286] Xx1 1 001 002 003 004...... \n[0287] Xx2 2 001 002 003...... \n[0288] Xx3 15 002 004...... \n[0289] 中间结果文件: \n[0290] 001 002 1 \n[0291] 001 003 1 \n[0292] 001 004 1 \n[0293] 002 003 1 \n[0294] 002 004 1 \n[0295] 003 004 1 \n[0296] 001 002 1 \n[0297] 002 005 1 \n[0298] 002 004 1 \n[0299] 输出数据Data3为: \n[0300] 001 002 2 \n[0301] 001 003 1 \n[0302] 001 004 1 \n[0303] 002 003 2 \n[0304] 002 004 2 \n[0305] 003 004 1 \n[0306] 4).计算频繁1项集,记计算每个Appid出现的次数 \n[0307] 输入数据:Data1(第1)步的输出数据) \n[0308] 输出数据Data4的数据结构为:Appid weight(出现次数) \n[0309] 例如: \n[0310] 输入数据: \n[0311] Xx1 001 10 \n[0312] Xx1 002 8 \n[0313] Xx1 003 5 \n[0314] Xx2 002 8 \n[0315] Xx2 003 9 \n[0316] Xx3 003 7 \n[0317] 输出数据Data4为: \n[0318] 001 1 \n[0319] 002 2 \n[0320] 003 3 \n[0321] 5).计算置信度,并按置信度进行排序 \n[0322] 例如:频繁2项集中应用A和应用B出现的次数为N,频繁1项集中应用A出现的次数为M,则相对于A来说,B的置信度为N/M,根据置信度进行排序,取排序前50的应用,并以首应用为类,合并到一行,结构为: \n[0323] A B C D ...... \n[0324] 输入数据:Data3和Data4 \n[0325] 输 出 数 据 Data5 的 数 据 结 构 为:Appid Appid1 weight1 \nAppid2weight2......Appid50 weight50 \n[0326] 例如: \n[0327] 输入数据Data3为: \n[0328] 001 100 20 \n[0329] 001 101 18 \n[0330] 001 102 16 \n[0331] 001 103 14 \n[0332] 001 104 12 \n[0333] 001 106 10 \n[0334] 002 201 50 \n[0335] 002 202 30 \n[0336] 002 101 10 \n[0337] 002 102 5 \n[0338] 输入数据Data4为: \n[0339] 001 100 \n[0340] 002 200 \n[0341] 输出数据Data5为: \n[0342] 001 100 101 102 103 104 106...... \n[0343] 002 201 201 101 102 ...... \n[0344] 6).根据Data1和Data5,按照用户Appid进行匹配,生成推荐结果。 \n[0345] 例如: \n[0346] Data1: \n[0347] Xx1 1 001 10 \n[0348] Xx1 2 002 5 \n[0349] Data5: \n[0350] 001 100 101 102 103 104 105 106 107...... \n[0351] 002 200 201 202 203 204 205 206 207...... \n[0352] 按照标有下划线的Appid进行匹配,生成中间结果为: \n[0353] Xx1 1 100 101 102 103 104 105 106 107......10 \n[0354] Xx1 2 200 201 202 203 204 205 206 207......5 \n[0355] 在同一对Mid和fenleiid内,按照权重进行排序取前50个应用如下: \n[0356] Xx1 1 100 101 102 103 104 105 106 107......200 201 202 203 204 205206 \n207...... \n[0357] 在具体实现中,可以进一步将上述示例中Step1和Step2的结果按照Mid和fenleiid进行合并,用步骤103确定的应用类别进行过滤,只取确定的应用类别的应用数据,然后在每个应用类别内随机取50个应用作为推荐结果。如果某个应用类别内没有数据,则可以采用任一机制进行补齐,例如,放入最热门的应用,最新的应用等。 [0358] 当然,上述查找与用户行为信息匹配应用的方法仅仅用作示例,本领域技术人员采用其它计算方法也是可行的,例如,通过计算用户行为信息的分类标签与相应类别应用数据集中应用的分类标签的匹配度等,本申请对此无需加以限制。 \n[0359] 步骤105、按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐。 \n[0360] 应用本申请实施例,将按类别生成应用文件夹,相应类别下的,与用户行为信息匹配的应用即在对应类别的应用文件夹中向用户进行推荐,从而有利于节省用户设备的资源。 \n[0361] 在具体实现中,对于推荐给用户的应用文件夹,可以在桌面的不同分屏中进行展现,优选的是,还可以依据用户分屏的高度和宽度,确定每个分屏中推荐的应用文件夹的个数。应用本申请实施例,所述应用文件夹的展现顺序是根据各应用类别对应主分类标签的操作频次从高到低设置的,因此应用文件夹是根据用户兴趣的匹配度从高到低展现给用户;并且,应用文件夹中的应用也按权重进行了排序,即也是根据用户兴趣的匹配度从高到低展现给用户,从而能更方便用户的操作,使用户获得更好的使用体验。 \n[0362] 在具体实现中,可以在终端桌面的用户界面中统一展示与多个应用文件夹相对应的图标,每个图标代表一个应用文件夹,通过图标作为与应用入口的方式。这种图形化的展示方式对于用户来说非常直观,而且便于使用和管理。例如,用户界面中展示应用文件夹的图标包括“视频”,“小说”,“教育”和“游戏”,在用户点击“视频”应用文件夹的图标后,进入该应用文件夹的子窗口,在子窗口中展示有电视剧、电影、动漫、综艺等多个应用图标。通过图标作为应用入口的方式可以提示用户对该应用的使用,但在用户真正选择使用之前,并不实际安装该应用对应的配置文件,这样,不仅可以方便用户的使用,而且在使用前并不过多占用客户端资源。 \n[0363] 用户界面中的图标可以由网络侧中心服务器集中部署或推送,这就防止了恶意程序在界面中随意添加恶意图标,进一步提高了安全性。有中心服务器集中管理的配置文件可以包括对应应用的访问地址、呈现规格,及所述应用的打开方式,或者它们的任何组合。 [0364] 例如,对于web应用来说,web访问的地址由中心服务器通过配置文件的方式发送至终端侧,这就防止了终端侧的恶意程序对访问地址的篡改。 \n[0365] 而且,网络侧中心服务器可以通过与第三方内容服务器的交互获得更新的配置文件信息,例如,如果某个应用的访问地址发生变化,服务器会通过与内容服务器的交互获得更新后的地址信息,并通过配置文件发送过来,杜绝了因访问地址变更给恶意程序留下的可乘之机。 \n[0366] 此外,用户设备在获得与所述图标相对应的应用的配置文件后,还可以更新该图标的展示状态,以进一步提示用户。例如,未获得配置文件前,图标可以是黑白色,或暗色,而在获得后,可以变为彩色或亮色。 \n[0367] 还需说明的是,在终端侧用户界面中展示的应用文件夹图标,可以是一个或多个,可以根据不同的展示规则来确定。例如,当使用一个图标时,该图标可以作为多个下级应用或下级图标的统一入口,其中任何一个应用获得更新信息时,在该入口图标处均可以获得提示。 \n[0368] 在本申请的一种优选实施例中,还可以包括如下步骤: \n[0369] 采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。 [0370] 通过建立用户特征库,则可以将用户行为信息统一在服务器端或云端进行处理,在这种实施例中,将可以在用户特征库中记录用户当次的操作行为信息,并根据用户特征库往次的操作行为信息确定应向用户推荐的应用文件夹及相应的应用。 \n[0371] 需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。 [0372] 参照图2,示出了本申请的一种应用自动推荐的装置实施例的结构框图,具体可以包括如下模块: \n[0373] 请求接收模块201,用于接收用户从客户端提交的应用获取请求,所述应用获取请求中包括用户标识; \n[0374] 在先行为信息提取模块202,用于根据所述用户标识从用户特征库中提取相应用户已有的用户行为信息,所述用户行为信息包括用户针对在先推荐应用的操作信息; [0375] 应用类别确定模块203,用于根据所述用户行为信息确定向用户推荐的应用类别; \n[0376] 匹配应用获取模块204,用于在所述应用类别的应用数据集中,根据用户针对在先推荐应用的操作信息提取匹配的应用; \n[0377] 应用推荐模块205,用于按所述应用类别生成对应的应用文件夹,将所述匹配的应用放入对应的应用文件夹中进行推荐。 \n[0378] 在具体实现中,本申请实施例还可以包括如下模块: \n[0379] 行为统计模块,用于采集提交所述应用获取请求后的用户行为信息,按用户标识写入用户特征库中。 \n[0380] 作为本申请实施例具体应用的一种示例,所述用户行为信息还包括用户的本地操作行为信息,和/或,用户的网上操作行为信息;在这种情况下,所述应用类别确定模块203可以包括如下子模块: \n[0381] 第一特征提取子模块,用于从所述用户的本地操作行为信息和/或网上操作行为信息中,提取分类标签和对应的第一操作频次; \n[0382] 转换子模块,用于将所述分类标签按预设的关联规则转换为对应的应用类别;所述预设的关联规则为分类标签及应用类别的转换规则; \n[0383] 第二特征提取子模块,用于从所述用户针对在先推荐应用的操作信息中,提取用户在预设时间段内所操作的应用信息及对应的第二操作频次,所述应用信息中包括应用类别; \n[0384] 排序子模块,用于根据所述第一操作频次和第二操作频次计算各应用类别的权重,按所述应用类别的权重从高到低进行排序; \n[0385] 类别选定子模块,用于提取预设数量的前n个应用类别为向用户推荐的应用类别;其中,所述n为大于1的正整数。 \n[0386] 在本申请的一种优选实施例中,所述装置还可以包括如下模块: \n[0387] 应用数据集生成模块,用于生成各个应用类别的应用数据集: \n[0388] 所述应用数据集生成模块与匹配应用获取模块204连接,具体可以包括如下子模块: \n[0389] 同类应用获取子模块,用于获取同一应用类别的应用,所述应用具有分类标签; [0390] 相似度计算子模块,用于在所述应用中确定主应用及待推荐应用,并根据各应用的分类标签计算待推荐应用与主应用的相似度; \n[0391] 质量评分参数获取子模块,用于获取所述待推荐应用的质量评分参数; [0392] 待推荐应用提取子模块,用于分别提取同一主应用所对应的待推荐应用,按各待推荐应用的相似度和质量评分参数从高到低进行排序,并提取预设数量前m个的待推荐应用;其中,所述m为大于1的正整数; \n[0393] 应用数据集形成子模块,用于将主应用及所提取的对应待推荐应用组成当前应用类别的应用数据集。 \n[0394] 在本申请的一种优选实施例中,所述匹配应用获取模块204可以包括如下子模块: \n[0395] 主应用统计子模块,用于根据用户针对在先推荐应用的操作信息,统计主应用及对应的第三操作频次,所述主应用为用户所操作的应用; \n[0396] 待推荐应用确定子模块,用于在对应应用类别的应用数据集中,根据所述主应用提取匹配的待推荐应用,并在所述匹配的待推荐应用中,将所述第三操作频次作为应用提取的权重分别提取一定数量的待推荐应用,总共提取满足第一预设数量的待推荐应用。 [0397] 更为优选的是,所述匹配应用获取模块204还可以包括如下子模块: \n[0398] 主应用选取子模块,用于获取主应用对应的应用类别,在同一应用类别内,按所述第三操作频次对所述主应用进行排序,提取预设数量的前k个主应用;其中,所述k为大于\n1的正整数; \n[0399] 频繁2项集计算子模块,用于将所提取的主应用两两配对,计算所述两两配对的主应用同时出现的总次数,生成频繁2项集; \n[0400] 频繁1项集计算子模块,用于计算每个主应用单独出现的次数,生成频繁1项集; [0401] 置信度计算子模块,用于根据所述频繁2项集和频繁1项集计算各主应用的置信度,并按置信度对主应用进行排序; \n[0402] 匹配应用确定子模块,用于将所提取的满足第一预设数量的待推荐应用,以及,所述按置信度排序的主应用进行匹配,生成最终推荐的匹配应用。 \n[0403] 本申请实施例不仅可以应用于单台设备的应用环境中,还可以应用于服务器-客户端的应用环境,或者进一步应用于基于云技术的应用环境中。 \n[0404] 由于所述装置实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。本申请装置实施例和系统实施例中所涉及的模块、子模块和单元可以为软件,可以为硬件,也可以为软件和硬件的组合。 [0405] 本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、 基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。 \n[0406] 本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。 \n[0407] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。 [0408] 以上对本申请所提供的一种应用自动推荐的方法和一种应用自动推荐的装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
法律信息
- 2022-12-06
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 201110444798.5
申请日: 2011.12.27
授权公告日: 2013.10.02
- 2013-10-02
- 2012-09-12
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201110444798.5
申请日: 2011.12.27
- 2012-07-11
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |