著录项信息
专利名称 | 一种清理隐私数据的方法和装置 |
申请号 | CN201410281418.4 | 申请日期 | 2014-06-20 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-10-08 | 公开/公告号 | CN104090922A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;H;0;4;M;1;/;7;2;5查看分类表>
|
申请人 | 北京奇虎科技有限公司;奇智软件(北京)有限公司 | 申请人地址 | 北京市西城区新街口外大街28号D座112室(德胜园区)
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京奇虎科技有限公司,奇智软件(北京)有限公司 | 当前权利人 | 北京奇虎科技有限公司,奇智软件(北京)有限公司 |
发明人 | 王源;夏凡;陈宁一;周云峰 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 赵娟 |
摘要
本发明实施例提供了一种清理隐私数据的方法,所述方法包括接收用户在预定的第一界面位置上点击的清理请求;将所述清理请求发送给清理进程,所述清理进程用于依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回;提供清理结果的展现。本发明可以加快清理速度,提高准确度,减少人工操作,减少耗时,增加存储介质的读写寿命,降低成本,减少隐私数据的清理时的运算,提高清理效率。
一种清理隐私数据的方法和装置\n技术领域\n[0001] 本发明涉及文件清理技术领域,特别是涉及一种清理隐私数据的方法和一种清理隐私数据的装置。\n背景技术\n[0002] 随着智能终端的普及,手机逐渐融入生活的方方面面,例如,使用手机拍摄照片、视频、录音等等,手机已然成为各种文件的重要载体,文件可以在存储介质中执行存储、修改、删除等操作。\n[0003] 手机的存储介质具有一定的读写寿命,读写次数越少,读写寿命越长,为了减少读写次数,手机中删除文件时并不是直接将文件从存储介质中擦除,而只是做个标记,告知手机该文件已被删除。\n[0004] 除了在存储介质中存储数据外,一些与通信有关的数据需要存储在SQLite数据库的文件中,例如短信、通话记录、联系人等,当一个事务从SQLite数据库中删除了数据并提交后,SQLite数据库的文件大小保持不变。即使整页的数据都被删除,该页也会变成“空闲页”等待再次被使用,而不会实际地从SQLite数据库的文件中删除。\n[0005] 目前,彻底删除这些包括隐私的数据的方案中,清理SQLite数据库中的隐私数据通常是人工操作,将SQLite数据库的文件一个一个地打开后手动进行删除,清理存储介质中的隐私数据沿用在PC上清理数据的方案,即通过全盘扫描,将隐私数据扫描出来后进行删除。\n[0006] 然而,当存在数量巨大的SQLite数据库需要清理隐私记录时,人工操作将无法满足如此巨大的需求,并且,由于不同的SQLite数据库隐私记录不同,人工操作对隐私记录的识别容易出现错误,造成人工操作的耗时较多,准确率降低,存储介质读写寿命降低,成本增加。\n[0007] 此外,由于手机的运算能力比较差,存储卡的读取速度也比较慢,若在手机上执行一次全盘扫描,速度会比较慢,运算完所有文件需要的时间比较长,造成清理效率低下。\n发明内容\n[0008] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种清理隐私数据的方法和相应的一种清理隐私数据的装置。\n[0009] 依据本发明的一个方面,提供了一种清理隐私数据的方法,所述方法包括:\n[0010] 接收用户在预定的第一界面位置上点击的清理请求;\n[0011] 将所述清理请求发送给清理进程,所述清理进程用于依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回;\n[0012] 提供清理结果的展现。\n[0013] 可选地,所述清理请求中包括隐私数据的存储路径,所述将所述清理请求发送给清理进程,所述清理进程依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回的步骤包括:\n[0014] 将所述清理请求发送给清理进程;所述清理进程用于依据所述隐私数据的存储路径查找隐私数据,并将查找到的隐私数据返回;\n[0015] 提供所述隐私数据的展现;\n[0016] 接收用户在预定的第二界面位置上点击的确认清理请求,并将所述确认清理请求发送给所述清理进程,所述清理进程用于依据所述确认清理请求完成对所述隐私数据的清理,生成清理结果,并将所述清理结果返回。\n[0017] 可选地,所述隐私数据包括存储在EXT文件系统中的第一隐私数据,所述清理请求还包括第一隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第一隐私数据的存储路径查找EXT文件系统中的第一隐私数据:\n[0018] 依据所述隐私数据的存储路径判断文件系统的格式;\n[0019] 当判定所述文件系统的格式为EXT文件系统时,依据所述指定格式提取预设的第三类型标识;\n[0020] 从所述EXT文件系统中提取出各个区块群组block group;\n[0021] 针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0022] 在所述数据块block中的指定位置读取第四类型标识;\n[0023] 当所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0024] 当所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息;\n[0025] 若是,则判定为查找到一条第一隐私数据。\n[0026] 可选地,在所述当所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据的子步骤之后,还包括:\n[0027] 当所述第三类型标识与所述第四类型标识不相同时,则在下一个具有未使用标记的数据块block中的指定位置读取第四类型标识。\n[0028] 可选地,所述预设的第三类型标识通过以下方式生成:\n[0029] 依据所述指定格式确定对应的数据结构;\n[0030] 在所述数据结构中查找所述指定格式的编码字符串;\n[0031] 提取所述编码字符串作为预设的第三类型标识。\n[0032] 可选地,所述当前处理的区块群组block group包括区块对照表block bitmap,所述未使用标记包括表项值为零,所述针对当前处理的区块群组block group提取具有未使用标记的数据块block的子步骤包括:\n[0033] 读取区块对照表block bitmap;\n[0034] 记录所述区块对照表block bitmap中表项值为零对应的数据块block的号码;\n[0035] 采用所述号码提取对应的数据块block。\n[0036] 可选地,所述当前处理的区块群组block group包括信息节点对照表inode bitmap,在所述针对当前处理的区块群组block group提取具有未使用标记的数据块block的子步骤之后还包括:\n[0037] 当发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block;\n[0038] 采用所述号码读取所述首个数据块block中的起始数据;\n[0039] 若所述起始数据为零零,则跳过所述当前处理的区块群组block group,处理下一个区块群组block group。\n[0040] 可选地,若所述隐私数据存储在不连续号码的数据块block中时,所述区块群组block group包括信息节点表格inode table,在所述针对当前处理的区块群组block group提取具有未使用标记的数据块block的子步骤之后,还包括:\n[0041] 读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码;\n[0042] 依据所述号码从信息节点表格inode table中提取残留信息,所述残留信息中包括存储有所述隐私数据的数据块block的号码;\n[0043] 当所述具有未使用标记的数据块block具有所述号码时,执行在所述数据块block中的指定位置读取第四类型标识的步骤。\n[0044] 可选地,所述隐私数据包括存储在FAT文件系统中的第二隐私数据,所述清理请求还包括第二隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第二隐私数据的存储路径查找FAT文件系统中的隐私数据:\n[0045] 依据所述隐私数据的存储路径判断文件系统的格式;\n[0046] 当判定所述文件系统的格式为FAT文件系统时,依据所述指定格式提取预设的第一类型标识;\n[0047] 从所述FAT文件系统中提取具有未使用标记的簇;\n[0048] 在所述簇中的指定位置读取第二类型标识;\n[0049] 当所述第一类型标识与所述第二类型标识相同时,则读取所述簇中的其它数据;\n[0050] 当采用所述簇中的数据获得还原正确的结果时,判定为查找到一条隐私数据。\n[0051] 可选地,所述方法还包括:\n[0052] 当发现所述第一类型标识与所述第二类型标识不相同时,则读取下一个具有未使用标记的簇中的指定位置读取第二类型标识。\n[0053] 可选地,所述预设的第一类型标识通过以下方式生成:\n[0054] 依据所述指定格式确定对应的数据结构;\n[0055] 在所述数据结构中查找所述指定格式的编码字符串;\n[0056] 提取所述编码字符串作为预设的第一类型标识。\n[0057] 可选地,所述FAT文件系统包括文件分配表FAT和数据区,所述数据区包括簇,所述未使用标记包括表项值为零,所述从所述FAT文件系统中提取具有未使用标记的簇的子步骤包括:\n[0058] 从所述FAT文件系统中获取文件分配表FAT;\n[0059] 记录所述文件分配表FAT中表项值为零对应的簇号;\n[0060] 采用所述簇号在所述数据区中提取对应的簇。\n[0061] 可选地,在所述在所述簇中的指定位置读取第二类型标识的子步骤之后,还包括:\n[0062] 当连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值;\n[0063] 采用所述抽样阈值迭代计算当次抽样位置;\n[0064] 判断所述抽样位置上的数据是否为零;\n[0065] 若所述抽样位置上的数据为零,则返回在所述簇中的指定位置读取第二类型标识的步骤;\n[0066] 若所述抽样位置上的数据不为零,则返回读取所述簇中与所述类型标识具有相同位置的数据的子步骤。\n[0067] 可选地,所述指定格式包括图片格式。\n[0068] 可选地,所述隐私数据包括存储在存储在SQLite数据库中的第三隐私数据,所述清理进程用于采用如下方式依据所述隐私记录的存储路径查找SQLite数据库中的隐私记录:\n[0069] 依据所述隐私记录的存储路径定位到对应的SQLite数据库;\n[0070] 依据所述清理请求确定SQLite数据库中指定的数据表;所述数据表中包括数据页,所述数据页具有页头;\n[0071] 从所述页头中读取出所述数据页中的空闲区域;\n[0072] 从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0073] 采用所述一个或多个字段组合成强匹配特征;\n[0074] 在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0075] 判断所述特征数据是否为隐私记录;\n[0076] 若是,则判定为查找到一条隐私记录。\n[0077] 可选地,在判断所述特征数据是否为隐私记录的步骤之前,所述方法还包括:\n[0078] 从所述页头中读取出所述数据页中的工作区域;所述工作区域中存储有已保存数据;\n[0079] 依据所述已保存数据生成一个或多个弱匹配特征。\n[0080] 可选地,所述判断所述特征数据是否为隐私记录的步骤包括:\n[0081] 采用所述一个或多个弱匹配特征与所述特征数据进行匹配;\n[0082] 计算与所述特征数据匹配的弱匹配特征的个数,以及,弱匹配特征的总数;\n[0083] 当所述个数占所述弱匹配特征总数的比例超过预设的阈值时,判定所述特征数据为隐私记录。\n[0084] 可选地,所述依据所述字段生成强匹配特征的步骤包括:\n[0085] 分别判断所述一个或多个字段的类型;\n[0086] 依次串接所述一个或多个字段的类型成基本特征串,将所述基本特征串作为强匹配特征。\n[0087] 可选地,所述依据所述已保存数据生成一个或多个弱匹配特征的子步骤包括:\n[0088] 依据数据表的一个或多个字段的类型统计所述已保存数据中对应的一个或多个字段的值或长度;\n[0089] 若所述已保存数据中对应的一个或多个字段的值相同,或者,对应的一个或多个字段的长度相同,筛选出所述一个或多个字段;\n[0090] 将所述一个或多个字段和所述一个或多个字段的值的组合作为一个或多个弱匹配特征,和/或,将所述一个或多个字段和所述一个或多个字段的长度的组合作为一个或多个弱匹配特征。\n[0091] 可选地,所述清理进程用于采用如下方式针对所述确认清理请求完成对所述隐私记录的清理:\n[0092] 获取所述特征数据存储的位置信息,所述位置信息包括存储特征数据的数据库文件、数据页、偏移量和长度;\n[0093] 采用所述数据库文件、数据页、偏移量和长度定位到所述特征数据存储的位置;\n[0094] 将所述位置上的数据置零。\n[0095] 可选地,所述清理请求包括清理对象,所述依据所述清理请求确定SQLite数据库中对应的数据表的步骤包括:\n[0096] 采用所述清理对象确定待查找的SQLite数据库,以及,所述清理对象指定的数据表的表名;\n[0097] 依据所述表名在所述SQLite数据库中确定对应的数据表。\n[0098] 可选地,所述判断所述特征数据是否为隐私记录的步骤包括:\n[0099] 依据所述强匹配特征生成所述一个或多个字段的数据取值范围;\n[0100] 读取所述特征数据中一个或多个字段的数据取值;\n[0101] 分别采用所述数据取值与对应的数据取值范围进行比较;\n[0102] 当所述一个或多个字段的数据取值依次符合所述数据取值范围时,判定所述特征数据是隐私记录。\n[0103] 可选地,所述隐私数据包括未被彻底删掉的照片、短信、通讯录、通话记录、聊天记录、录音、视频。\n[0104] 根据本发明的另一方面,提供了一种清理隐私数据的装置,所述装置包括:\n[0105] 清理请求接收模块,适于接收用户在预定的第一界面位置上点击的清理请求;\n[0106] 清理请求发送模块,适于将所述清理请求发送给清理进程,所述清理进程依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回;\n[0107] 清理结果展现模块,适于提供清理结果的展现。\n[0108] 可选地,所述清理请求中包括隐私数据的存储路径,所述清理请求发送模块包括:\n[0109] 清理请求发送子模块,适于将所述清理请求发送给清理进程;所述清理进程用于依据所述隐私数据的存储路径查找所述隐私数据,并将查找到的隐私数据返回;\n[0110] 隐私数据展现子模块,适于提供所述第一隐私数据、第二隐私数据和第三隐私数据的展现;\n[0111] 确认清理请求接收子模块,适于接收用户在预定的第二界面位置上点击的确认清理请求,并将所述确认清理请求发送给所述清理进程,所述清理进程用于依据所述确认清理请求完成对所述隐私数据的清理,生成清理结果,并将所述清理结果返回。\n[0112] 可选地,所述隐私数据包括存储在EXT文件系统中的第一隐私数据,所述清理请求,还包括待清理隐私数据的指定格式,所述清理进程用于采用如下方式依据所述隐私数据的存储路径查找隐私数据:\n[0113] 格式判断子模块,适于依据所述隐私数据的存储路径判断文件系统的格式;\n[0114] 第三类型标识提取模块,适于在依据所述存储路径判定文件系统的格式为EXT文件系统时,依据所述指定格式提取预设的第三类型标识;\n[0115] 区块群组提取子模块,适于从所述EXT文件系统中提取出各个区块群组block group;\n[0116] 数据块提取子模块,适于针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0117] 第四类型标识读取模块,适于在所述数据块block中的指定位置读取第四类型标识;\n[0118] 其他数据读取子模块,适于在所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0119] 文件信息判断子模块,适于在所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息;\n[0120] 隐私数据判定子模块,适于在判定连续读出的一个或多个数据块block中的数据具有完整的文件信息时,则判定为查找到一条隐私数据。\n[0121] 可选地,所述装置还包括:\n[0122] 下一个第四类型标识读取子模块,适于在所述第三类型标识与所述第四类型标识不相同时,在下一个具有未使用标记的数据块block中的指定位置读取第四类型标识。\n[0123] 可选地,所述预设的第一类型标识通过以下方式生成:\n[0124] 数据结构确定子模块,适于依据所述指定格式确定对应的数据结构;\n[0125] 编码字符串查找子模块,适于在所述数据结构中查找所述指定格式的编码字符串;\n[0126] 第三类型标识提取子模块,适于提取所述编码字符串作为预设的第三类型标识。\n[0127] 可选地,所述当前处理的区块群组block group包括区块对照表block bitmap,所述未使用标记包括表项值为零,所述数据块提取模块包括:\n[0128] 区块对照表读取子模块,适于读取区块对照表block bitmap;\n[0129] 数据块block号码记录子模块,适于记录所述区块对照表block bitmap中表项值为零对应的数据块block的号码;\n[0130] 数据块block提取子模块,适于采用所述号码提取对应的数据块block。\n[0131] 可选地,所述当前处理的区块群组block group包括信息节点对照表inode bitmap,所述装置还包括:\n[0132] 号码最小的数据块block读取子模块,适于在发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block;\n[0133] 起始数据读取子模块,适于采用所述号码读取所述号码最小的数据块block中的起始数据;\n[0134] 下一个区块群组处理子模块,适于若所述起始数据为零零,则跳过所述当前处理的区块群组block group,处理下一个区块群组block group。\n[0135] 可选地,若所述隐私数据存储在不连续号码的数据块block中时,所述装置还包括:\n[0136] 信息节点inode的号码读取子模块,适于读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码;\n[0137] 残留信息提取子模块,适于依据所述号码从信息节点表格inode table中提取残留信息,所述残留信息中包括存储有所述隐私数据的数据块block的号码;\n[0138] 步骤跳转子模块,适于在所述具有未使用标记的数据块block具有所述号码,执行在所述数据块block中的指定位置读取第四类型标识的步骤。\n[0139] 可选地,所述隐私数据包括存储在FAT文件系统中的第二隐私数据,所述清理请求还包括待清理隐私数据的指定格式,所述清理进程用于采用如下方式依据所述隐私数据的存储路径查找隐私数据:\n[0140] 格式判断子模块,适于依据所述隐私数据的存储路径判断文件系统的格式;\n[0141] 第一类型标识提取模块,适于在依据所述存储路径判定文件系统的格式为FAT文件系统时,依据所述指定格式提取预设的第一类型标识;\n[0142] 簇提取子模块,适于从所述FAT文件系统中提取具有未使用标记的簇;\n[0143] 第二类型标识读取模块,适于在所述簇中的指定位置读取第二类型标识;\n[0144] 其它数据读取子模块,适于在所述第一类型标识与所述第二类型标识相同时,读取所述簇中的其它数据;\n[0145] 隐私数据判定子模块,适于在采用所述簇中的数据获得还原正确的结果时,判定为查找到一条隐私数据。\n[0146] 可选地,所述装置还包括:\n[0147] 下一个第二类型标识读取子模块,适于在发现所述第一类型标识与所述第二类型标识不相同时,读取下一个具有未使用标记的簇中的指定位置读取第二类型标识。\n[0148] 可选地,所述预设的第一类型标识通过以下方式生成:\n[0149] 数据结构确定子模块,适于依据所述指定格式确定对应的数据结构;\n[0150] 编码字符串查找子模块,适于在所述数据结构中查找所述指定格式的编码字符串;\n[0151] 第一类型标识提取子模块,适于提取所述编码字符串作为预设的第一类型标识。\n[0152] 可选地,所述FAT文件系统包括文件分配表FAT和数据区,所述数据区包括簇,所述未使用标记包括表项值为零,所述簇提取子模块包括:\n[0153] 文件分配表FAT获取子模块,适于从所述FAT文件系统中获取文件分配表FAT;\n[0154] 簇号记录子模块,适于记录所述文件分配表FAT中表项值为零对应的簇号;\n[0155] 簇提取子模块,适于采用所述簇号在所述数据区中提取对应的簇。\n[0156] 可选地,所述装置还包括:\n[0157] 抽样阈值确定子模块,适于在连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值;\n[0158] 当次抽样位置计算子模块,适于采用所述抽样阈值迭代计算当次抽样位置;\n[0159] 数据判断子模块,适于判断所述抽样位置上的数据是否为零;\n[0160] 数据为零判定子模块,适于在判定所述抽样位置上的数据为零时,返回在所述簇中的指定位置读取第二类型标识的步骤;\n[0161] 数据不为零判定子模块,适于在判定所述抽样位置上的数据不为零时,返回读取所述簇中与所述类型标识具有相同位置的数据的步骤。\n[0162] 可选地,所述指定格式包括图片格式。\n[0163] 可选地,所述隐私数据包括存储在存储在SQLite数据库中的第三隐私数据,所述清理进程用于采用如下方式依据所述隐私记录的存储路径查找隐私记录:\n[0164] SQLite数据库定位子模块,适于依据所述隐私记录的存储路径定位到对应的SQLite数据库;\n[0165] 数据表确定子模块,适于依据所述清理请求确定SQLite数据库中指定的数据表;\n所述数据表中包括数据页,所述数据页具有页头;\n[0166] 空闲区域读取子模块,适于从所述页头中读取出所述数据页中的空闲区域;\n[0167] 数据表解析子模块,适于从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0168] 强匹配特征生成子模块,适于采用所述一个或多个字段组合成强匹配特征;\n[0169] 特征数据查找子模块,适于在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0170] 隐私记录判断子模块,适于判断所述特征数据是否为隐私记录;\n[0171] 隐私记录判定子模块适于在判定所述特征数据为隐私记录时,判定为查找到一条隐私记录。\n[0172] 可选地,所述装置还包括:\n[0173] 工作区域读取子模块,适于从所述页头中读取出所述数据页中的工作区域;所述工作区域中存储有已保存数据;\n[0174] 弱匹配特征生子成模块,适于依据所述已保存数据生成多个弱匹配特征。\n[0175] 可选地,所述隐私记录判断模块包括:\n[0176] 特征数据匹配子模块,适于采用所述多个弱匹配特征与所述特征数据进行匹配;\n[0177] 匹配个数计算子模块,适于计算与所述特征数据匹配的弱匹配特征的个数,以及,弱匹配特征的总数;\n[0178] 隐私记录判定子模块,适于在所述个数占所述弱匹配特征总数的比例超过预设的阈值时,判定所述特征数据为隐私记录。\n[0179] 可选地,所述强匹配特征生成子模块包括:\n[0180] 类型判断子模块,适于分别判断所述一个或多个字段的类型;\n[0181] 强匹配特征确定子模块,适于依次串接所述一个或多个字段的类型成基本特征串,将所述基本特征串作为强匹配特征。\n[0182] 可选地,所述弱匹配特征生成子模块包括:\n[0183] 已保存数据统计子模块,适于依据数据表的一个或多个字段的类型统计所述已保存数据中对应的一个或多个字段的值或长度;\n[0184] 字段筛选子模块;若所述已保存数据中对应的一个或多个字段的值相同,或者,对应的一个或多个字段的长度相同,筛选出所述一个或多个字段;\n[0185] 弱匹配特征确定子模块,适于将所述一个或多个字段和所述一个或多个字段的值的组合作为一个或多个弱匹配特征,和/或,将所述一个或多个字段和所述一个或多个字段的长度的组合作为一个或多个弱匹配特征。\n[0186] 可选地,所述清理进程用于采用如下方式针对所述确认清理请求完成对所述隐私记录的清理:\n[0187] 位置信息获取子模块,适于获取所述特征数据存储的位置信息,所述位置信息包括存储特征数据的数据库文件、数据页、偏移量和长度;\n[0188] 特征数据定位子模块,适于采用所述数据库文件、数据页、偏移量和长度定位到所述特征数据存储的位置;\n[0189] 数据置零子模块,适于将所述位置上的数据置零。\n[0190] 可选地,所述清理请求包括清理对象,所述数据表确定模块包括:\n[0191] 表名确定子模块,适于采用所述清理对象确定待查找的SQLite数据库,以及,所述清理对象指定的数据表的表名;\n[0192] 数据表确定子模块,适于依据所述表名在所述SQLite数据库中确定对应的数据表。\n[0193] 可选地,所述隐私记录判断模块包括:\n[0194] 数据取值范围生成子模块,用于依据所述强匹配特征生成所述一个或多个字段的数据取值范围;\n[0195] 数据取值读取子模块,用于读取所述特征数据中一个或多个字段的数据取值;\n[0196] 比较子模块,用于分别采用所述一个或多个字段的数据取值与对应的数据取值范围进行比较;\n[0197] 隐私记录确定子模块,当所述一个或多个字段的数据取值依次符合所述数据取值范围时,判定所述特征数据是隐私记录。\n[0198] 可选地,所述隐私数据包括未被彻底删掉的照片、短信、通讯录、通话记录、聊天记录、录音、视频。\n[0199] 根据本发明的空闲区域可以定位出所有可能存在隐私记录的位置,采用强匹配特征在空闲区域匹配出特征数据,可以将全部的隐私记录和疑似的隐私记录匹配出来,再通过判断特征数据将疑似的隐私记录过滤,由此解决了隐私记录查找的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0200] 进一步的,根据本发明的弱匹配特征可以对特征数据进行进一步判断,通过计算特征数据与弱匹配特征匹配的比例推断特征数据是否为隐私记录,由此解决了过滤疑似的隐私记录速度慢的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0201] 更进一步的,根据本发明的在空闲区域中删除特征数据可以将隐私记录彻底删除,由此解决了隐私记录不能彻底删除的问题,取得了减少信息泄漏,提高信息安全性的有益效果。\n[0202] 根据本发明的从所述FAT文件系统中提取具有未使用标记的簇,可以定位出所有可能具有指定格式的隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第一类型标识,与较少数据的第二类型标识对比,将隐私数据匹配出来,从而清理隐私数据,由此解决了清理隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0203] 进一步地,根据本发明的当发现所述第一类型标识与所述第二类型标识不相同时,则读取下一个具有未使用标记的簇中的指定位置读取第二类型标识,可以快速的从所有可能具有指定格式的隐私数据的存储位置中,筛选掉不具有指定格式的隐私数据的存储位置。由此解决了清理隐私数据需要扫描具有未使用标记的簇中所有数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0204] 更进一步地,根据本发明的当连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值,可以跳跃地扫描完整个存储介质,由此解决了在新的存储介质中清理隐私数据时,需要扫描所有具有未使用标记的簇的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0205] 根据本发明的从所述EXT文件系统中提取具有未使用标记的数据块block,可以定位出所有可能具有指定格式的隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第一类型标识,与较少数据的第二类型标识对比,将隐私数据匹配出来,从而清理隐私数据,由此解决了清理隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0206] 进一步地,根据本发明的当发现所述第一类型标识与所述第二类型标识不相同时,则读取下一个具有未使用标记的数据块block中的指定位置读取第二类型标识,可以快速的从所有可能具有指定格式的隐私数据的存储位置中,筛选掉不具有指定格式的隐私数据的存储位置。由此解决了清理隐私数据需要扫描具有未使用标记的数据块block中所有数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0207] 更进一步地,根据本发明的当发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block,可以快速跳过从未使用过的区块群组,由此解决了在未使用过的区块群组中清理隐私数据时,需要扫描所有具有未使用标记的数据块block的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0208] 更进一步地,根据本发明的读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码,依据所述号码从信息节点表格inode table中提取残留信息,由此解决了清理存储在不连续号码的数据块block上的隐私数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高,使清理更加完全的有益效果。\n[0209] 更进一步地,根据本发明的第一类型标识的生成方式,在已知指定格式的数据结构的前提下,可以对所有指定格式的数据进行清理,由此解决了清理隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0210] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。\n附图说明\n[0211] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:\n[0212] 图1示出了根据本发明一个实施例的一种清理隐私数据的方法实施例的步骤流程图;\n[0213] 图2示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第一隐私数据实施例1的步骤流程图;\n[0214] 图3示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第一隐私数据实施例2的步骤流程图;\n[0215] 图4示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第二隐私数据实施例的步骤流程图;\n[0216] 图5示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第三隐私数据实施例1的步骤流程图;\n[0217] 图6示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第三隐私数据实施例2的步骤流程图;以及\n[0218] 图7示出了根据本发明一个实施例的一种清理隐私数据的装置实施例的结构框图。\n具体实施方式\n[0219] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。\n[0220] 参照图1,示出了根据本发明一个实施例的一种清理隐私数据的方法实施例的步骤流程图,所述隐私数据包括存储在EXT文件系统中的第一隐私数据,存储在FAT文件系统中的第二隐私数据,以及存储在SQLite数据库中的第三隐私数据,具体可以包括如下步骤:\n[0221] 步骤101,接收用户在预定的第一界面位置上点击的清理请求;\n[0222] 在具体应用中,预定的第一界面位置可以是针对清理隐私数据而设置的按钮的位置。\n[0223] 步骤102,将所述清理请求发送给清理进程,所述清理进程依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回;\n[0224] 在具体实现中,所述隐私数据包括未被彻底删掉的照片、短信、通讯录、通话记录、聊天记录、录音、视频。\n[0225] 在本发明的一种优选示例中,所述清理请求中包括隐私数据的存储路径,所述将所述清理请求发送给清理进程,所述步骤102包括:\n[0226] 子步骤A1,将所述清理请求发送给清理进程;所述清理进程用于依据所述隐私数据的存储路径查找所述隐私数据,并将查找到的隐私数据返回;\n[0227] 在实际应用中,清理进程可以依据清理请求执行相应的清理操作,清理操作可以包括查找第一隐私数据,以及读写数据等。\n[0228] 由于在手机中不同格式的文件系统所具有的存储路径不同,例如,手机机身的文件系统通常可以为EXT文件系统,EXT文件系统可以包括EXT2文件系统、EXT3文件系统、EXT4文件系统等,EXT文件系统在手机中的存储路径通常为手机根目录,因此,当手机中具有的存储路径包括存储路径时,即可以确定文件系统的格式。\n[0229] 接收到清理请求后,可以将清理请求发送给清理进程,清理进程依据清理请求中包括的存储路径,确定出文件系统的格式,当存储路径与手机根目录匹配时,表明文件系统的格式为EXT文件系统,即将要清理的是手机机身存储空间中的第一隐私数据,调用EXT文件系统的接口查找第一隐私数据。\n[0230] 在本发明实施例的一种优选示例中,所述隐私数据包括存储在EXT文件系统中的第一隐私数据,所述清理请求还包括待清理第一隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第一隐私数据的存储路径查找第一隐私数据:\n[0231] 子步骤S11,依据所述第一隐私数据的存储路径判断文件系统的格式;\n[0232] 子步骤S12,当判定所述文件系统的格式为EXT文件系统时,则依据所述指定格式提取预设的第三类型标识;\n[0233] 子步骤S13,从所述EXT文件系统中提取出各个区块群组block group;\n[0234] 子步骤S14,针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0235] 子步骤S15,在所述数据块block中的指定位置读取第四类型标识;\n[0236] 子步骤S16,当所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0237] 子步骤S17,当所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息;\n[0238] 子步骤S18,若是,则判定为查找到一条第一隐私数据。\n[0239] 作为本发明具体应用的一种示例,第一隐私数据可以包括在本地存储介质中的一条或多条已删除数据,且每一条已删除数据中的部分或全部数据未被新的数据覆盖。具体而言,第一隐私数据的对象可以包括照片、短信、通讯录、手机应用、上网记录、软件隐私记录等等,软件隐私记录可以包括例如:聊天记录,图片缓存,语音消息记录等等。\n[0240] 第三类型标识可以是指定格式的编码字符串,编码字符串可以是该指定格式的部分起始字段,采用第三类型标识与具有未使用标记的数据块block的头进行匹配,当匹配到编码字符串与该头相同时,读取该头对应的整个数据块block中的其他数据,若其他数据中未读取到结束标记,则读取下一个具有与编码字符串相同的头的数据块block中的其他数据,直到读取到结束标记,而后,判断该连续读出的一个或多个块中的数据是否具有完整的文件信息,即是否能组合成完整的文件,若是,则判定找到一条第一隐私数据,否则,判定该一个或多个块中的数据不是一条第一隐私数据。\n[0241] 当查找到第一隐私数据后,清理进程将查找到的第一隐私数据返回。\n[0242] 在实际应用中,清理进程可以依据清理请求执行相应的清理操作,清理操作可以包括查找第二隐私数据,以及读写数据等。\n[0243] 由于在手机中不同格式的文件系统所具有的存储路径不同,例如,手机外置存储卡的文件系统通常可以为FAT文件系统,FAT文件系统可以包括FAT12文件系统、FAT16文件系统、FAT32文件系统等,FAT文件系统在手机外置存储卡的存储路径通常为mnt/sdcard/external-sd,因此,当手机中具有的存储路径与mnt/sdcard/external-sd此存储路径匹配时,即可以确定文件系统的格式为FAT文件系统。\n[0244] 接收到清理请求后,可以将清理请求发送给清理进程,清理进程依据清理请求中包括的存储路径,确定出文件系统的格式,当存储路径与手机外置存储卡的存储路径匹配时,表明文件系统的格式为FAT文件系统,即将要清理的是手机外置存储卡中的第二隐私数据,调用FAT文件系统的接口查找第二隐私数据。\n[0245] 在本发明实施例的一种优选示例中,所述隐私数据包括存储在FAT文件系统中的第二隐私数据,所述清理请求还包括待清理第二隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第二隐私数据的存储路径查找第二隐私数据:\n[0246] 子步骤S21,依据所述第二隐私数据的存储路径判断文件系统的格式;\n[0247] 子步骤S22,当判定所述文件系统的格式为FAT文件系统时,依据所述指定格式提取预设的第一类型标识;\n[0248] 子步骤S23,从所述FAT文件系统中提取具有未使用标记的簇;\n[0249] 子步骤S24,在所述簇中的指定位置读取第二类型标识;\n[0250] 子步骤S25,当所述第一类型标识与所述第二类型标识相同时,则读取所述簇中的其它数据;\n[0251] 子步骤S26,当采用所述簇中的数据获得还原正确的结果时,判定为查找到一条第二隐私数据\n[0252] 作为本发明具体应用的一种示例,第二隐私数据可以包括在本地存储介质中的一条或多条已删除数据,且每一条已删除数据中的部分或全部数据未被新的数据覆盖。具体而言,第一隐私数据的对象可以包括照片、短信、通讯录、手机应用、上网记录、软件隐私记录等等,软件隐私记录可以包括例如:聊天记录,图片缓存,语音消息记录等等。\n[0253] 第一类型标识可以是指定格式的编码字符串,编码字符串可以是该指定格式的部分起始字段,采用第一类型标识与具有未使用标记的簇的头进行匹配,当匹配到编码字符串与该头相同时,读取该头对应的整个簇中的其他数据,若其他数据中未读取到结束标记,则读取下一个具有与编码字符串相同的头的簇中的其他数据,直到读取到结束标记,而后,判断该连续读出的一个或多个块中的数据是否具有完整的文件信息,若簇中的数据丢失,或者,被破坏,则簇中的数据不能被还原为一条完整的数据,获得还原错误的结果,判定簇中的数据不为已删除记录,若簇中的数据没有丢失,或者,没有被破坏,则簇中的数据可以被还原为一条完整的数据,获得还原正确的结果,判定簇中的数据为一条第二隐私数据。即判断是否可以采用所述簇中的数据获得还原正确的结果,若是,则判定找到一条第二隐私数据,否则,判定该一个或多个块中的数据不是一条第二隐私数据。\n[0254] 当查找到第二隐私数据后,清理进程将查找到的第二隐私数据返回。\n[0255] 在实际应用中,清理进程可以依据清理请求执行相应的清理操作,清理操作可以包括查找第三隐私数据,以及读写数据等。\n[0256] 接收到清理请求后,可以将清理请求发送给清理进程,清理进程依据清理请求中包括的存储路径,确定出SQLite数据库的文件的存储位置,从而读取SQLite数据库的文件将SQLite数据库中的第三隐私数据查找出来。\n[0257] 在本发明实施例的一种优选示例中,所述隐私数据包括存储在存储在SQLite数据库中的第三隐私数据,所述清理进程用于采用如下方式依据所述第三隐私数据的存储路径查找SQLite数据库中第三隐私数据:\n[0258] 子步骤S31,依据所述第三隐私数据的存储路径定位到对应的SQLite数据库;\n[0259] 子步骤S32,依据所述清理请求确定SQLite数据库中指定的数据表;所述数据表中包括数据页,所述数据页具有页头;\n[0260] 子步骤S33,从所述页头中读取出所述数据页中的空闲区域;\n[0261] 子步骤S34,从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0262] 子步骤S35,采用所述一个或多个字段组合成强匹配特征;\n[0263] 子步骤S36,在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0264] 子步骤S37,判断所述特征数据是否为第三隐私数据;\n[0265] 子步骤S38,若所述特征数据是第三隐私数据,则判定为查找到一条第三隐私数据。\n[0266] 作为本发明具体应用的一种示例,第三隐私数据可以包括在存储在SQLite数据库中的一条或多条已删除记录,且每一条已删除记录中的部分或全部数据未被新记录的数据覆盖。具体而言,第三隐私数据的对象可以包括短信、通讯录、通话记录、上网记录、软件第三隐私数据等等,软件第三隐私数据可以包括例如:聊天记录,图片缓存,语音消息记录等等。\n[0267] 强匹配特征可以是数据表的一个或多个字段组合成的基本特征串,该数据表中的任何一条记录,包括第三隐私数据,都必然具有与基本特征串匹配的字段,因此,可以在SQLite数据库中查找到空闲区域后,可以采用强匹配特征在空闲区域中查找特征数据,判断特征数据为第三隐私数据时,确定查找到一条第三隐私数据。\n[0268] 当查找到第三隐私数据后,清理进程将查找到的第三隐私数据返回。\n[0269] 子步骤A2,提供所述第一隐私数据、第二隐私数据和第三隐私数据的展现;\n[0270] 接收到清理进程发送的隐私数据后,将隐私数据展示在界面中,以供作出选择。\n[0271] 子步骤A3,接收用户在预定的第二界面位置上点击的确认清理请求,并将所述确认清理请求发送给所述清理进程,所述清理进程用于依据所述确认清理请求完成对所述隐私数据的清理,生成清理结果,并将所述清理结果返回;\n[0272] 在具体实现中,预定的第二界面位置可以包括针对第一隐私数据、第二隐私数据、第三隐私数据的复选框,和/或,作为确认清理的第二按钮的位置。\n[0273] 当选定要清理的隐私数据,和/或,触摸第二按钮时,即在预定的第二界面位置上点击确认清理请求,可以接收该确认清理请求。\n[0274] 接收到确认清理请求后,可以将该确认清理请求发送给清理进程,清理进程可以依据该确认清理请求获得存储该第一隐私数据的数据块block的号码等存储信息,将该号码的数据块block上的数据置0,和/或,清理进程可以依据该确认清理请求获得存储该第二隐私数据的簇的位置信息,将该位置信息的簇上的数据置0,和/或,清理进程可以依据该确认清理请求获得存储该第三隐私记录的位置信息,将该位置信息上相应位置的数据置0,即完成第一隐私数据,和/或,第二隐私数据,和/或,第三隐私数据清理。清理进程可以生成清理完成的结果,并将清理完成的结果发送给。\n[0275] 在本发明实施例的一种优选示例中,所述清理进程用于采用如下方式针对所述确认清理请求完成对所述第三隐私数据的清理:\n[0276] 子步骤S41,获取所述特征数据存储的位置信息,所述位置信息包括存储特征数据的数据库文件、数据页、偏移量和长度;\n[0277] 作为本发明具体应用的一种示例,当确定与强匹配特征匹配的特征数据为第三隐私数据时,记录存储该特征数据的数据库文件的名称、所在数据库中数据页的编号、所在数据页中的偏移量和长度。\n[0278] 子步骤S42,采用所述数据库文件、数据页、偏移量和长度定位到所述特征数据存储的位置;\n[0279] 采用数据库文件的名称查找到对应的数据库文件,再根据数据页的编号在该数据库文件中查找出相应的数据页,最后采用偏移量和长度在该数据页中定位出特征数据存储的位置。\n[0280] 子步骤S43,将所述位置上的数据置零。\n[0281] 以偏移量作为特征数据存储位置的起始位置,从起始位置上开始写零,直到零的数量与长度值相等时结束。\n[0282] 根据本发明的在空闲区域中删除特征数据可以将第三隐私数据彻底删除,由此解决了第三隐私数据不能彻底删除的问题,取得了减少信息泄漏,提高信息安全性的有益效果。\n[0283] 步骤103,提供清理结果的展现。\n[0284] 接收到清理进程发送的清理完成的结果后,将该结果展示在界面中。\n[0285] 根据本发明的从所述EXT文件系统中提取具有未使用标记的数据块block,可以定位出所有可能具有指定格式的隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第三类型标识,与较少数据的第四类型标识对比,将隐私数据匹配出来,从而清理隐私数据,由此解决了清理隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0286] 根据本发明的从所述FAT文件系统中提取具有未使用标记的簇,可以定位出所有可能具有指定格式的隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第一类型标识,与较少数据的第二类型标识对比,将隐私数据匹配出来,从而清理隐私数据,由此解决了清理隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0287] 根据本发明的空闲区域可以定位出所有可能存在隐私记录的位置,采用强匹配特征在空闲区域匹配出特征数据,可以将全部的隐私记录和疑似的隐私记录匹配出来,再通过判断特征数据将疑似的隐私记录过滤,由此解决了隐私记录查找的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0288] 为使本领域技术人员更好地理解本发明步骤102,以下通过实施例2、实施例3、实施例4、实施例5、实施例6分别对本发明实施例具体查找第一隐私数据、第二隐私数据、第三隐私数据的步骤作进一步说明。\n[0289] 参照图2,示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第一隐私数据实施例1的步骤流程图,所述清理请求包括第一隐私数据的指定格式,具体可以包括如下步骤:\n[0290] 步骤201,依据所述第一隐私数据的存储路径判断文件系统的格式;\n[0291] 在具体实现中,由于在手机中不同格式的文件系统所具有的存储路径不同,文件系统的格式可以根据存储路径唯一确定。\n[0292] 例如,当存储路径为手机根目录时,可以判定文件系统的格式为EXT文件系统;当手机中包括存储路径为mnt/sdcard/external-sd的文件夹时,可以判定文件系统的格式为FAT文件系统。\n[0293] 步骤202,依据所述存储路径确定文件系统的格式为EXT文件系统时,依据所述指定格式提取预设的第三类型标识;\n[0294] 在实际应用中,指定格式可以是指为了存储数据而对数据使用的特殊编码方式。\n[0295] 清理请求中可以包括请求查找并删除指定格式的待清理第一隐私数据。当接收到的清理请求携带有待清理第一隐私数据的指定格式时,将对指定格式的待清理第一隐私数据进行查找并删除。\n[0296] 需要说明的是,同一格式的数据可以在数据的头部采用相同的编码字符串,由于第一隐私数据本身还保留在存储介质中,因此,各条第一隐私数据的头部中还可以保留有各自格式的编码字符串。\n[0297] 在本发明实施例的一种优选示例中,所述待清理第一隐私数据的指定格式包括图片格式。\n[0298] 在实际应用中,待清理第一隐私数据的指定格式至少可以包括图片格式。图片格式的第一隐私数据较为常见,因此,可以确定待清理第一隐私数据的指定格式为图片格式。\n[0299] 需要说明的是,本发明不仅可以清理图片格式的第一隐私数据,还可以清理文本格式、压缩包格式等等指定格式的第一隐私数据,可以依据指定格式提取出预设的第一类型标识即可,本领域技术人员可以根据实际需要设置清理的第一隐私数据的指定格式。\n[0300] 在实际应用中,每种格式的编码字符串可以是固定的,并且,格式的种类不同,编码字符串也就不同,因此,当确定待清理第一隐私数据的指定格式时,该指定格式的编码字符串也即确定,可以采用该编码字符串作为该指定格式预设的第一类型标识。\n[0301] 在本发明实施例的一种优选示例中,所述预设的第一类型标识可以通过以下方式生成:\n[0302] 子步骤S51,依据所述指定格式确定对应的数据结构;\n[0303] 作为本发明具体应用的一种示例,各种格式的数据结构可以是预先定义好的,确定了指定格式的名称,即可以找到对应的数据结构。\n[0304] 子步骤S52,在所述数据结构中查找所述指定格式的编码字符串;\n[0305] 通常,指定格式的编码字符串可以在所述数据结构中的文件头字段内,查找到数据结构中的文件头,即可以找到指定格式的编码字符串。\n[0306] 子步骤S53,提取所述编码字符串作为预设的第三类型标识。\n[0307] 在具体应用中,找到指定格式的编码字符串后,可以提取该编码字符串作为预设的第三类型标识。\n[0308] 根据本发明的第三类型标识的生成方式,在已知指定格式的数据结构的前提下,可以对所有指定格式的数据进行清理,由此解决了清理第一隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0309] 步骤203,从所述EXT文件系统中提取出各个区块群组block group;\n[0310] 在具体实现中,文件系统的运行与操作系统的文件数据有关,较新的操作系统的文件数据除了文件实际内容外,通常含有非常多的属性,例如Linux操作系统的文件权限(只读、读写等)与文件属性(拥有者、群组、时间参数等),EXT文件系统通常会将这两部份的数据分别存放在不同的区块,权限与属性放置到inode(information node,信息节点)中,至于实际数据则放置到data block(数据区块)中。另外,还有一个超级区块(superblock)会记录整个文件系统的整体信息,包括inode与block(数据块)的总量、使用量、剩余量等。\n[0311] 由于每个inode与block都有号码,而每个文件都会占用一个inode,inode内则有文件数据放置的block号码。因此,如果能够找到该文件的inode,那么,就可以知道这个文件所放置数据的block号码,也就能够读出该文件的实际数据了。当文件系统高达数GB时,那么将所有的inode与block通通放置在一起将是很不智的决定,因为inode与block的数量太庞大,不容易管理。\n[0312] 为此,EXT文件系统在格式化的时候基本上是区分为多个区块群组(block group)的,每个区块群组都有独立的inode/block/superblock系统。\n[0313] Filesystem Description(文件系统描述说明)可以描述每个block group的开始与结束的block号码,以及说明该block group中的superblock,block bitmap(区块对照表),inode bitmap(信息节点对照表),inode table(信息节点表格),data block的具体位置,具体位置可以分别两个号码的block之间,也可以在某个号码的block上。\n[0314] 通常,Filesystem Description可以在第1号block中。\n[0315] 步骤204,针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0316] 在实际应用中,可以分别对各个区块群组block group进行处理,由于文件的存储需要用到block,每个block内最多只能够放置一个文件的数据,因此,EXT文件系统中需要对空的block添加未使用标记,以供新的文件存储时使用。同样的,当某些文件删除时,这些文件原本占用的block号码就会释放出来,此时该block号码的标记将修改为未使用。\n[0317] 因此,可以将具有未使用标记的数据块提取出来。\n[0318] 在本发明实施例的一种优选示例中,所述当前处理的区块群组block group包括区块对照表block bitmap,所述未使用标记包括表项值为零,所述步骤204具体可以包括以下子步骤:\n[0319] 子步骤S61,读取区块对照表block bitmap;\n[0320] 作为本发明具体应用的一种示例,区块对照表block bitmap的位置可以在文件系统描述说明中读取出来,区块对照表block bitmap中记录了该区块中block的使用情况,已使用的block标记为1,未使用的block标记为0。\n[0321] 子步骤S62,记录所述区块对照表block bitmap中表项值为零对应的数据块block的号码;\n[0322] 在实际应用中,区块对照表block bitmap可以采用表格的形式记录各个block的使用情况,表项中可以分别记录各个block的号码,以及该号码对应的block的使用情况,用\n0或1标记使用情况,0可以作为未使用标记表示block未使用,1可以作为已使用标记表示block已使用。\n[0323] 将表项值为0对应的数据块block的号码记录下来。\n[0324] 子步骤S63,采用所述号码提取对应的数据块block。\n[0325] 在具体实现中,可以采用记录下来的数据块block的号码,定位到data block中相应的数据块block上,将该数据块block提取出来。\n[0326] 在本发明实施例的一种优选示例中,所述当前处理的区块群组block group包括信息节点对照表inode bitmap,在所述步骤104之后还可以包括以下步骤:\n[0327] 当发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block的号码;\n[0328] 采用所述号码读取所述号码最小的数据块block中的起始数据;\n[0329] 若所述起始数据为零零,则跳过所述当前处理的区块群组block group,处理下一个区块群组block group。\n[0330] 作为本发明实施例具体应用的一种示例,EXT文件系统的存储可以是按照区块群组的顺序进行的,可以优先使用排列在前的区块群组进行存储,当该区块群组的存储空间用尽时才使用下一个区块群组,未使用过的区块群组中的数据块都具有未使用标记,因此,若可以判断出当前处理的区块群组未使用过,则可以跳过此当前处理的区块群组,以减少查找第一隐私数据的时间。\n[0331] 具体地,当检测出区块对照表block bitmap中各个表项值均为零,即当前处理的区块群组中数据块block均具有未使用标记时,有两种情况可以对应这种现象,一种是该区块群组从未使用过,一种是该区块群组使用过,但是存储的数据被全部删除了。\n[0332] 此时,可以读取信息节点对照表inode bitmap,若信息节点对照表inode bitmap中各个表项值为零,即inode也均具有未使用标记,则可以更加确定区块群组或者是从未使用过,或者是使用过,但是存储的数据被全部删除了。\n[0333] 读取区块对照表block bitmap中号码最小的数据块block,若该数据块block起始数据为00,则可以判定该区块群组从未使用过,跳过该区块群组,直接处理下一个区块群组。\n[0334] 根据本发明的当发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block,可以快速跳过从未使用过的区块群组,由此解决了在未使用过的区块群组中清理第一隐私数据时,需要扫描所有具有未使用标记的数据块block的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0335] 步骤205,在所述数据块block中的指定位置读取第四类型标识;\n[0336] 在实际应用中,指定位置可以是与预设的第三类型标识在数据结构中的位置相同。即指定位置在数据块block的起始位置与预设的第三类型标识在数据结构中的起始位置相同,指定位置在数据块block的结束位置与预设的第三类型标识在数据结构中的结束位置相同。\n[0337] 具有未使用标记的数据块block提取出来后,可以从数据块block中起始位置开始读取与预设的第三类型标识具有相同的长度的数据,作为第二类型标识。\n[0338] 步骤206,当所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0339] 在实际应用中,读取出第四类型标识后,将第四类型标识与预设的第三类型标识对比,若第四类型标识与第三类型标识相同,则表明该数据块block中可能具有第一隐私数据,并且,该数据块block中第一隐私数据的格式与指定格式相同,将该数据块block中的其它数据读取出来。\n[0340] 在本发明实施例的一种优选示例中,当所述第三类型标识与所述第四类型标识不相同时,则在下一个具有未使用标记的数据块block中的指定位置读取第四类型标识。\n[0341] 在具体实现中,读取出的第四类型标识与预设的第三类型标识不相同可以包括两种情况,第一种情况是读取出的第四类型标识为零,表明该数据块block中没有第一隐私数据;第二种情况是读取出的第四类型标识不为零,表明该数据块block中具有与指定格式不相同的其他格式的数据。因此,可以在发现第三类型标识与第四类型标识不相同时,可以直接跳过该数据块block,读取下一个具有未使用标记的数据块block,在该数据块block中的指定位置读取第四类型标识。\n[0342] 根据本发明的当发现所述第三类型标识与所述第四类型标识不相同时,则读取下一个具有未使用标记的数据块block中的指定位置读取第四类型标识,可以快速的从所有可能具有指定格式的第一隐私数据的存储位置中,筛选掉不具有指定格式的第一隐私数据的存储位置。由此解决了清理第一隐私数据需要扫描具有未使用标记的数据块block中所有数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0343] 步骤207,当所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息。\n[0344] 作为本发明具体应用的一种示例,当第一隐私数据过大时,会占用一个或多个block,此时,需要判断该一个或多个block是否为一条第一隐私数据存储时所占用的一个或多个block,若是一条第一隐私数据存储时所占用的一个或多个block,则连续读出该一个或多个数据块block中的数据具有完整的文件信息,可以判定为第一隐私数据,否则判定不为第一隐私数据。\n[0345] 步骤208,若连续读出的一个或多个数据块block中的数据具有完整的文件信息,则判定为查找到一条第一隐私数据。\n[0346] 在实际应用中,当一个或多个数据块block中的数据可以组合成完整的文件信息时,表明该一个或多个数据块block中的数据为一条第一隐私数据的完整内容,判定查找到的一个或多个数据块block中的数据为一条第一隐私数据。\n[0347] 根据本发明的从所述EXT文件系统中提取具有未使用标记的数据块block,可以定位出所有可能具有指定格式的第一隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第三类型标识,与较少数据的第四类型标识对比,将第一隐私数据匹配出来,从而清理第一隐私数据,由此解决了清理第一隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0348] 参照图3,示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第一隐私数据实施例2的步骤流程图,所述清理请求包括第一隐私数据的指定格式,所述第一隐私数据存储在不连续号码的数据块block中,具体可以包括如下步骤:\n[0349] 步骤301,依据所述第一隐私数据的存储路径判断文件系统的格式;\n[0350] 步骤302,依据所述存储路径确定文件系统的格式为EXT文件系统时,依据所述指定格式提取预设的第三类型标识;\n[0351] 步骤303,从所述EXT文件系统中提取出各个区块群组block group;所述区块群组block group包括信息节点对照表inode bitmap、信息节点表格inode table;\n[0352] 步骤304,针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0353] 步骤305,读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码;\n[0354] 在具体实现中,inode bitmap用于记录已使用和未使用的inode的号码,未使用的inode的号码可以表示该号码的inode从未使用过,或者该号码的inode使用过,而该inode指示的数据文件已删除。\n[0355] 表项值为0可以作为未使用标记表示该号码的inode未使用,1可以作为已使用标记表示该号码的inode已使用。\n[0356] 将表项值为0对应的信息节点inode的号码读取出来。\n[0357] 步骤306,依据所述号码在信息节点表格inode table中提取残留信息,所述残留信息中包括存储有所述第一隐私数据的数据块block的号码;\n[0358] 在实际应用中,残留信息可以指当有数据从EXT文件系统中删除,inode的使用标记由已使用修改为未使用时,残留在inode table中的信息。inode table可以用于记录inode的内容,包括记录第一隐私数据的属性以及该第一隐私数据实际存放的block的号码。\n[0359] 当第一隐私数据存储在不连续号码的数据块block中时,inode table中可以记录存储该第一隐私数据的各个数据块的号码,和/或,记录某一段连续存储该第一隐私数据的起始数据块和终止数据块。\n[0360] 当第一隐私数据存储在连续号码的数据块block中时,inode table中可以记录存储该第一隐私数据的起始数据块和终止数据块。\n[0361] 步骤307,当所述具有未使用标记的数据块block具有所述号码时,执行步骤308。\n[0362] 作为本发明具体应用的一种示例,当具有未使用标记的数据块具有残留信息中的号码时,则表明该一个或多个数据块可能包括存储在不连续号码的数据块block中,并且该不连续号码的数据块都已找到。\n[0363] 根据本发明的读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码,依据所述号码从信息节点表格inode table中提取残留信息,由此解决了清理存储在不连续号码的数据块block上的第一隐私数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高,使清理更加完全的有益效果。\n[0364] 步骤308,在所述数据块block中的指定位置读取第四类型标识;\n[0365] 步骤309,当所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0366] 步骤310,当所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息;\n[0367] 步骤311,若所述数据具有完整的文件信息,则判定为查找到一条第一隐私数据。\n[0368] 本实施例与上述方法实施例2的区别之处在于,本实施例可以清理存储在不连续号码的数据块block上的第一隐私数据,提高清理的准确率,以及,使清理更加完全。\n[0369] 根据本发明的从所述EXT文件系统中提取具有未使用标记的数据块block,可以定位出所有可能具有指定格式的第一隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第三类型标识,与较少数据的第四类型标识对比,将第一隐私数据匹配出来,从而清理第一隐私数据,由此解决了清理第一隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0370] 参照图4,示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第二隐私数据实施例的步骤流程图,所述清理请求包括第二隐私数据的指定格式具体可以包括如下步骤:\n[0371] 步骤401,依据所述第二隐私数据的存储路径判断文件系统的格式;\n[0372] 在具体实现中,由于在手机中不同格式的文件系统所具有的存储路径不同,文件系统的格式可以根据存储路径唯一确定。\n[0373] 例如,当存储路径为手机根目录时,可以判定文件系统的格式为EXT文件系统;当手机中包括存储路径为mnt/sdcard/external-sd的文件夹时,可以判定文件系统的格式为FAT文件系统。\n[0374] 步骤402,当判定所述文件系统的格式为FAT文件系统时,依据所述指定格式提取预设的第一类型标识;\n[0375] 在实际应用中,指定格式可以是指为了存储数据而对数据使用的特殊编码方式。\n[0376] 清理请求中可以包括请求查找并删除指定格式的待清理第二隐私数据。当接收到的清理请求携带有待清理第二隐私数据的指定格式时,将对指定格式的待清理第二隐私数据进行查找并删除。\n[0377] 需要说明的是,同一格式的数据可以在数据的头部采用相同的编码字符串,由于第二隐私数据本身还保留在存储介质中,因此,各条第二隐私数据的头部中还可以保留有各自格式的编码字符串。\n[0378] 在本发明实施例的一种优选示例中,所述待清理第二隐私数据的指定格式包括图片格式。\n[0379] 在实际应用中,待清理第二隐私数据的指定格式至少可以包括图片格式。图片格式的第二隐私数据较为常见,因此,可以确定待清理第二隐私数据的指定格式为图片格式。\n[0380] 需要说明的是,本发明不仅可以清理图片格式的第二隐私数据,还可以清理文本格式、压缩包格式等等指定格式的第二隐私数据,可以依据指定格式提取出预设的第一类型标识即可,本领域技术人员可以根据实际需要设置清理的第二隐私数据的指定格式。\n[0381] 在实际应用中,每种格式的编码字符串可以是固定的,并且,格式的种类不同,编码字符串也就不同,因此,当确定待清理第二隐私数据的指定格式时,该指定格式的编码也即确定,可以采用该编码字符串作为该指定格式预设的第一类型标识。\n[0382] 在本发明实施例的一种优选示例中,所述预设的第一类型标识可以通过以下方式生成:\n[0383] 子步骤S71,依据所述指定格式确定对应的数据结构;\n[0384] 作为本发明具体应用的一种示例,各种格式的数据结构可以是预先定义好的,确定了指定格式的名称,即可以找到对应的数据结构。\n[0385] 子步骤S72,在所述数据结构中查找所述指定格式的编码字符串;\n[0386] 通常,指定格式的编码字符串可以在所述数据结构中的文件头字段内,查找到数据结构中的文件头,即可以找到指定格式的编码字符串。\n[0387] 子步骤S73,提取所述编码字符串作为预设的第一类型标识。\n[0388] 在具体应用中,找到指定格式的编码字符串后,可以提取该编码字符串作为预设的第一类型标识。\n[0389] 步骤403,从所述FAT文件系统中提取具有未使用标记的簇;\n[0390] 在具体实现中,FAT文件系统中,在磁盘上的每一个簇在FAT表中有且只有一个登记项,通过在对应簇号的登记项内填入“表项值”来表明数据区的该簇是已占用、未使用或者坏簇三种状态之一,具有未使用标记的簇可以表示该簇从未使用过,或者,该簇使用过但是被标记删除,第二隐私数据可以在簇中,也可以不在簇中。\n[0391] 根据未使用状态对应的表项值可以从FAT文件系统中提取具有未使用标记的簇。\n[0392] 在本发明实施例的一种优选示例中,所述FAT文件系统包括文件分配表FAT和数据区,所述数据区包括簇,所述未使用标记包括表项值为零,所述步骤203具体可以包括以下子步骤:\n[0393] 子步骤S81,从所述FAT文件系统中获取文件分配表FAT;\n[0394] 作为本发明实施例具体应用的一种示例,使用FAT文件系统的分区可以有这几个部分:保留区(Reserved Region),存放FAT文件系统的重要参数和引导程序;文件分配表FAT表(FAT Region),记录簇(Cluster)的使用情况;根目录区(Root Directory Region),记录根目录信息。FAT32系统舍弃了根目录区,根目录区可以任意指定一个簇;文件目录数据区(File and Directory Data Region),是各种文件数据的实际存放区域。\n[0395] 文件分配表FAT的位置记录在保留区中,可能通过保留区获取文件分配表FAT。\n[0396] 子步骤S82,记录所述文件分配表FAT中表项值为零对应的簇号;\n[0397] 在实际应用中,可以在文件分配表FAT中采用表项值为零标记对应的簇为未使用状态,记录下表项值为零对应的簇号。\n[0398] 子步骤S83,采用所述簇号在所述数据区中提取对应的簇。\n[0399] 在具体实现中,获得了表项值为零对应的簇号,也即可以得知第二隐私数据可能存储的位置,将数据区中与簇号对应的簇一一提取出来,可以过滤掉不可能存储有第二隐私数据的簇。\n[0400] 步骤404,在所述簇中的指定位置读取第二类型标识;\n[0401] 作为本发明具体应用的一种示例,指定位置可以是与预设的第一类型标识在数据结构中的位置相同。\n[0402] 第二类型标识可以与预设的第一类型标识具有相同的长度,相同的起始位置。\n[0403] 一般地,可以从簇中起始位置开始读取与预设的第一类型标识具有相同的长度的数据,作为第二类型标识。\n[0404] 步骤405,当所述第一类型标识与所述第二类型标识相同时,则读取所述簇中的其它数据;\n[0405] 在实际应用中,读取出第二类型标识后,将第二类型标识与预设的第一类型标识对比,若第二类型标识与第一类型标识相同,则表明该簇中具有第二隐私数据,并且,该簇中第二隐私数据的格式与指定格式相同,将该簇中的其它数据读取出来。\n[0406] 在本发明实施例的一种优选示例中,当发现所述第一类型标识与所述第二类型标识不相同时,则读取下一个具有未使用标记的簇中的指定位置读取第二类型标识。\n[0407] 在具体实现中,读取出的第二类型标识与预设的第一类型标识不相同可以包括两种情况,第一种情况是读取出的第二类型标识为零,表明该簇中没有第二隐私数据;第二种情况是读取出的第二类型标识不为零,表明该簇中具有与指定格式不相同的其他格式的数据。因此,可以在发现第一类型标识与第二类型标识不相同时,可以直接跳过该簇,读取下一个具有未使用标记的簇,在该簇中的指定位置读取第二类型标识。\n[0408] 根据本发明的当发现所述第一类型标识与所述第二类型标识不相同时,则读取下一个具有未使用标记的簇中的指定位置读取第二类型标识,可以快速的从所有可能具有指定格式的第二隐私数据的存储位置中,筛选掉不具有指定格式的第二隐私数据的存储位置。由此解决了清理第二隐私数据需要扫描具有未使用标记的簇中所有数据的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0409] 在本发明实施例的一种优选示例中,在所述在所述簇中的指定位置读取第二类型标识的步骤之后,还包括:\n[0410] 当连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值;\n[0411] 采用所述抽样阈值迭代计算当次抽样位置;\n[0412] 判断所述抽样位置上的数据是否为零;\n[0413] 若所述抽样位置上的数据为零,则返回采用所述抽样阈值迭代计算当次抽样位置的步骤;\n[0414] 若所述抽样位置上的数据不为零,则返回在所述簇中的指定位置读取第二类型标识的步骤。\n[0415] 在具体应用中,当连续读取出两个或两个以上所述第二类型标识为零时,则表明存储介质可能是全新的,还未存储过数据。\n[0416] 抽样阈值可以根据指定格式确定,可以统计具有指定格式的文件大小的最小值,采用最小值作为抽样阈值。例如,图片格式的文件可以设定最小值为50KB,则抽样阈值为\n50KB。\n[0417] 从当前位置开始,每隔一个抽样阈值的位置作为当次的抽样位置,读取抽样位置上的数据,如果抽样位置上的数据为零,则表明该位置上也没有数据,继续跳跃过一个抽样阈值的位置,读取下一个抽样位置,直到读取完整个存储介质;如果抽样位置上的数据不为零,则表明该位置上有数据,该存储介质有用过的痕迹,则返回在所述簇中的指定位置读取第二类型标识的步骤,将所述簇读完。\n[0418] 根据本发明的当连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值,可以跳跃地扫描完整个存储介质,由此解决了在新的存储介质中清理第二隐私数据时,需要扫描所有具有未使用标记的簇的问题,取得了读取较少数据的同时清理准确度高,速度快,运算少,耗时短,效率高的有益效果。\n[0419] 步骤406,当采用所述簇中的数据获得还原正确的结果时,判定为查找到一条第二隐私数据。\n[0420] 在实际应用中,具有未使用标记的一个或多个簇可能被反复擦写,一个具有第二类型标识,且第二类型标识与第一类型标识相同的簇,若其他数据与第二类型标识不能组合成一条第二隐私数据,则判定所述簇中的数据不为第二隐私数据,若其他数据与第二类型标识能组合成一条第二隐私数据,则为查找到一条第二隐私数据。\n[0421] 根据本发明的从所述FAT文件系统中提取具有未使用标记的簇,可以定位出所有可能具有指定格式的第二隐私数据的存储位置,以过滤掉不必要清理的存储位置,再结合本发明的预设的第一类型标识,与较少数据的第二类型标识对比,将第二隐私数据匹配出来,从而清理第二隐私数据,由此解决了清理第二隐私数据需要全盘扫描,造成运算多,速度慢,耗时长,效率低的问题,取得了运算少,速度快,耗时短,效率高的有益效果。\n[0422] 参照图5,示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第三隐私数据实施例1的步骤流程图,具体可以包括如下步骤:\n[0423] 步骤501,依据所述第三隐私数据的存储路径定位到对应的SQLite数据库;\n[0424] 在实际应用中,存储路径可以标示出SQLite数据库的文件的位置,采用该存储路径即可以定位出对应的SQLite数据库。\n[0425] 步骤502,依据所述清理请求确定SQLite数据库中指定的数据表;所述数据表中包括数据页,所述数据页具有页头;\n[0426] 在具体实现中,数据表中所有的数据记录都存储在数据页,包括第三隐私数据。每个程序所创建的SQLite数据库都是私有的,不同的清理请求对应不同的SQLite数据库,每个SQLite数据库可以由多个数据表组成,其中一个数据表用于存储通过该程序创建的记录,每一个数据表可以由一个或多个数据页将该程序创建的记录展示出来,该程序创建的记录包括第三隐私数据和未删除记录。\n[0427] 通过解析SQLite数据库预置的系统表sqlite_master可以获得SQLite数据库中所有数据表的列表,从列表中筛选出指定名称的数据表。\n[0428] 例如:通话记录中可以包括未接通话记录、已接通话记录和已拨通话记录,通话记录可以保存在通话记录的数据库中,在通话记录的数据库中可以采用一个数据表存储所有通话记录,该数据表可以采用一个或多个数据页将所有通话记录展示出来。\n[0429] 在本发明实施例的一种优选示例中,所述清理请求包括清理对象,所述步骤502具体可以包括以下子步骤:\n[0430] 子步骤S91,采用所述清理对象确定待查找的SQLite数据库,以及,所述清理对象指定的数据表的表名;\n[0431] 作为本发明具体应用的一种示例,清理对象可以是由不同的程序创建后被删除的记录,由于每个程序所创建的SQLite数据库都是私有的,因此,可以根据清理对象的不同确定对应的SQLite数据库。\n[0432] 例如,当确定清理对象为已删除的通话记录时,可以确定待查找的SQLite数据库为创建通话记录的拨号程序所创建的SQLite数据库。\n[0433] SQLite数据库中在创建时,设定的数据表的表名与将要存储的记录有关,因此,当清理对象确定时,指定的数据表的表名也即可以确定。\n[0434] 例如,拨号程序所创建的SQLite数据库,通常设定存储通话记录的数据表的表名为call,因此,当确定清理对象为已删除的通话记录时,可以确定已删除的通话记录对应的数据表的表名为call。\n[0435] 子步骤S92,依据所述表名在所述SQLite数据库中确定对应的数据表。\n[0436] 在具体实现中,可以根据确定的数据表的表名在SQLite数据库中查找到对应的数据表。\n[0437] 需要说明的是,数据页是数据表中所有数据的一种存储形式,每个数据表在SQLite数据库中可以都是Btree(B树)结构,Btree结构中包括根页、内部页和叶子页,其中,每个数据表的第一个页称为根页,根页和内部页主要用于导航,其页的指针域都是指向下级页的指针,即根页的指针域指向内部页的指针,内部页的指针域指向叶子页的指针,数据域仅仅包含关键字,而所有的数据记录都存储在叶子页中,因此,所述数据页可以是叶子页。\n[0438] 由于Btree中叶子页的逻辑存储结构,可以通过以下方式查找数据表中包括的数据页:\n[0439] 步骤一,查找数据表对应的根页;\n[0440] 步骤二,查找该根页对应的一个或多个内部页;\n[0441] 步骤三,查找该一个或多个内部页对应的一个或多个叶子页。\n[0442] 所有数据表的根页编号都存储在预置的系统表sqlite_master中,系统表sqlite_master保存了数据库的schema(架构)信息,在创建系统表sqlite_master的结构时,就确定了系统表sqlite_master的根页为page1。由于在步骤502中已经找到SQLite数据库中对应的表的名称,因此,可以根据SQLite数据库创建时的存储模式,找到数据表对应Btree的根页。\n[0443] 查找到Btree的根页,即可根据根页的指针域指向查找到一个或多个内部页,再根据内部页指针域的指向查找到一个或多个叶子页。\n[0444] 步骤503,从所述页头中读取出所述数据页中的空闲区域;\n[0445] 在实际应用中,空闲区域可以包括未分配区和freeblock(自由块)块,所谓未分配区可以指数据页用于存储数据记录的区域中从未使用过的位置区域,所谓freeblock块可以指当数据页用于存储数据记录的区域中的一条或多条数据记录被删除后,尚未被新数据记录覆盖的位置区域。\n[0446] 需要说明的是,当freeblock块与未分配区相邻时,第三隐私数据可以作为未分配区的内容。因此,除了需要读取出数据页中的freeblock块,还需要读取出数据页中的未分配区。\n[0447] 数据页中的空闲区域可以在页头中予以指示,在页头中可以记录第一个freeblock块的偏移量,每一个freeblock块可以包括4个字节,前2个字节可以是下一个freeblock块的偏移量,后2个字节可以是freeblock块的大小,因此,可以读取出数据页中的空闲区域。\n[0448] 此外,针对数据页中的数据记录被全部删除,该数据页成为空闲页时,空闲页将被记录在数据库文件的文件头中,通过读取文件头中的空闲页链表首指针,可以快速读取出空闲区域。\n[0449] 步骤504,从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0450] 在具体实现中,SQLite数据库中的数据表的一个或多个字段可以定义存入数据表中的每条数据记录包括的一个或多个字段以及一个或多个字段的顺序,因此,SQLite数据库中同一张数据表都有固定的数据类型。\n[0451] 数据表在创建时,需要将数据表的数据类型写入SQLite数据库预置的系统表sqlite_master中,可以包括数据表的类型table、数据表的表名、数据表的根页编号以及包括创建数据表时所使用的SQL语句的字符串,SQL语句中可以包括构建数据表时采用的一个或多个字段等,因此,可以从SQLite数据库预置的系统表中读取字符串解析出数据表的字段。\n[0452] 步骤505,采用所述一个或多个字段组合成强匹配特征;\n[0453] 作为本发明具体应用的一种示例,存入数据表的每条记录必须符合数据表构建时的要求,包括记录必须含有该一个或多个字段,且记录中各个字段的顺序应当和一个或多个字段的顺序相同,因此,该一个或多个字段的组合可以认为是该数据表中任何一条记录都满足的强匹配特征。\n[0454] 在本发明实施例的一种优选示例中,所述步骤504具体可以包括以下子步骤:\n[0455] 子步骤S1001,分别判断所述一个或多个字段的类型;\n[0456] 在具体实现中,写入预置的系统sqlite_master中的字符串可以包括构建数据表时采用的一个或多个字段的类型,通过读取该字符串可以判断出各个字段的类型。\n[0457] 子步骤S1002,依次串接所述一个或多个字段的类型成基本特征串,将所述基本特征串作为强匹配特征。\n[0458] 在实际应用中,可以将判断出的一个或多个字段的类型串接成基本特征串,该基本特征串即为强匹配特征。\n[0459] 例如:判断出的一个或多个字段的类型依次为数字,文本,数字,则基本特征串可以为数字-文本-数字,数字-文本-数字形成的基本特征串即可以作为强匹配特征。\n[0460] 步骤506,在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0461] 在实际应用中,可以采用强匹配特征在空闲区域中进行匹配,当空闲区域中存在第三隐私数据时,该第三隐私数据必然满足强匹配特征,第三隐私数据将被作为与强匹配特征匹配的特征数据查找出来。\n[0462] 需要说明的是,满足强匹配特征在不一定都是第三隐私数据,当新记录各覆盖了相邻两条第三隐私数据的一半时,若新记录也被删除,与强匹配特征的匹配的特征数据可能是两条第三隐私数据的组合。例如:数据表的每条记录包含四个字段,相邻的第一条第三隐私数据的第一个字段到第四个字段的类型分别是数字-文本-数字-文本,第二条第三隐私数据的第一个字段到第四个字段的类型也分别是数字-文本-数字-文本,此时,第一条新记录覆盖了第一条第三隐私数据的第三个字段和第四个字段以及第二条第三隐私数据的第一个字段和第二个字段,将第一条新记录删除后,又写入第二条新记录,且第二条新记录恰好覆盖在第一条新记录的第三个字段和第四个字段和第二条第三隐私数据的第三个字段和第四个字段。若采用强匹配特征数字-文本-数字-文本,在空闲区域内进行查找,与强匹配特征匹配的特征数据为第一条第三隐私数据的第一个字段和第二个字段加第一条新记录的第一个字段和第二个字段,此时,特征数据不是第三隐私数据。\n[0463] 步骤507,判断所述特征数据是否为第三隐私数据;若是第三隐私数据,则执行步骤508;\n[0464] 在具体实现中,可以通过将特征数据对应的数据内容提取出来,判断数据内容是否有效的方式判断所述特征数据是否为第三隐私数据。\n[0465] 在本发明实施例的一种优选示例中,所述步骤507具体可以包括以下子步骤:\n[0466] 子步骤S1101,依据所述强匹配特征生成所述一个或多个字段的数据取值范围;\n[0467] 子步骤S1102,读取所述特征数据中一个或多个字段的数据取值;\n[0468] 子步骤S1103,分别采用所述数据取值与对应的数据取值范围进行比较;\n[0469] 子步骤S1104,当所述一个或多个字段的数据取值依次符合所述数据取值范围时,判定所述特征数据是第三隐私数据。\n[0470] 由于强特征可以是根据系统表中的字段类型组成的,不同的字段类型的取值范围是不同的。\n[0471] 判断数据内容是否有效时,当特征数据中各字段类型的数据取值依次符合强匹配特征中的数据取值范围要求时,特征数据对应的数据内容有效,判定特征数据为第三隐私数据;\n[0472] 当特征数据中各字段类型其中之一的数据取值不符合强匹配特征中的数据取值范围要求时,特征数据对应的数据内容无效,判定特征数据不为第三隐私数据。\n[0473] 由于采用强匹配特征匹配出来的特征数据不一定是第三隐私数据,不是第三隐私数据的特征数据不具有任何价值,清理不是第三隐私数据的特征数据只会增加存储介质的读写次数,减少存储介质的读写寿命,因此,为了减少存储介质的读写次数,不是第三隐私数据的特征数据可以不必清理。\n[0474] 当然,上述第三隐私数据的判断方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他第三隐私数据的判断方式,本发明实施例对此不加以限制。另外,除了上述第三隐私数据的判断方式外,本领域技术人员还可以根据实际需要采用其他第三隐私数据的判断方式,本发明实施例对此也不加以限制。\n[0475] 根据本发明的空闲区域可以定位出所有可能存在第三隐私数据的位置,采用强匹配特征在空闲区域匹配出特征数据,可以将全部的第三隐私数据和疑似的第三隐私数据匹配出来,再通过判断特征数据将疑似的第三隐私数据过滤,由此解决了第三隐私数据查找的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0476] 步骤508,判定为查找到一条第三隐私数据。\n[0477] 在具体实现中,当特征数据判定为第三隐私数据时,可以判定为查找到一条第三隐私数据。\n[0478] 根据本发明的空闲区域可以定位出所有可能存在第三隐私数据的位置,采用强匹配特征在空闲区域匹配出特征数据,可以将全部的第三隐私数据和疑似的第三隐私数据匹配出来,再通过判断特征数据将疑似的第三隐私数据过滤,由此解决了第三隐私数据查找的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0479] 参照图6,示出了根据本发明一个实施例的一种清理隐私数据的方法中查找第三隐私数据实施例2的步骤流程图,具体可以包括如下步骤:\n[0480] 步骤601,依据所述第三隐私数据的存储路径定位到对应的SQLite数据库;\n[0481] 步骤602,依据所述清理请求确定SQLite数据库中对应的数据表;所述数据表中包括数据页,所述数据页具有页头;\n[0482] 步骤603,从所述页头中读取出所述数据页中的空闲区域;\n[0483] 步骤604,从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0484] 步骤605,采用所述一个或多个字段组合成强匹配特征;\n[0485] 步骤606,在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0486] 步骤607,从所述页头中读取出所述数据页中的工作区域;所述工作区域中存储有已保存数据;\n[0487] 在具体实现中,数据页的页头中标识了数据页的工作区域的起始地址,定位到起始地址,可以依次确定出数据页中的工作区域,并且可以将工作区域中存储的已保存数据读取出来。\n[0488] 步骤608,依据所述已保存数据生成一个或多个弱匹配特征。\n[0489] 在实际应用中,在同一个数据表中的各个已保存数据之间存在某些相同的特征,可以采用这些相同的特征推测第三隐私数据也可能具有这些特征中大部分。\n[0490] 在本发明实施例的一种优选示例中,所述步骤308具体可以包括以下子步骤:\n[0491] 子步骤S1201,依据数据表的一个或多个字段的类型统计所述已保存数据中对应的一个或多个字段的值或长度;\n[0492] 作为本发明具体应用的一种示例,各条已保存数据所具有的字段可以是相同的,每条已保存数据可以包括一个或多个字段,可以根据字段的类型,统计该字段的值或长度。\n例如:若一个字段的类型为文本,则统计该一个字段的长度,若一个字段的类型为数字,则统计该一个字段的值,等等。\n[0493] 子步骤S1202,若所述已保存数据中对应的一个或多个字段的值相同,或者,对应的一个或多个字段的长度相同,筛选出所述一个或多个字段;\n[0494] 在具体应用中,若各条已保存数据中同一字段的值相同,或者,同一字段的长度相同,则把将该同一字段筛选出来。\n[0495] 例如:三条已保存数据都具有字段一、字段二、字段三、字段四,其中,字段一的类型为数字,字段二的类型为文本,字段三的类型为数字,字段四的类型为文本,已保存数据中对应的一个或多个字段的值或长度的统计结果如下表1所示。\n[0496]\n已保存数据 字段一 字段二 字段三 字段四\n第一条已保存数据 0 10 0 0\n第二条已保存数据 0 10 1 1\n第三条已保存数据 0 10 2 2\n[0497] 表1\n[0498] 对表1的数据进行分析判断可知,三条已保存数据中,字段一的值都为0,字段二的长度都为10,即各条已保存数据中同一字段的值相同,或者,同一字段的长度相同,将字段一和字段二分别筛选出来。\n[0499] 子步骤S63,将所述一个或多个字段和所述一个或多个字段的值的组合作为一个或多个弱匹配特征,和/或,将所述一个或多个字段和所述一个或多个字段的长度的组合作为一个或多个弱匹配特征。\n[0500] 在实际应用中,由于筛选出来的每一个字段,在字段的值,或者,字段的长度统计上是相同的,因此,将一个字段和该一个字段的值的组合作为一个弱匹配特征,和/或,将一个字段和该一个字段的长度的组合作为一个或多个弱匹配特征,当已保存数据中有多个这样的组合时,可以生成多个弱匹配特征。\n[0501] 步骤609,采用所述一个或多个弱匹配特征与所述特征数据进行匹配;\n[0502] 在具体实现中,特征数据和已保存数据所具有的字段是相同的,将一个或多个弱匹配特征所具有的字段分别与特征数据中对应的字段进行匹配,将一个或多个弱匹配特征所具有的字段的值与特征数据中对应的字段的值进行匹配,和/或,一个或多个弱匹配特征所具有的字段的长度与特征数据中对应的字段的长度进行匹配。\n[0503] 步骤610,计算与所述特征数据匹配的弱匹配特征的个数,以及,弱匹配特征的总数;\n[0504] 若一个或多个弱匹配特征与特征数据对应的字段的值或者长度相同,则弱匹配特征与所述特征数据匹配,计算出与与所述特征数据匹配的弱匹配特征的个数。\n[0505] 统计出弱匹配特征的总数。\n[0506] 步骤611,当所述个数占所述弱匹配特征总数的比例超过预设的阈值时,判定所述特征数据为第三隐私数据,执行步骤612。\n[0507] 计算与所述特征数据匹配的弱匹配特征的个数占所述弱匹配特征总数的比例,当比例超过预设阈值时,证明特征数据与已保存数据相似度高,判定特征数据为第三隐私数据\n[0508] 需要说明的是,预设阈值可以根据弱匹配特征的总数确定,弱匹配特征的总数越多,预设阈值越大,弱匹配特征的总数越少,预设阈值越小。\n[0509] 根据本发明的弱匹配特征可以对特征数据进行进一步判断,通过计算特征数据与弱匹配特征匹配的比例推断特征数据是否为第三隐私数据,由此解决了过滤疑似的第三隐私数据速度慢的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0510] 步骤612,判定为查找到一条第三隐私数据。\n[0511] 根据本发明的空闲区域可以定位出所有可能存在第三隐私数据的位置,采用强匹配特征在空闲区域匹配出特征数据,可以将全部的第三隐私数据和疑似的第三隐私数据匹配出来,再通过判断特征数据将疑似的第三隐私数据过滤,由此解决了第三隐私数据查找的问题,取得了清理速度快,准确度高,减少人工操作,减少耗时,存储介质的读写寿命增加,成本降低的有益效果。\n[0512] 对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。\n[0513] 对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。\n[0514] 参照图7,示出了根据本发明一个实施例的一种清理隐私数据的装置实施例的结构框图,存储在FAT文件系统中的第二隐私数据,以及存储在SQLite数据库中的第三隐私数据,所述装置位于侧,具体可以包括如下模块:\n[0515] 清理请求接收模块701,适于接收用户在预定的第一界面位置上点击的清理请求;\n[0516] 清理请求发送模块702,适于将所述清理请求发送给清理进程,所述清理进程依据所述清理请求完成隐私数据的清理,生成清理结果,并将所述清理结果返回;\n[0517] 清理结果展现模块703,适于提供清理结果的展现。\n[0518] 在本发明的一种优选示例中,所述清理请求中包括隐私数据的存储路径,所述清理请求发送模块包括:\n[0519] 清理请求发送子模块,适于将所述清理请求发送给清理进程;所述清理进程用于依据所述隐私数据的存储路径查找所述隐私数据,并将查找到的隐私数据返回;\n[0520] 隐私数据展现子模块,适于提供所述第一隐私数据、第二隐私数据和第三隐私数据的展现;\n[0521] 确认清理请求接收子模块,适于接收用户在预定的第二界面位置上点击的确认清理请求,并将所述确认清理请求发送给所述清理进程,所述清理进程用于依据所述确认清理请求完成对所述隐私数据的清理,生成清理结果,并将所述清理结果返回。\n[0522] 在本发明的一种优选示例中,所述第一隐私数据包括存储在EXT文件系统中的第一第一隐私数据,所述清理请求还包括待清理第一隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第一隐私数据的存储路径查找第一隐私数据:\n[0523] 格式判断子模块,适于依据所述第一隐私数据的存储路径判断文件系统的格式;\n[0524] 第三类型标识提取模块,适于在依据所述存储路径判定文件系统的格式为EXT文件系统时,依据所述指定格式提取预设的第三类型标识;\n[0525] 区块群组提取子模块,适于从所述EXT文件系统中提取出各个区块群组block group;\n[0526] 数据块提取子模块,适于针对当前处理的区块群组block group提取具有未使用标记的数据块block;\n[0527] 第四类型标识读取模块,适于在所述数据块block中的指定位置读取第四类型标识;\n[0528] 其他数据读取子模块,适于在所述第三类型标识与所述第四类型标识相同时,读取所述数据块block中的其他数据;\n[0529] 文件信息判断子模块,适于在所述其他数据中包括结束标志时,判断连续读出的一个或多个数据块block中的数据是否具有完整的文件信息;\n[0530] 第一隐私数据判定子模块,适于在判定连续读出的一个或多个数据块block中的数据具有完整的文件信息时,则判定为查找到一条第一隐私数据。\n[0531] 在本发明的一种优选示例中,所述装置还包括:\n[0532] 下一个第四类型标识读取子模块,适于在所述第三类型标识与所述第四类型标识不相同时,在下一个具有未使用标记的数据块block中的指定位置读取第四类型标识。\n[0533] 在本发明的一种优选示例中,所述预设的第一类型标识通过以下方式生成:\n[0534] 数据结构确定子模块,适于依据所述指定格式确定对应的数据结构;\n[0535] 编码字符串查找子模块,适于在所述数据结构中查找所述指定格式的编码字符串;\n[0536] 第三类型标识提取子模块,适于提取所述编码字符串作为预设的第三类型标识。\n[0537] 在本发明的一种优选示例中,所述当前处理的区块群组block group包括区块对照表block bitmap,所述未使用标记包括表项值为零,所述数据块提取模块包括:\n[0538] 区块对照表读取子模块,适于读取区块对照表block bitmap;\n[0539] 数据块block号码记录子模块,适于记录所述区块对照表block bitmap中表项值为零对应的数据块block的号码;\n[0540] 数据块block提取子模块,适于采用所述号码提取对应的数据块block。\n[0541] 在本发明的一种优选示例中,所述当前处理的区块群组block group包括信息节点对照表inode bitmap,所述装置还包括:\n[0542] 号码最小的数据块block读取子模块,适于在发现所述区块对照表block bitmap中各个表项值为零,且所述信息节点对照表inode bitmap中各个表项值为零时,读取所述区块对照表block bitmap中号码最小的数据块block;\n[0543] 起始数据读取子模块,适于采用所述号码读取所述号码最小的数据块block中的起始数据;\n[0544] 下一个区块群组处理子模块,适于若所述起始数据为零零,则跳过所述当前处理的区块群组block group,处理下一个区块群组block group。\n[0545] 在本发明的一种优选示例中,若所述第一隐私数据存储在不连续号码的数据块block中时,所述装置还包括:\n[0546] 信息节点inode的号码读取子模块,适于读取所述信息节点对照表inode bitmap中表项值为零对应的信息节点inode的号码;\n[0547] 残留信息提取子模块,适于依据所述号码从信息节点表格inode table中提取残留信息,所述残留信息中包括存储有所述第一隐私数据的数据块block的号码;\n[0548] 步骤跳转子模块,适于在所述具有未使用标记的数据块block具有所述号码,执行在所述数据块block中的指定位置读取第二类型标识的步骤。\n[0549] 在本发明的一种优选示例中,所述隐私数据包括存储在FAT文件系统中的第二隐私数据,所述清理请求还包括待清理第二隐私数据的指定格式,所述清理进程用于采用如下方式依据所述第二隐私数据的存储路径查找第二隐私数据:\n[0550] 格式判断子模块,适于依据所述第二隐私数据的存储路径判断文件系统的格式;\n[0551] 第一类型标识提取模块,适于在依据所述存储路径判定文件系统的格式为FAT文件系统时,依据所述指定格式提取预设的第一类型标识;\n[0552] 簇提取子模块,适于从所述FAT文件系统中提取具有未使用标记的簇;\n[0553] 第二类型标识读取模块,适于在所述簇中的指定位置读取第二类型标识;\n[0554] 其它数据读取子模块,适于在所述第一类型标识与所述第二类型标识相同时,读取所述簇中的其它数据;\n[0555] 第二隐私数据判定子模块,,适于在采用所述簇中的数据获得还原正确的结果时,判定为查找到一条第二隐私数据。\n[0556] 在本发明的一种优选示例中,还包括:\n[0557] 下一个第二类型标识读取子模块,适于在发现所述第一类型标识与所述第二类型标识不相同时,读取下一个具有未使用标记的簇中的指定位置读取第二类型标识。\n[0558] 在本发明的一种优选示例中,所述预设的第一类型标识通过以下方式生成:\n[0559] 数据结构确定子模块,适于依据所述指定格式确定对应的数据结构;\n[0560] 编码字符串查找子模块,适于在所述数据结构中查找所述指定格式的编码字符串;\n[0561] 第一类型标识提取子模块,适于提取所述编码字符串作为预设的第一类型标识。\n[0562] 在本发明的一种优选示例中,所述FAT文件系统包括文件分配表FAT和数据区,所述数据区包括簇,所述未使用标记包括表项值为零,所述簇提取子模块包括:\n[0563] 文件分配表FAT获取子模块,适于从所述FAT文件系统中获取文件分配表FAT;\n[0564] 簇号记录子模块,适于记录所述文件分配表FAT中表项值为零对应的簇号;\n[0565] 簇提取子模块,适于采用所述簇号在所述数据区中提取对应的簇。\n[0566] 在本发明的一种优选示例中,还包括:\n[0567] 抽样阈值确定子模块,适于在连续读取出两个或两个以上所述第二类型标识为零时,依据所述指定格式确定抽样检测的抽样阈值;\n[0568] 当次抽样位置计算子模块,适于采用所述抽样阈值迭代计算当次抽样位置;\n[0569] 数据判断子模块,适于判断所述抽样位置上的数据是否为零;\n[0570] 数据为零判定子模块,适于在判定所述抽样位置上的数据为零时,返回在所述簇中的指定位置读取第二类型标识的步骤;\n[0571] 数据不为零判定子模块,适于在判定所述抽样位置上的数据不为零时,返回读取所述簇中与所述类型标识具有相同位置的数据的步骤。\n[0572] 在本发明的一种优选示例中,所述待清理第二隐私数据的指定格式包括图片格式。\n[0573] 在本发明的一种优选示例中,所述隐私数据包括存储在存储在SQLite数据库中的第三隐私数据,所述清理进程用于采用如下方式依据所述第三隐私数据的存储路径查找第三隐私数据:\n[0574] SQLite数据库定位子模块,适于依据所述第三隐私数据的存储路径定位到对应的SQLite数据库;\n[0575] 数据表确定子模块,适于依据所述清理请求确定SQLite数据库中指定的数据表;\n所述数据表中包括数据页,所述数据页具有页头;\n[0576] 空闲区域读取子模块,适于从所述页头中读取出所述数据页中的空闲区域;\n[0577] 数据表解析子模块,适于从所述SQLite数据库预置的系统表中解析出所述数据表的一个或多个字段;\n[0578] 强匹配特征生成子模块,适于采用所述一个或多个字段组合成强匹配特征;\n[0579] 特征数据查找子模块,适于在所述空闲区域中查找与所述强匹配特征匹配的特征数据;\n[0580] 第三隐私数据判断子模块,适于判断所述特征数据是否为第三隐私数据;\n[0581] 第三隐私数据判定子模块适于在判定所述特征数据为第三隐私数据时,判定为查找到一条第三隐私数据。\n[0582] 在本发明的一种优选示例中,所述装置还包括:\n[0583] 工作区域读取子模块,适于从所述页头中读取出所述数据页中的工作区域;所述工作区域中存储有已保存数据;\n[0584] 弱匹配特征生子成子模块,适于依据所述已保存数据生成多个弱匹配特征。\n[0585] 在本发明的一种优选示例中,所述第三隐私数据判断模块包括:\n[0586] 特征数据匹配子模块,适于采用所述多个弱匹配特征与所述特征数据进行匹配;\n[0587] 匹配个数计算子模块,适于计算与所述特征数据匹配的弱匹配特征的个数,以及,弱匹配特征的总数;\n[0588] 第三隐私数据判定子模块,适于在所述个数占所述弱匹配特征总数的比例超过预设的阈值时,判定所述特征数据为第三隐私数据。\n[0589] 在本发明的一种优选示例中,所述强匹配特征生成子模块包括:\n[0590] 类型判断子模块,适于分别判断所述一个或多个字段的类型;\n[0591] 强匹配特征确定子模块,适于依次串接所述一个或多个字段的类型成基本特征串,将所述基本特征串作为强匹配特征。\n[0592] 在本发明的一种优选示例中,所述弱匹配特征生成子模块包括:\n[0593] 已保存数据统计子模块,适于依据数据表的一个或多个字段的类型统计所述已保存数据中对应的一个或多个字段的值或长度;\n[0594] 字段筛选子模块;若所述已保存数据中对应的一个或多个字段的值相同,或者,对应的一个或多个字段的长度相同,筛选出所述一个或多个字段;\n[0595] 弱匹配特征确定子模块,适于将所述一个或多个字段和所述一个或多个字段的值的组合作为一个或多个弱匹配特征,和/或,将所述一个或多个字段和所述一个或多个字段的长度的组合作为一个或多个弱匹配特征。\n[0596] 在本发明的一种优选示例中,所述清理进程用于采用如下方式针对所述确认清理请求完成对所述第三隐私数据的清理:\n[0597] 位置信息获取子模块,适于获取所述特征数据存储的位置信息,所述位置信息包括存储特征数据的数据库文件、数据页、偏移量和长度;\n[0598] 特征数据定位子模块,适于采用所述数据库文件、数据页、偏移量和长度定位到所述特征数据存储的位置;\n[0599] 数据置零子模块,适于将所述位置上的数据置零。\n[0600] 在本发明的一种优选示例中,所述清理请求包括清理对象,所述数据表确定模块包括:\n[0601] 表名确定子模块,适于采用所述清理对象确定待查找的SQLite数据库,以及,所述清理对象指定的数据表的表名;\n[0602] 数据表确定子模块,适于依据所述表名在所述SQLite数据库中确定对应的数据表。\n[0603] 在本发明的一种优选示例中,所述第三隐私数据判断模块包括:\n[0604] 数据取值范围生成子模块,用于依据所述强匹配特征生成所述一个或多个字段的数据取值范围;\n[0605] 数据取值读取子模块,用于读取所述特征数据中一个或多个字段的数据取值;\n[0606] 比较子模块,用于分别采用所述一个或多个字段的数据取值与对应的数据取值范围进行比较;\n[0607] 第三隐私数据确定子模块,当所述一个或多个字段的数据取值依次符合所述数据取值范围时,判定所述特征数据是第三隐私数据。\n[0608] 在本发明的一种优选示例中,所述隐私数据包括未被彻底删掉的照片、短信、通讯录、通话记录、聊天记录、录音、视频。\n[0609] 对于装置实施例而言,由于其与方法实施例1、2、3、4、5、6基本相似,所以描述的比较简单,相关之处参见方法实施例1、2、3、4、5、6的部分说明即可。\n[0610] 在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。\n各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。\n[0611] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。\n[0612] 类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。\n[0613] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。\n[0614] 此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。\n[0615] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的清理隐私数据的方法和装置设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。\n[0616] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
法律信息
- 2017-12-12
- 2014-10-29
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201410281418.4
申请日: 2014.06.20
- 2014-10-08
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2013-01-30
|
2011-07-25
| | |
2
| |
2013-11-27
|
2013-07-26
| | |
3
| |
2014-02-12
|
2013-10-25
| | |
4
| |
2013-04-24
|
2012-12-24
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |