著录项信息
专利名称 | 一种短消息监控方法及装置 |
申请号 | CN201110210547.0 | 申请日期 | 2011-07-26 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-04-18 | 公开/公告号 | CN102421074A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04W4/14 | IPC分类号 | H;0;4;W;4;/;1;4;;;H;0;4;W;1;2;/;1;2查看分类表>
|
申请人 | 中兴通讯股份有限公司 | 申请人地址 | 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中兴通讯股份有限公司 | 当前权利人 | 中兴通讯股份有限公司 |
发明人 | 冯会彬 |
代理机构 | 北京康信知识产权代理有限责任公司 | 代理人 | 江舟;董文倩 |
摘要
本发明实施例提供一种短消息监控方法及装置,包括:针对包含连续数字数列的短消息,首先从中确定包含超过一定长度的数字信息的短消息的发送者,然后在该发送者在监控周期时长内发送的短消息总数量达到设定值时,继续确定在监控周期时长该发送者发送的包含超过一定长度的数字信息的短消息的数量与该发送者发送的短消息的总数量是否达到设定的比率,若达到,则确定该发送者为垃圾短消息发送者,从而在全面、精确地识别连续数字数列类型的垃圾短消息的基础上,可以对发送连续数字数列类型的垃圾短消息发送者进行识别和屏蔽,提高对垃圾短消息发送者的识别和屏蔽精度。
1.一种短消息监控方法,其特征在于,该方法包括:
确定发送短消息中包含的连续数字数列的长度达到门限值的短消息的发送者;
确定监控周期时长内,该发送者发送的短消息总数量达到设定值时,确定在所述监控周期时长内,该发送者发送的短消息中包含的连续数字数列的长度达到门限值的短消息数量与该发送者发送的短消息总数量的比率,是否达到设定阈值;
若达到设定阈值,则将该发送者确定为垃圾短消息发送者。
2.如权利要求1所述的方法,其特征在于,所述监控周期时长是指起始时间和结束时间均任意设定的一段时间;或者所述监控周期时长是指在确定该发送者发送了包含连续数字数列的短消息,且该连续数字数列的长度达到门限值时刻起的一段时间。
3.如权利要求1所述的方法,其特征在于,确定包含的连续数字数列的长度达到门限值的短消息,具体包括:
针对每一短消息,扫描该短消息的内容,确定该短消息的内容中包含有连续数字数列;
确定该短消息的内容中包含的每个连续数字数列的长度,确定最大长度;
若确定的最大长度达到门限值,则将该短消息确定为包含的连续数字数列的长度达到门限值的短消息。
4.如权利要求1~3任一所述的方法,其特征在于,确定垃圾短消息发送者之后,所述方法还包括:
将确定该发送者为垃圾短消息发送者的监控结果发送至数据库保存。
5.如权利要求4所述的方法,其特征在于,确定垃圾短消息发送者之后,所述方法还包括:
将该发送者在所述监控周期时长内发送的全部短消息发送至数据库保存。
6.一种短消息监控装置,其特征在于,该装置包括:
第一确定模块,用于确定发送短消息中包含的连续数字数列的长度达到门限值的短消息的发送者;
第二确定模块,用于确定监控周期时长内,该发送者发送的短消息总数量达到设定值;
第三确定模块,用于确定在所述监控周期时长内,该发送者发送的短消息中包含的连续数字数列的长度达到门限值的短消息数量与该发送者发送的短消息总数量的比率,是否达到设定阈值,若达到设定阈值,则将该发送者确定为垃圾短消息发送者。
7.如权利要求6所述的装置,其特征在于,第一确定模块,具体用于针对每一短消息,扫描该短消息的内容,确定该短消息的内容中包含有连续数字数列,并确定该短消息的内容中包含的每个连续数字数列的长度及该长度中的最大长度,若确定的最大长度达到门限值,则将该短消息确定为包含的连续数字数列的长度达到门限值的短消息。
8.如权利要求6或7所述的装置,其特征在于,所述装置还包括发送模块,用于将确定该发送者为垃圾短消息发送者的监控结果发送至数据库保存。
9.如权利要求8所述的装置,其特征在于,所述发送模块,还用于将该发送者在所述监控周期时长内发送的全部短消息发送至数据库保存。
一种短消息监控方法及装置\n技术领域\n[0001] 本发明涉及通信领域,尤其涉及一种短消息监控方法及装置。\n背景技术\n[0002] 目前,在短消息系统中传播的海量短消息中存在相当比例的垃圾短消息,涵盖各种促销甚至恶意短消息,给用户造成困扰的同时,也对短消息系统的运营形成了挑战。\n[0003] 现有技术中可以利用短消息监控系统对垃圾短消息进行监控,尽可能地识别、屏蔽短消息系统中的垃圾短消息发送者,减少垃圾短消息的危害,而监控规则是短消息监控系统设计的关键。短消息系统中存在各种各样的垃圾短消息发送者,设计良好的监控系统,需要针对不同类型垃圾短消息发送者的典型特征制定相应的多种垃圾短消息监控规则。\n[0004] 许多垃圾短消息中包含连续数字数列(即一连串数字信息),例如,营销类短消息通常包含联系电话,包含银行账号用以诈骗用户汇款的短消息也很常见,这种垃圾短消息可以称为连续数字数列类型的垃圾短消息。目前已有的短消息监控系统缺乏对包含连续数字数列的垃圾短消息的有针对性的监控规则。\n[0005] 而在现有的短消息监控规则中,流量规则与关键字规则是两种主要的通用监控规则。前者基于垃圾短消息发送者短时间高频度发送短消息的特征,后者基于一些预先配置的在垃圾短消息中经常出现的关键字或关键字组合来识别垃圾短消息。对于前述包含连续数字数列类型的垃圾短消息,流量规则难以量化频度指标,而关键字规则难以预先准确设定通用的关键字,因而两者都难以全面、精准地识别包含连续数字数列的垃圾短消息,也就无法识别、屏蔽短消息系统中包含连续数字数列的垃圾短消息发送者。\n发明内容\n[0006] 本发明实施例提供一种短消息监控方法及装置,用于解决现有技术无法全面、精确地识别连续数字数列类型的垃圾短消息,以及难以识别、屏蔽短消息系统中连续数字数列类型的垃圾短消息发送者的问题。\n[0007] 一种短消息监控方法,该方法包括:\n[0008] 确定发送短消息中包含的连续数字数列的长度达到门限值的短消息的发送者;\n[0009] 确定监控周期时长内,该发送者发送的短消息总数量达到设定值时,确定在所述监控周期时长内,该发送者发送的短消息中包含的连续数字数列的长度达到门限值的短消息数量与该发送者发送的短消息总数量的比率,是否达到设定阈值;\n[0010] 若达到设定阈值,则将该发送者确定为垃圾短消息发送者。\n[0011] 一种短消息监控装置,该装置包括:\n[0012] 第一确定模块,用于确定发送短消息中包含的连续数字数列的长度达到门限值的短消息的发送者;\n[0013] 第二确定模块,用于确定监控周期时长内,该发送者发送的短消息总数量达到设定值;\n[0014] 第三确定模块,用于确定在所述监控周期时长内,该发送者发送的短消息中包含的连续数字数列的长度达到门限值的短消息数量与该发送者发送的短消息总数量的比率,是否达到设定阈值,若达到设定阈值,则将该发送者确定为垃圾短消息发送者。\n[0015] 根据本发明实施例提供的方案,针对包含连续数字数列的短消息,首先从中确定包含超过一定长度的数字信息的短消息的发送者,然后在该发送者在监控周期时长内发送的短消息总数量达到设定值时,继续确定在监控周期时长该发送者发送的包含超过一定长度的数字信息的短消息的数量与该发送者发送的短消息的总数量是否达到设定的比率,若达到,则确定该发送者为垃圾短消息发送者,从而在全面、精确地识别连续数字数列类型的垃圾短消息的基础上,可以对发送连续数字数列类型的垃圾短消息发送者进行识别和屏蔽,提高对垃圾短消息发送者的识别和屏蔽精度。\n附图说明\n[0016] 图1为本发明实施例一提供的一种短消息监控方法的步骤流程图;\n[0017] 图2为本发明实施例二提供的一种短消息监控方法的步骤流程图;\n[0018] 图3为本发明实施例三提供的一种短消息监控装置的结构示意图。\n具体实施方式\n[0019] 针对现有技术中无法精确、全面地识别连续数字数列类型的垃圾短消息,也难以识别、屏蔽短消息系统中连续数字数列类型的垃圾短消息发送者,本发明实施例提供一种综合考虑短消息频度与短消息内容的短消息监控解决方案,主要思想为:持续跟踪分析短消息系统中的所有短消息,若发现某发送者以较高的频度和比率发送包含连续数字数列的短消息,则将该发送者作为垃圾短消息发送者输出。\n[0020] 下面结合说明书附图和各实施例对本发明技术方案进行说明。\n[0021] 实施例一、\n[0022] 本发明实施例一提供一种短消息监控方法,该方法的步骤流程如图1所示,具体包括:\n[0023] 步骤101、确定发送包含连续数字数列长度达到门限值的短消息的发送者。\n[0024] 在采集到短消息后,可以从采集到的短消息提取短消息内容、主叫号码等信息,根据短消息内容来判断该短消息是否为垃圾短消息,并可以根据主叫号码确定该短消息的发送者。\n[0025] 在本步骤中,具体的,可以扫描短消息内容,确定短消息内容中是否包含连续数字数列:\n[0026] 若包括,可以确定该短消息内容中包含的每个连续数字数列的长度,该连续数字数列的长度是指,一串连续的数字序列的位数,如138123789的连续数字数列的长度为9,\n9789458717的连续数字数列的长度为10。并从该短消息内容中包含的每个连续数字数列的长度中,确定最大长度,将最大长度达到门限值的短消息确定为包含的连续数字数列长度达到门限值的短消息,如,若一条短消息中同时包括连续数字数列138123789和\n9789458717,则该短消息对应的连续数字数列的最大长度为10,若所述门限值为8,则可以确定该短消息为包含的连续数字数列最大长度(10)达到门限值(8)的短消息;\n[0027] 若不包括,确定该短消息内容中包含的连续数字数列的最大长度为0。由于所述门限值为正整数,因此,该短消息必然不是包含的连续数字数列长度达到门限值的短消息。\n[0028] 为了避免将正常携带的连续数字数列的短消息误识别为垃圾短消息,可以设定所述门限值为8,即仅识别长度达到8个数字的序列,以减小监控误差。\n[0029] 在确定出包含的连续数字数列长度达到门限值的短消息后,可以对应地确定该短消息的发送者。\n[0030] 步骤102、确定监控周期时长内,该发送者发送的短消息总数量达到设定值。\n[0031] 在确定出发送了包含的连续数字数列长度达到门限值的短消息的发送者之后,可以确定该发送者在监控周期时长内发送的短消息总数量是否达到设定值,若达到,则判断该发送者有可能为垃圾短消息发送者。\n[0032] 所述监控周期时长的起止时间可以任意设定,特殊的,监控周期时长的起始时间可以设定为确定该发送者发送包含连续数字数列长度达到门限值的短消息的时刻,从而避免在包含连续数字数列的垃圾短消息为阶段性发送时,对垃圾短消息发送者的漏检。\n[0033] 步骤103、确定垃圾短消息发送者。\n[0034] 本步骤具体包括:将所述监控周期时长内,发送的包含的连续数字数列长度达到门限值的短消息的数量与发送的短消息总数量的比率达到设定阈值的发送者确定为垃圾短消息发送者。\n[0035] 步骤104、保存监控结果。\n[0036] 本步骤包括,将确定该发送者为垃圾短消息发送者的监控结果发送至数据库保存,以便于后续对该发送者进行屏蔽、拦截等处理。\n[0037] 为了保证监控结果的准确性,本发明实施例提供的方法还可以进一步包括:\n[0038] 步骤105、对监控结果进行人工审核仲裁。\n[0039] 本步骤具体包括,将该发送者在所述监控周期时长内发送的全部短消息发送至数据库保存,根据所述全部短消息对所述监控结果进行人工审核仲裁。\n[0040] 下面通过一个具体的实例对本发明实施例一的方案进行详细说明。该具体的实例提供的短消息监控规则可以包括以下属性:连续数字数列最大长度(MaxContiNumLen)、监控周期时长(MonitorPeriod)、短消息总数量设定值(TotalThred)、包含的连续数字数列最大长度达到门限值的短消息的数量与发送的短消息总数量的比率阈值\n(ContiNumProportionThred)。\n[0041] 实施例二、\n[0042] 本发明实施例二提供一种短消息监控方法,该方法的步骤流程如图2所示,具体包括:\n[0043] 步骤201、采集短消息,并从中提取主叫号码、短消息内容等信息。\n[0044] 所述主叫号码可以用CallerISDN来标识。\n[0045] 步骤202、对主叫用户在监控周期时长内所发送的短消息总条数进行计数。\n[0046] 所述主叫用户是指步骤201中提取出的主叫号码对应的用户。在本步骤中,统计该用户在监控周期时长(MonitorPeriod)内所发送的短消息总条数。\n[0047] 具体的,可以通过设定第一计数器来实现计数,其初始值可以为0,在监控周期时长内,每确定主叫用户发送一条短消息,则该第一计数器加1。\n[0048] 步骤203、扫描短消息内容,获取短消息中包含的连续数字数列的最大长度。\n[0049] 若短消息内容中不包含任何连续数字数列,则最大长度为0。\n[0050] 所述最大长度可以用MaxContiNumLen来标识。\n[0051] 步骤204、判定短消息内容中是否包含达到限定长度的连续数字数列。\n[0052] 在本步骤中,可以判断该短消息包含的连续数字数列的最大长度是否达到设定的门限值要求,即判断MaxContiNumLen是否达到设定门限值,若是,则执行步骤205,否则,执行步骤206。\n[0053] 步骤205、在监控周期时长内,对主叫用户发送的包含达到限定长度的连续数字数列的短消息条数进行计数。\n[0054] 具体的,可以通过设定第二计数器来实现,其初始值可以为0,在监控周期时长内,每确定主叫用户发送一条包含达到限定长度的连续数字数列的短消息,则该第二计数器加\n1。\n[0055] 步骤206、在监控周期时长内,判定主叫用户发送的短消息总条数是否达到设定值。\n[0056] 在本步骤中,判断主叫用户发送的短消息总条数是否达到设定的短消息总数量设定值(TotalThred),若达到,则执行步骤207,否则,监控流程结束。\n[0057] 步骤207、在监控周期时长内,确定主叫用户发送的包含连续数字数列的短消息条数占短消息总条数的比率。\n[0058] 可以通过读取第二计数器的数值来获得在监控周期时长内,主叫用户发送的包含连续数字数列的短消息条数,通过读取第一计数器的数值来获得在监控周期时长内,主叫用户发送的短消息总条数。\n[0059] 在本步骤中,可以判断确定出的比率是否达到设定的:包含的连续数字数列最大长度达到门限 值的短 消息的 数量与发 送的 短消息 总数量的比率阈 值(ContiNumProportionThred),若达到,则执行步骤208,否则,监控流程结束。\n[0060] 步骤208、输出监控结果。\n[0061] 确定该主叫用户为垃圾短消息发送者,并将该监控结果输出,以便于后续根据该监控结果,对该主叫用户进行相应的识别、屏蔽等处理。\n[0062] 根据本发明实施例一和实施例二提供的方案,将包含的连续数字数列长度达到门限值的短消息确定为垃圾短消息,无需通过设定具体的关键字来确定连续数字数列类型的垃圾短消息,避免了关键字规则中难以预先准确设定通用关键字的问题,同时在确定在监控周期时长内,发送者发送的短消息总数量达到设定值的基础上,通过进一步确定在监控周期时长内,该发送者发送的连续数字数列类型的垃圾短消息与该发送者发送的短消息总数量的比率是否达到设定的阈值来确定该发送者是否为垃圾短消息发送者,避免单纯流量规则难以量化流量门限值的缺点,从而解决了本发明提出的技术问题。\n[0063] 实施例三、\n[0064] 本发明实施例三提供一种短消息监控装置,该装置的结构示意如图3所示,具体包括:\n[0065] 第一确定模块11用于确定发送短消息中包含的连续数字数列的长度达到门限值的短消息的发送者;第二确定模块12用于确定监控周期时长内,该发送者发送的短消息总数量达到设定值;第三确定模块13用于确定在所述监控周期时长内,该发送者发送的短消息中包含的连续数字数列的长度达到门限值的短消息数量与该发送者发送的短消息总数量的比率,是否达到设定阈值,若达到设定阈值,则将该发送者确定为垃圾短消息发送者。\n[0066] 第一确定模块11具体用于针对每一短消息,扫描该短消息的内容,确定该短消息的内容中包含有连续数字数列,并确定该短消息的内容中包含的每个连续数字数列的长度及该长度中的最大长度,若确定的最大长度达到门限值,则将该短消息确定为包含的连续数字数列的长度达到门限值的短消息。\n[0067] 第一确定模块11具体用于扫描短消息内容,在短消息内容中不包含连续数字数列时,确定该短消息内容中包含的连续数字数列的长度为0。\n[0068] 所述装置还包括发送模块14:\n[0069] 发送模块14用于将确定该发送者为垃圾短消息发送者的监控结果发送至数据库保存。\n[0070] 所述发送模块14还用于将该发送者在所述监控周期时长内发送的全部短消息发送至数据库保存。\n[0071] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
法律信息
- 2017-05-10
- 2014-06-11
实质审查的生效
IPC(主分类): H04W 4/14
专利申请号: 201110210547.0
申请日: 2011.07.26
- 2012-04-18
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-07-21
|
2009-01-16
| | |
2
| |
2009-01-07
|
2008-08-12
| | |
3
| |
2010-04-21
|
2009-10-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |