著录项信息
专利名称 | 基于最优模型的WEB舆情趋势预测方法 |
申请号 | CN200910167640.0 | 申请日期 | 2009-09-15 |
法律状态 | 撤回 | 申报国家 | 中国 |
公开/公告日 | 2010-09-08 | 公开/公告号 | CN101826090A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 电子科技大学 | 申请人地址 | 四川省成都市高新西区西源大道2006号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 电子科技大学 | 当前权利人 | 电子科技大学 |
发明人 | 高辉;傅彦;王沙沙 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公布了一种基于最优模型的WEB舆情趋势预测方法。该方法的基本思想就是首先对历史舆情事件进行分类获取舆情的几大类别,然后对分类获得的各个类别中事件的时间序列图进行聚类获取小类,通过保证均方误差和最小的方式求取各个小类的最优模型从而获取各个大类的最优模型集。当一个被预测对象到来时,对其进行分类处理,并选取其所属类中前期训练得到的最优模型进行匹配,从而选取出更符合本身发展趋势的模型和匹配时的变化比例,根据获得的变化比例对选取的模型进行反比例变换后获得被预测事件的长期发展趋势,这样不仅可以弥补现有网络预测技术无法预测出拐点的缺陷,而且可以使政府和监管部门采用及时有效的措施,更好的实现网络监管的功效。
1.基于最优模型的WEB舆情趋势预测方法,其特征在于,该方法包括以下步骤:
(1)、分析指定论坛的URL特征抓取网页,将信息文档和相关的数据信息保存到本地数据库;
(2)、对本地数据库中的信息文档进行聚类和分类,获得各类文档数据库;
(3)、从各类文档已有的数据库中,根据事件标记和时间标记获取每个事件所需参数(如单位时间的文档量等)的时间序列,或从Google trends网站上下载每个事件对应的Google趋势时间序列;
(4)、针对步骤(3)中所获得的各类事件的时间序列,建立相应的最优模型并保存,作为被预测对象趋势匹配的对象;
(5)、当新的舆情事件发生时,首先通过步骤(1)到步骤(3)获得该事件相应的一些时间序列和所属的大类。通过与其所属大类里的已训练得到的一些最优模型进行匹配,从而实现对新舆情的长期预测。
2.根据权利要求1所述的WEB舆情趋势预测方法,其特征在于对各类事件建立最优模型。
3.根据权利要求2所述的WEB舆情趋势预测方法,其特征在于,步骤(2)建立最优模型的具体包括以下步骤:
A、对某类事件的每个时间序列所对应的曲线进行平滑处理,具体方法为一维中值滤波法;
B、对每条曲线进行切周期处理,得出事件发展趋势的周期;
C、对切出来的周期进行时间长度和最高值的规范化处理,不改变曲线形状;
D、对规范化处理后的曲线进行分层聚类,选择逐级均值聚类算法;
E、对聚类后得到的各个小类求出其最优模型,该模型需要保证与该类所有曲线的均方误差和最小。
4.根据权利要求1所述的WEB舆情趋势预测方法,其特征在于,步骤(5)对新舆情选取最优模型进行长期预测的具体包括以下步骤:
A、对新舆情事件的时间序列T的斜率进行分析,如果斜率大于或等于阈值3则开始取值进行预测;
B、分别对时间序列T对应的曲线图横坐标和纵坐标以遍历的方式从1到100步长为0.1进行拉伸或压缩变换,从已有的最优模型中取出一个与变换后的测试数据集均方误差和最小的模型S,并保留此时测试数据集的横坐标和纵坐标变换比值k1和k2;
C、将时间序列T经过k1和k2变化得到的曲线T′替代与S中与其进行匹配的同样长度的曲线得到变化后最匹配的模型S′;
D、为了得到新来舆情事件的预测曲线,需要将S′的横坐标和纵坐标分别按1/k1和1/k2进行反变换得到长期预测曲线
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2011-12-20 | 2011-12-20 | | |
2 | | 2011-12-20 | 2011-12-20 | | |
3 | | 2012-11-29 | 2012-11-29 | | |
4 | | 2014-05-20 | 2014-05-20 | | |
5 | | 2014-05-20 | 2014-05-20 | | |
6 | | 2015-02-19 | 2015-02-19 | | |
7 | | 2012-11-29 | 2012-11-29 | | |
8 | | 2015-12-28 | 2015-12-28 | | |