著录项信息
专利名称 | 基于LSTM和DCGAN的时序性图像预测方法 |
申请号 | CN201910084351.8 | 申请日期 | 2019-01-29 |
法律状态 | 实质审查 | 申报国家 | 中国 |
公开/公告日 | 2019-05-31 | 公开/公告号 | CN109829495A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 南京信息工程大学 | 申请人地址 | 江苏省南京市浦口区宁六路219号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 南京信息工程大学 | 当前权利人 | 南京信息工程大学 |
发明人 | 方巍;张飞鸿;丁叶文 |
代理机构 | 南京苏高专利商标事务所(普通合伙) | 代理人 | 吴海燕 |
摘要
本发明公开了一种基于LSTM和DCGAN的时序性图像预测方法,将DCGAN出色的特征捕捉能力与LSTM进行结合,可使得预测的图像数据可视化,便于直接观察;经过改进后的LSTM网络内部具有卷积特性,能直接学习到图像数据的二维空间特征;为减少其内部学习复杂度,将传统的输入图像改为输入特征;特征来源于DCGAN的提取,相对于原始图像在维度方面有了很大的简化,使得整体网络可控。本发明通过DCGAN很好的降低了特征维度,解决了高维不可计算的问题;改进后的LSTM能够更好地学习到时序性特征,从而实现更精确的预测;整体网络结构在连接方法上遵从栈式级联策略,为控制网络深度提供保障。本发明提出的时序性图像预测模型架构理论上适用于所有的时序性图像。
1.一种基于LSTM和DCGAN的时序性图像预测方法,其特征在于,包括步骤:
(1)构建DCGAN编码器,包括编码模块和解码模块,两个模块之间接入LSTM时序预测网络;
(2)对构建的编码器进行训练,前馈传播完成后,计算损失函数,对编码器进行整体参数调优;
(3)DCGAN编码器内部,编码模块、解码模块和LSTM的连接处都采用栈式级联策略;
(4)使用LSTM时序预测网络,以DCGAN编码器中编码模块的输出,即编码模块提取到的输入时间序列的时序特征信息,作为LSTM时序预测网络的输入,进行未来时段输出序列预测。
2.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤1中,编码模块对收集的图像提取空间特征,LSTM时序预测网络对提取到的特征进行预测,解码模块对预测的结果进行图像复原。
3.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤2中,在编码器的损失函数中引入正则化概念优化算法。
4.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤2中,在网络训练过程中,采用学习率衰减策略加快训练速度。
5.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤3中,所述栈式级联策略对每一层网络进行单独训练,并将输出作为下一层的输入。
6.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤4具体为:
(4.1)由编码模块获取输入时间序列,将序列转化为固定大小状态向量,完成关于输入时间序列的时序特征提取,将整个输入序列的信息量保存在LSTM神经元的细胞状态St中;
(4.2)LSTM预测模块将上述神经元的细胞状态作为LSTM预测模块细胞起始状态,输出未来时段的预测序列。
7.根据权利要求1所述的基于LSTM和DCGAN的时序性图像预测方法,其特征在于,所述步骤4包括单帧预测和序列预测;单帧预测完成预测下一帧图像;序列预测输出固定时段的多个连续帧图像。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |