Python中LSTM回归神经网络的时间序列预测-电子发烧友网

这个问题是国际航空乘客预测问题，数据是1949年1月到1960年12月国际航空公司每个月的乘客数量（单位：千人），共有12年144个月的数据。

数据趋势：

训练程序：

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import torch 
from torch import nn
from torch.autograd import Variable


#LSTM（Long Short-Term Memory）是长短期记忆网络
data_csv = pd.read_csv('C:/Users/my/Desktop/LSTM/data.csv',usecols=[1])
#pandas.read_csv可以读取CSV（逗号分割）文件、文本类型的文件text、log类型到DataFrame
#原有两列，时间和乘客数量，usecols=1：只取了乘客数量一列

plt.plot(data_csv)
plt.show()
#数据预处理
data_csv = data_csv.dropna() #去掉na数据
dataset = data_csv.values      #字典(Dictionary) values()：返回字典中的所有值。
dataset = dataset.astype('float32')   #astype(type):实现变量类型转换  
max_value = np.max(dataset)
min_value = np.min(dataset)
scalar = max_value-min_value
dataset = list(map(lambda x: x/scalar, dataset)) #将数据标准化到0~1之间
#lambda:定义一个匿名函数，区别于def
#map(f(x),Itera):map()接收函数f和一个list,把函数f依次作用在list的每个元素上,得到一个新的object并返回



'''
接着我们进行数据集的创建，我们想通过前面几个月的流量来预测当月的流量，
比如我们希望通过前两个月的流量来预测当月的流量，我们可以将前两个月的流量
当做输入，当月的流量当做输出。同时我们需要将我们的数据集分为训练集和测试
集，通过测试集的效果来测试模型的性能，这里我们简单的将前面几年的数据作为
训练集，后面两年的数据作为测试集。
'''python
def create_dataset(dataset,look_back=2):#look_back 以前的时间步数用作输入变量来预测下一个时间段
    dataX, dataY=[], []
    for i in range(len(dataset) - look_back):
        a = dataset[i:(i+look_back)]  #i和i+1赋值
        dataX.append(a)
        dataY.append(dataset[i+look_back])  #i+2赋值
    return np.array(dataX), np.array(dataY)  #np.array构建数组

data_X, data_Y = create_dataset(dataset)
#data_X: 2*142     data_Y: 1*142

#划分训练集和测试集，70%作为训练集
train_size = int(len(data_X) * 0.7)
test_size = len(data_X)-train_size
 
train_X = data_X[:train_size]
train_Y = data_Y[:train_size]
 
test_X = data_X[train_size:]
test_Y = data_Y[train_size:]
 
train_X = train_X.reshape(-1,1,2) #reshape中，-1使元素变为一行，然后输出为1列，每列2个子元素
train_Y = train_Y.reshape(-1,1,1) #输出为1列，每列1个子元素
test_X = test_X.reshape(-1,1,2)
 
 
train_x = torch.from_numpy(train_X) #torch.from_numpy(): numpy中的ndarray转化成pytorch中的tensor(张量)
train_y = torch.from_numpy(train_Y)
test_x = torch.from_numpy(test_X)


#定义模型 输入维度input_size是2，因为使用2个月的流量作为输入，隐藏层维度hidden_size可任意指定，这里为4
class lstm_reg(nn.Module):
    def __init__(self,input_size,hidden_size, output_size=1,num_layers=2):
        super(lstm_reg,self).__init__()
        #super() 函数是用于调用父类(超类)的一个方法，直接用类名调用父类
        self.rnn = nn.LSTM(input_size,hidden_size,num_layers) #LSTM 网络
        self.reg = nn.Linear(hidden_size,output_size) #Linear 函数继承于nn.Module
    def forward(self,x):   #定义model类的forward函数
        x, _ = self.rnn(x)
        s,b,h = x.shape   #矩阵从外到里的维数
                   #view()函数的功能和reshape类似，用来转换size大小
        x = x.view(s*b, h) #输出变为（s*b）*h的二维
        x = self.reg(x)
        x = x.view(s,b,-1) #卷积的输出从外到里的维数为s,b,一列
        return x

net = lstm_reg(2,4) #input_size=2，hidden_size=4
 
criterion = nn.MSELoss()  #损失函数均方差
optimizer = torch.optim.Adam(net.parameters(),lr=1e-2)
#构造一个优化器对象 Optimizer,用来保存当前的状态，并能够根据计算得到的梯度来更新参数
#Adam 算法:params (iterable)：可用于迭代优化的参数或者定义参数组的 dicts   lr:学习率


for e in range(10000):
    var_x = Variable(train_x) #转为Variable（变量）
    var_y = Variable(train_y)
 
    out = net(var_x)
    loss = criterion(out, var_y)
 
    optimizer.zero_grad() #把梯度置零，也就是把loss关于weight的导数变成0.
    loss.backward()  #计算得到loss后就要回传损失，这是在训练的时候才会有的操作，测试时候只有forward过程
    optimizer.step() #回传损失过程中会计算梯度，然后optimizer.step()根据这些梯度更新参数
    if (e+1)%100 == 0:
        print('Epoch: {}, Loss:{:.5f}'.format(e+1, loss.data[0]))
        
torch.save(net.state_dict(), 'net_params.pkl') #保存训练文件net_params.pkl
#state_dict 是一个简单的python的字典对象,将每一层与它的对应参数建立映射关系

测试程序：

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import torch 
from torch import nn
from torch.autograd import Variable
 
 
 
data_csv = pd.read_csv('C:/Users/my/Desktop/LSTM/data.csv',usecols=[1])
 
# plt.plot(data_csv)
# plt.show()
#数据预处理

data_csv = data_csv.dropna() #去掉na数据
dataset = data_csv.values #字典(Dictionary) values()：返回字典中的所有值。
dataset = dataset.astype('float32') # astype(type):实现变量类型转换  
max_value = np.max(dataset)
min_value = np.min(dataset)
scalar = max_value-min_value
dataset = list(map(lambda x: x/scalar, dataset)) #将数据标准化到0~1之间

def create_dataset(dataset,look_back=2):
    dataX, dataY=[], []
    for i in range(len(dataset)-look_back):
        a=dataset[i:(i+look_back)]
        dataX.append(a)
        dataY.append(dataset[i+look_back])
    return np.array(dataX), np.array(dataY)
 
data_X, data_Y = create_dataset(dataset)


class lstm_reg(nn.Module):
    def __init__(self,input_size,hidden_size, output_size=1,num_layers=2):
        super(lstm_reg,self).__init__()
 
        self.rnn = nn.LSTM(input_size,hidden_size,num_layers)
        self.reg = nn.Linear(hidden_size,output_size)
 
    def forward(self,x):
        x, _ = self.rnn(x)
        s,b,h = x.shape
        x = x.view(s*b, h)
        x = self.reg(x)
        x = x.view(s,b,-1)
        return x
 
 
net = lstm_reg(2,4)

net.load_state_dict(torch.load('net_params.pkl')) 

data_X = data_X.reshape(-1, 1, 2) #reshape中，-1使元素变为一行，然后输出为1列，每列2个子元素
data_X = torch.from_numpy(data_X) #torch.from_numpy(): numpy中的ndarray转化成pytorch中的tensor（张量）
var_data = Variable(data_X) #转为Variable（变量）
pred_test = net(var_data)  #产生预测结果
pred_test = pred_test.view(-1).data.numpy() #view(-1)输出为一行

plt.plot(pred_test, 'r', label='prediction')
plt.plot(dataset, 'b', label='real')
plt.legend(loc='best') #loc显示图像  'best'表示自适应方式
plt.show()

预测结果：

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4785

浏览量
101279
python

python

+关注

关注
56

文章
4811

浏览量
85103
LSTM

LSTM

+关注

关注
0

文章
59

浏览量
3799

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型(根据200个数据样本预测新的5+1个样本)——

发表于 12-20 10:43

结合小波变换的LSTM循环神经网络的税收预测

来去除税收数据中的噪声，提高模型的泛化能力。LSTM神经网络通过加入隐藏神经单元和门控单元能够更妤地学习到历史税收数据之间的相关关系，并进一步提取有效的输入

发表于 04-28 11:26 •10次下载

结合小波变换的<b class='flag-5'>LSTM</b>循环<b class='flag-5'>神经网络</b>的税收<b class='flag-5'>预测</b>

如何理解RNN与LSTM神经网络

在深入探讨RNN（Recurrent Neural Network，循环神经网络）与LSTM（Long Short-Term Memory，长短期记忆网络）神经网络之前，我们首先需要明

发表于 07-09 11:12 •759次阅读

LSTM神经网络的基本原理如何实现LSTM神经网络

LSTM（长短期记忆）神经网络是一种特殊的循环神经网络（RNN），它能够学习长期依赖信息。在处理序列数据时，如时间

发表于 11-13 09:53 •669次阅读

LSTM神经网络在时间序列预测中的应用

时间序列预测是数据分析中的一个重要领域，它涉及到基于历史数据预测未来值。随着深度学习技术的发展，长短期记忆（

发表于 11-13 09:54 •900次阅读

LSTM神经网络的优缺点分析

长短期记忆（Long Short-Term Memory, LSTM）神经网络是一种特殊的循环神经网络（RNN），由Hochreiter和Schmidhuber在1997年提出。LSTM

发表于 11-13 09:57 •2426次阅读

LSTM神经网络与传统RNN的区别

神经网络（RNN） RNN的基本结构 RNN是一种特殊的神经网络，它能够处理序列数据。在RNN中，每个时间步的输入都会通过一个循环结构传递到

发表于 11-13 09:58 •522次阅读

LSTM神经网络在语音识别中的应用实例

神经网络简介 LSTM是一种特殊的循环神经网络（RNN），它能够学习长期依赖关系。在传统的RNN中，信息会随着时间的流逝而逐渐消失，导致

发表于 11-13 10:03 •856次阅读

LSTM神经网络的结构与工作机制

LSTM（Long Short-Term Memory，长短期记忆）神经网络是一种特殊的循环神经网络（RNN），设计用于解决长期依赖问题，特别是在处理时间

发表于 11-13 10:05 •641次阅读

LSTM神经网络的训练数据准备方法

：一、数据收集与清洗数据收集：根据LSTM神经网络的应用场景（如时间序列预测、自然语言处理等），收集相关的

发表于 11-13 10:08 •925次阅读

如何使用Python构建LSTM神经网络模型

构建一个LSTM（长短期记忆）神经网络模型是一个涉及多个步骤的过程。以下是使用Python和Keras库构建LSTM模型的指南。 1. 安装必要的库首先，确保你已经安装了

发表于 11-13 10:10 •637次阅读

LSTM神经网络在图像处理中的应用

长短期记忆（LSTM）神经网络是一种特殊的循环神经网络（RNN），它能够学习长期依赖关系。虽然LSTM最初是为处理序列数据设计的，但近年来，

发表于 11-13 10:12 •697次阅读

深度学习框架中的LSTM神经网络实现

长短期记忆（LSTM）网络是一种特殊的循环神经网络（RNN），能够学习长期依赖信息。与传统的RNN相比，LSTM通过引入门控机制来解决梯度消失和梯度爆炸问题，使其在处理

发表于 11-13 10:16 •494次阅读

使用BP神经网络进行时间序列预测

使用BP（Backpropagation）神经网络进行时间序列预测是一种常见且有效的方法。以下是一个基于BP神经网络进行

发表于 02-12 16:44 •128次阅读

搜索历史

Python中LSTM回归神经网络的时间序列预测

评论

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型

什么是LSTM神经网络

结合小波变换的LSTM循环神经网络的税收预测

如何理解RNN与LSTM神经网络

LSTM神经网络的基本原理如何实现LSTM神经网络

LSTM神经网络在时间序列预测中的应用

LSTM神经网络的优缺点分析

LSTM神经网络与传统RNN的区别

LSTM神经网络在语音识别中的应用实例

LSTM神经网络的结构与工作机制

LSTM神经网络的训练数据准备方法

如何使用Python构建LSTM神经网络模型

LSTM神经网络在图像处理中的应用

深度学习框架中的LSTM神经网络实现

使用BP神经网络进行时间序列预测