机器学习 | CNN卷积神经网络

五小郎的学习笔记 2019-07-01

测试结果

最后两行分别为预测类别与真实类别。

机器学习 | CNN卷积神经网络

数据预览

这里的数据使用的是mnist数据集,大家可以将代码中的DOWNLOAD_MNIST值修改为True进行自动下载。

机器学习 | CNN卷积神经网络

机器学习 | CNN卷积神经网络

代码

import torch
import torch.nn as nn
import torch.utils.data as Data
import torchvision      # 数据库模块
import matplotlib.pyplot as plt

#训练整批数据多少次,这里为了节约时间,只训练一次
EPOCH=1
#每次批处理50个数据
BATCH_SIZE=50
#学习效率
LR=0.001
# 如果已经下载好了mnist数据就写上False
DOWNLOAD_MNIST = False  


#训练的数据集:Mnist手写数字
train_data=torchvision.datasets.MNIST(
    #保存或提取数据集的位置
    root='./mnist/',
    #该数据是训练数据
    train=True,
    #转换PIL.Image or numpy.ndarray成torch.FloatTensor (C x H x W), 训练的时候 normalize 成 [0.0, 1.0] 区间
    transform=torchvision.transforms.ToTensor(),
     #没下载就下载,下载了就不用再下了
    download=DOWNLOAD_MNIST,
)


#绘制一下数据集
#黑色的地方的值都是0, 白色的地方值大于0.
print(train_data.train_data.size())                 # (60000, 28, 28)
print(train_data.train_labels.size())               # (60000)
plt.imshow(train_data.train_data[2].numpy(), cmap='gray')
plt.title('%i' % train_data.train_labels[2])
plt.show()

#测试数据
test_data=torchvision.datasets.MNIST(root='./mnist/',train=False)

#批训练50samples,1 channel,28x28 (50, 1, 28, 28)
train_loader=Data.DataLoader(dataset=train_data,batch_size=BATCH_SIZE,shuffle=True)

#这里只测试了前2000个
#特征
test_x=torch.unsqueeze(test_data.test_data,dim=1).type(torch.FloatTensor)[:2000]/255.
#标签
test_y=test_data.test_labels[:2000]

#构建CNN模型
class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        #input shape(1,28,28)
        self.conv1=nn.Sequential(
            #卷积
            nn.Conv2d(
                in_channels=1,
                out_channels=16,
                #filter size
                kernel_size=5,
                #filter movement/step
                stride=1,
                 #如果想要con2d出来的图片长宽没有变化, 
                 #padding=(kernel_size-1)/2当stride=1
                padding=2,
            ),
            #output shape(16,28,28)
            #激励函数
            nn.ReLU(),
            #池化
            # 在2x2空间里向下采样,output shape(16,14,14)
            nn.MaxPool2d(kernel_size=2),
        )
        #input shape(16,14,14)
        self.conv2=nn.Sequential(
            nn.Conv2d(16,32,5,1,2),
            #output shape(32,14,14)
            #激励函数
            nn.ReLU(),
            #output shape(32,7,7)
            nn.MaxPool2d(2),
        )
        #全连接层——进行分类。这里将其分成了10类
        self.out=nn.Linear(32*7*7,10)

    def forward(self,x):
        x=self.conv1(x)
        x=self.conv2(x)
        #展平多维的卷积图成(batch_size,32*7*7)
        x=x.view(x.size(0),-1)
        output=self.out(x)
        return output

cnn=CNN()
print(cnn)


#训练
#优化器
optimizer=torch.optim.Adam(cnn.parameters(),lr=LR)
#损失函数
loss_func=nn.CrossEntropyLoss()

#开始训练
for epoch in range(EPOCH):
    for step,(b_x,b_y) in enumerate(train_loader):
        #将数据输入nn并且得到output
        output=cnn(b_x)
        #计算output与真实值之间的误差
        loss=loss_func(output,b_y)
        #清空上一步残余更新参数值
        optimizer.zero_grad()
        #误差反向传播,让参数进行更新
        loss.backward()
        #将更新后的参数值施加到nn的parameters上
        optimizer.step()



#测试:选取10个数据
test_output=cnn(test_x[:10])
pred_y=torch.max(test_output,1)[1].data.numpy().squeeze()
print(pred_y, 'prediction number')
print(test_y[:10].numpy(), 'real number')

# if __name__=='__main__':
#     print("hello word")

相关推荐