神经网络入门（手写体的识别torch+jupyter+Mnist数据集）

admin • 2022-12-20 20:01 • 人工智能

前言：本文记录一下深度学习的学习过程，之前虽然看过很多次相关的项目，但是一直没有养成记录的好习惯，就导致了边学边忘的后果，写这边博客就是为了记录一下自己的学习过程，加深一下对神经网络搭建流程的印象。

数据集的选择，因为本文就是一篇入门级的博客，所以这里数据集选择的是mnist数据集，相对简单、易懂。

话不多说，直接上代码：

结果如下：

可以看出，mnist数据集的训练集有5000张图象，其中每一张都是灰度图像，都是（28，28）的。

这里.mm就是相乘的意思，矩阵乘法，下面进行一个简单的测试，取了训练集的64个，用最简单的全连接层，也就y=kx+b，作为前线传播的，来计算64个样本的损失，可以看出，是完全没有问题的。

这里采用的网络很简单，就两个全连接以及一个输出层，就不多做赘述了。网络结构如下：

可用name_parameters函数来打印网络的参数

值得注意的是，训练时需要加梯度下降，因为需要更新，而验证时只是起到一个检测的作用，不需要进行梯度下降

在训练进行梯度更新时，要注意要把之前的梯度清零，因为torch的机制中梯度是累加的。

这里的25，就相当于epoch

结果如下：

改进的方式有很多，加入dropout等等，这里就不在改了，下面总结一下代码的总体流程：

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

jupyter 深度学习

二维码

)">

Orangepi 5 Unixbench基准测试结果

神经网络算法有哪几种？神经网络算法预测模型

下一篇>>