第2章 基于卷积神经网络的图像复原方法基础
2.1 卷积层
在计算机视觉领域,输入图像的尺寸通常较大。手写字体识别模型LeNet是最早的卷积神经网络(Convolutional Neural Network, CNN)之一。相较于仅使用全连接层搭建的网络结构,LeNet通过巧妙的设计,利用卷积、池化等操作进行特征提取。其中,卷积层具有局部连接和权重共享的特点,避免了较高的计算成本,并在完成分类识别任务方面表现出色。使用PyTorch实现LeNet的示例代码如算法2-1所示,该算法展示了如何定义LeNet的结构、准备数据加载器、编译(在PyTorch中称为配置优化器)及训练模型。
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_40_1.jpg?sign=1739406329-DO4MJFxJMjTf0XRwZCdAoe3u7oqvxz29-0-905045fa7e9702ba75e89b45a69a184a)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_41_1.jpg?sign=1739406329-sb2TSI2DzVmc62tUKuKcxcRigNMY50Hj-0-487b7d7d0a66018232d94363c967e417)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_42_1.jpg?sign=1739406329-KAON6ZXjNEScAHwXcglxWFY3eB9pTHmY-0-f6f036909d19d2b688ab22e071088cdc)
卷积层是卷积神经网络最重要的组成部分,其主要作用是自动学习和提取图像特征。卷积层包括一组滤波器(又称卷积核),通过对给定输入做卷积来生成输出特征图。