第2章 基于卷积神经网络的图像复原方法基础
2.1 卷积层
在计算机视觉领域,输入图像的尺寸通常较大。手写字体识别模型LeNet是最早的卷积神经网络(Convolutional Neural Network, CNN)之一。相较于仅使用全连接层搭建的网络结构,LeNet通过巧妙的设计,利用卷积、池化等操作进行特征提取。其中,卷积层具有局部连接和权重共享的特点,避免了较高的计算成本,并在完成分类识别任务方面表现出色。使用PyTorch实现LeNet的示例代码如算法2-1所示,该算法展示了如何定义LeNet的结构、准备数据加载器、编译(在PyTorch中称为配置优化器)及训练模型。
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_40_1.jpg?sign=1739405718-kJehE6kTy7yvMhxCVWeIQ3eamlL6vuW0-0-cbd556078a068af18aba6119fc089ff2)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_41_1.jpg?sign=1739405718-cLNTIdaezAaTBHHeqAGgeU8ecCsfEfc8-0-5cd24c73150315ae672b5c73f156dd98)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_42_1.jpg?sign=1739405718-yF7Vhzq8nFy9eFP45hUwPPsUec9JpsWA-0-d596b06f1d3ad6a1d264e5fda5ff7f21)
卷积层是卷积神经网络最重要的组成部分,其主要作用是自动学习和提取图像特征。卷积层包括一组滤波器(又称卷积核),通过对给定输入做卷积来生成输出特征图。