这是一个关于图像识别的正式教程

夏祥毅
2021-10-22 09:28:02 5

+关注

图像识别基础教程

本教程改编自2019年Fastai深度学习课程的第一课，并加入了许多补充和说明。完成本教程后，您将能够在任何图像数据集上构建和训练图像识别器，并充分了解底层模型架构和训练过程。

教程内容概览：

数据提取
数据可视化
模型训练
结果解释
模型层的冻结和解冻
微调

目标读者：

本教程面向希望使用CNN和ResNets进行图像分类学习的深度学习实践者，以及希望尝试fastai库的新手。

笔记本下载：

您可以在此处找到本教程的笔记本：Fastai-iNotes-iTutorials

运行环境：

要运行笔记本，您只需使用Google Colab打开它，并确保启用GPU后端。具体步骤如下： - 运行时 -> 更改运行时类型 -> 硬件加速器 -> GPU

1. 数据提取

我们将使用Oxford-IIIT宠物数据集，它包含了12个猫品种和25个狗品种。数据集可通过fastai数据集模块轻松下载和解压。

python URLs.PETS # 数据集的URL untar_data # 解压并下载数据文件

通过get_image_files获取所有图像文件路径，并利用正则表达式提取图像标签。这一步骤确保我们能够准确地将图像分类。

2. 数据可视化

训练数据样本由图像及其标签组成。图像大小为224x224，经过中心裁剪和缩放。我们使用show_batch函数展示少量图像。

```python

训练数据样本

(Image (3, 224, 224), Category scottish_terrier) ```

数据集包含37个类别，其中包括各种猫和狗品种。

3. 模型训练

我们使用预训练的ResNet34模型构建CNN学习器。预训练模型有助于快速收敛和高精度。

CNN与ResNets简介：

CNN：卷积神经网络通过一系列卷积层将图像转换为输出卷。这些层由前一层的神经元连接而成。
ResNets：残差网络通过引入“身份快捷连接”解决了深度网络中的降级问题，允许网络在更深的同时保持高性能。

4. 结果解释

训练完成后，我们可以通过可视化工具分析模型的分类效果。使用Classification Interpretation和plot_top_losses函数可以查看错误分类的图像及其损失值。

5. 冻结和解冻

默认情况下，使用预训练模型时，早期层会被冻结，仅训练最后一层。通过调用unfreeze函数，可以训练所有网络层。但需要注意的是，不同的层需要不同的学习率，以避免早期层的参数更新过多。

6. 微调

为了找到最优学习率，我们使用学习速率查找器。通过lr_find方法，我们可以确定适合微调模型的学习率。我们还探讨了1cycle策略，这是一种在训练过程中调整学习率的有效方法。

总结

通过本教程，您不仅学会了如何在数据集上构建和训练图像识别器，还掌握了预训练模型的迁移学习方法。这些技能将帮助您在自己的项目中取得成功。

希望以上内容符合您的需求，如果有任何进一步的修改或补充，请告知。

图灵汇

责任编辑：：夏祥毅

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

图像别的正式这是教程关于一个

王忠帅

2021-10-22