因此，出现同一图像的视角不同（比如旋转一张图片）、光照不同（从不同的角度照射统一物体），物体的尺度大小不同（小孩拿着电脑与姚明拿着电脑），物体被遮挡，物体形变（猫站着、躺着......），图像背景出现杂波（北极狐与背景融为一体），类内形变（都是椅子但却有很多样式），运动模糊（小鸟摆头导致拍摄时出现模糊）......这些情况时，对于机器来说，分类任务是很困难的。

三、基于规则的方法是否可行？

基于规则就是人来提取特征，人来描述图像，通常采用硬编码的方式，与机器学习无关，此种基于规则的方法也是不可行的，所以这里不再赘述，大家也不需要去了解。

四、什么是数据驱动的图像分类范式？

数据驱动的图像分类方法是指通过构建数据集并设计一个分类器，让分类器去学习数据集中的规律，将学习后的分类器用于图像分类，看不懂没关系，下面我们详解。数据驱动的图像分类方法有三个步骤：数据集构建、分类器设计与学习、分类器决策。

数据集构建

例如我们将10000张猫和10000张狗的图片收集在一起，并分别为其打上标签（狗的标签可打为1，猫的标签可打为2），这就是数据集构建。
分类器设计与学习

分类器设计就是设计一个模型，例如逻辑回归模型、ResNet等，分类器学习就是将模型的参数填上（最开始都是随机填）并不断更新（最开始填的肯定不好，所以要让计算机帮我们更新参数）以使得我们设计的模型能以更高的准确率来分类图像，这个参数更新的过程就是学习。
分类器决策

分类器决策就是将学习完毕的模型用于实际的分类任务中，这应该很好理解。

其中最重要的就是分类器设计与学习（下面的图看不懂没关系，待我的下一篇笔记更新基本就懂了）：

五、常用的分类任务评价指标是什么？

正确率（accuracy）= 分对的样本数/全部样本数
错误率（error rate) = 1 – 正确率
Top1指标：分类器对某一幅有小猫的图像输出的预测结果为[猫，狗，车，树，梨]，其第一个预测结果是猫，则预测正确，若输出结果为 [狗，猫，车，树，梨]，因为第一个预测结果不是猫，即使第二个预测结果正确，最终预测结果都算错误。
Top5指标：只要输出的5个预测结果中有一个是正确的，那就算预测正确。所以不管是[猫，狗，车，树，梨]还是[狗，猫，车，树，梨]，都算预测正确。

感谢您的阅读，若您认可我写的文章，麻烦帮忙点个赞，谢谢！

I am BoyCZ

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

python 人工智能分类计算机视觉

二维码

使用conda或pip导出python环境

< <上一篇

行人属性识别开源项目

下一篇>>

搜索内容

（一）图像分类任务介绍 Image Classification

一、什么是图像分类任务？它有哪些应用场景？

二、图像分类任务的难点？

三、基于规则的方法是否可行？

四、什么是数据驱动的图像分类范式？

数据集构建

分类器设计与学习

分类器决策

五、常用的分类任务评价指标是什么？

最新文章

分类

标签云