(一)图像分类任务介绍 Image Classification

目录

一、什么是图像分类任务?它有哪些应用场景?

二、图像分类任务的难点?

三、基于规则的方法是否可行?

四、什么是数据驱动的图像分类范式?

数据集构建

分类器设计与学习

分类器决策

五、常用的分类任务评价指标是什么? 


一、什么是图像分类任务?它有哪些应用场景?

        图像分类任务是计算机视觉中的核心任务,其目标是
根据图像
信息中所反映的不同
特征
,把不同类别的
图像区分
开来。 
图像分类:从已知的类别标签集合中为给定的输入图片选定一个类别标签(标签:狗,猫,卡车,飞机,...)。
例如我们分别将下面两张图片分类成狗、绿玉藤:

二、图像分类任务的难点?

        对于人来说,完成上述的图像分类任务简直轻而易举,我们看到的是图像,但对于机器也就是计算机来说,它看到的是字节数据

因此,出现同一图像的视角不同(比如旋转一张图片)、光照不同(从不同的角度照射统一物体),物体的尺度大小不同(小孩拿着电脑与姚明拿着电脑),物体被遮挡,物体形变(猫站着、躺着......),图像背景出现杂波(北极狐与背景融为一体),类内形变(都是椅子但却有很多样式),运动模糊(小鸟摆头导致拍摄时出现模糊)......这些情况时,对于机器来说,分类任务是很困难的。

 ​​​​​​                   

              

                   

三、基于规则的方法是否可行?

         基于规则就是人来提取特征,人来描述图像,通常采用硬编码的方式,与机器学习无关,此种基于规则的方法也是不可行的,所以这里不再赘述,大家也不需要去了解。

四、什么是数据驱动的图像分类范式?

         数据驱动的图像分类方法是指通过构建数据集并设计一个分类器,让分类器去学习数据集中的规律,将学习后的分类器用于图像分类,看不懂没关系,下面我们详解。数据驱动的图像分类方法有三个步骤:数据集构建、分类器设计与学习、分类器决策。

  1. 数据集构建

    例如我们将10000张猫和10000张狗的图片收集在一起,并分别为其打上标签(狗的标签可打为1,猫的标签可打为2),这就是数据集构建。

  2. 分类器设计与学习

    分类器设计就是设计一个模型,例如逻辑回归模型、ResNet等,分类器学习就是将模型的参数填上(最开始都是随机填)并不断更新(最开始填的肯定不好,所以要让计算机帮我们更新参数)以使得我们设计的模型能以更高的准确率来分类图像,这个参数更新的过程就是学习。

  3. 分类器决策

    分类器决策就是将学习完毕的模型用于实际的分类任务中,这应该很好理解。

其中最重要的就是分类器设计与学习(下面的图看不懂没关系,待我的下一篇笔记更新基本就懂了)

五、常用的分类任务评价指标是什么? 

  • 正确率(accuracy)= 分对的样本数/全部样本数
  • 错误率(error rate) = 1 – 正确率
  • Top1指标:分类器对某一幅有小猫的图像输出的预测结果为[,狗,车,树,梨],其第一个预测结果是猫,则预测正确,若输出结果为 [狗,,车,树,梨],因为第一个预测结果不是猫,即使第二个预测结果正确,最终预测结果都算错误。
  • Top5指标:只要输出的5个预测结果中有一个是正确的,那就算预测正确。所以不管是[,狗,车,树,梨]还是[狗,,车,树,梨],都算预测正确。

感谢您的阅读,若您认可我写的文章,麻烦帮忙点个赞,谢谢!

I am BoyCZ

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>