开启AI世界的大门 —— 从人工智能到计算机视觉

开启AI世界的大门 —— 从人工智能到计算机视觉

1. 关于人工智能

1.1 初识人工智能

第一件事情,我们要先知道人工智能的基本概念,到底什么是真正的人工智能,在学术界有很多种表述方式,但是有一条被广泛接收的说法:人工智能是通过机器来模拟人类认知能力的技术。人工智能是当今计算机世界中的热门中的热门领域,它涉及了很多很多领域,涵盖了感知、学习、推理与决策等方面的能力

从实际应用的角度来说:人工智能最核心的能力就是根据给定的输入作出判断和预测

人工智能AI是什么时候诞生的呢?迄今为止它的发展经历了哪些阶段?这些就是我们需要关注的东西,让我们来串一串时间线,1955年达特茅斯会议标志着AI的诞生,这一年史称AI元年,AI世界的大门终于开始正式被人类探索,它将伴随人类文明走过很长很长的一段历史,在AI发展的过程中有过三次黄金期,而每一次的黄金期都是由于某一种新的概念或算法被提出

  • AI的第一个高峰及低谷:1957年罗森布拉特发明了第一款神经网络Perceptron,由此AI进入了第一个高峰期,1970年由于计算能力突破没能使及其完成大规模数据训练和复杂任务,由此AI进入了第一个低谷
  • AI的第二个高峰及低谷:1982年霍普菲尔德神经网络被提出,四年后1986年BP算法出现使得大规模神经网络的训练称为可能,这两次历史性的突破将AI推向了第二次高潮,大在1990年,AI计算机DARPA没能实现预期的效果,没能得到更多的资金支持,所以刚刚兴起的AI浪潮又一次进入低谷
  • AI的第三个高峰直至今天:2006年**Hinton提出了"深度学习"**神经网络使得人工智能性能得到了关键性的突破,2013年深度学习算法在语音和视觉识别上取得突破,由此AI进入了新的时代——感知智能时代

人工智能发展的基石——图灵测试

图灵测试是人工智能领域相当重要的一个概念,图灵测试的过程包括了3方:测试者、被测试者和机器,测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问,进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能但是这不是绝对的,不是说一台机器只要通过了图灵测试,它就是人工智能,图灵测试只是一个非常非常重要的参考和标准,要认定一台机器的人工智能,还需要很多方面的评判

1.2 人工智能的三大核心要素

人工智能的三大核心要素:数据、算法、算力

数据

人工智能的要素之一——数据,指的就是我们输入机器的数据,而机器根据我们的输入数据作出相应的判断和预测,随着互联网物联网的发展,关于整个世界的信息和数据越来越多,这为人工智能提供了足够丰富的,源源不断的营养,使得机器有足量的数据去学习,然后再反馈我们想要的结果

大数据技术的核心就是利用了数据的价值,机器学习就是利用数据价值的关键技术

算法

我们为机器提供数据之后,机器也只是拿到了数据仅此而已,更关键的就是算法,算法的概念非常简单,当我们交给计算机一个任务时,不但要告诉它做什么,还要告诉它怎么做,而算法就是关于"怎么做"的一系列指令

算力

算力就是帮助电脑快速运行、快速处理图像的一些硬件设施,例如CPU、GPU和NPU(深度学习加速器)等硬件设施,这些硬件设施就是实现算法的关键,使算法的实现迅速且准确

算力的突破——传统CPU与新兴运算加速技术+智能芯片

关于CPU与GPU之间的关系我们可以简单理解为:CPU + 并行计算 = GPU,而GPU在造好了之后是不能进行改装的,这个时候出现了FPGA来解决我们硬件设计的问题,它在造好之后用户是可以随时修改的,这就大大降低了开发的风险

还有一个很重要的概念我们需要了解一下:分布式运算,如果每一台计算机都是一个模块,所有的计算机按照一定规则分配任务后分头运算,最后再把计算结果汇合起来,这就是分布式运算

在这里插入图片描述

(图片来源于八斗人工智能——八斗学院王小天)

1.3 人工智能关系圈

在人工智能的发展历程中,具有里程碑意义的是机器学习的兴起和深度学习的突破,他们之间与人工智能之间有什么关系呢?人工智能关系圈是带领我们了解AI世界最重要的领航员

机器学习——一种实现人工智能的方法

机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及了所有人工智能领域,它主要使用归纳、综合而不是演绎

深度学习——一种实现机器学习的技术

深度学习是利用深度的神经网络,将模块处理得更复杂,从而使模型对数据的理解更加深入,是机器学习中基于对数据进行表征学习的方法,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本

深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性

人工神经网络——一种机器学习的算法

神经网络一般有输入层->隐藏层->输出层,一般来说隐藏层数量多于两层的神经网络就叫做深度神经网络,深度学习就是采用像深度神经网络这种深层架构的一种机器学习方法

机器学习是为了实现人工智能,深度学习是机器学习的一种

在这里插入图片描述

经典的机器学习过程

首先要准备训练数据(包括了很多类别标记label,也就是一些最能代表此类事物的特征集合),然后我们要根据我们想要的需求,去设计学习算法,使用学习算法训练好数据后就变成了我们的一个模型(例如决策树、神经网络等),我们将新数据样本(预测数据)传入模型后,模型会根据它学习过的能力,来给我们反馈数据

了解神经网络(人类的思考——生物神经网络)

人类的神经网络所能完成的事情大概可以解释为:在收到外部刺激后,神经元会将这个刺激转化为信息来传递给其他功能细胞,这些细胞在接收到这些信息后会作出相应的输出

人工神经网络就是模拟生物神经网络来建立的一种网状结构,其中的每一条神经元首先要有输入数据(刺激),还要有接收和处理这些数据的一个感知器,最后再作出输出,这些神经元交叉混合在一起,就形成了我们的人工神经网络,人工神经网络的逻辑结构包括:输入层、隐藏层和输出层,其每一层的功能就是我们上面所说的过程,这些过程相互配合和通信后,就可以实现我们想要的效果

但是隐藏层可不仅仅有一层,当人工神经网络具有多个隐藏层是,它就被称为深度神经网络,基于深度神经网络的机器学习就是深度学习

2. 计算机视觉(Computer Vision)

2.1 初识CV

万剑归宗!在学习计算机视觉之前,我们要先了解什么是计算机视觉,用一句话来概括的话,计算机视觉就是让计算机拥有人能所见、人能所识、人能所思的能力,就可以称之为计算机拥有视觉,即计算机视觉!(需要注意的是,不仅要让计算机有"看"的能力,也要有"认"和"想"的能力)

2.2 深度学习与CV及CV的应用

基于深度学习的计算机视觉,就是让计算机视觉具备"识别"的能力,以达到人工智能的目的,那怎么让它具备这个能力呢?很显然就是使用机器学习,使得机器能识别图像,CV与AI、ML和DL是相交的一个概念,我们会使用机器学习深度学习来实现我们CV的功能

CV有5大应用:

1.图像分类(使用卷积神经网络CNN) —— 线性整流层RELU(函数f=max(0,x)) 和 池化层POOL(根据输入参数取得每一块儿部分的最大值)

2.目标检测(使用R-CNN) —— 提取感兴趣区域再进行ConvNet(卷积)

3.语义分割(使用FCN网络) —— 将不同类别的物体分割然后对其进行上色(面向的是大概的类别)

4.实例分割 —— 将不同实例的物体进行分割再上色(面向的是实例对象)


版权声明:以上学习内容及配图来自或参考自——八斗人工智能
如果文章对您有所帮助,记得一键三连支持一下哦~

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>