贝叶斯分类器 (3)

目录

错误率与风险

朴素贝叶斯分类器


错误率与风险

书接上回,我们讲到最大后验概率,我们期望把概率最大时对应的属性,当做它最终的结果。

我们自然也会思考,这样做,我们的犯错率有多大?

 什么意思?就是说,在条件x的情况下,预测失误的概率(即犯错率)为1减去预测正确概率后的值。是不是有一种听君一席话,胜似一席话的感受?

那么,看懂了上述式子后,我们继续推进。不同的错误带来的损失不尽相同。比如说,如果我们把病人预测成健康的人,会导致他没能及时治疗,其损失肯定远大于把健康人预测成了病人。

显然,对每个样本x ,若 h 能最小化条件风险R(h(x)|x),则总体风险将被最小化.这就产生了贝叶斯判定准则:为了使总体风险最小,只需在每个样本x上选择那个能使条件风险R(c|x)最小的类别,即 :

 我们将h*称为贝叶斯分类器,与之对应的R(h*)称作贝叶斯风险,1-R(h*)则反映了分类器所能达到的最好性能。

更一般的,如果我们希望最小化分类错误率,即预测错误损失为1,预测成功损失为0,这样我们预测的类别,就又会变成算出最大后验概率时所对应的类别。

朴素贝叶斯分类器

讲解这方面知识,我觉得先上一个例子会好一些

好啦,现在我们决定给人美心善的伍老师找对象啦,伍老师决定从身高、帅不帅、渣不渣、声音好不好听四个角度对前来相亲的男嘉宾进行考察,再决定嫁不嫁。前来相亲的男嘉宾的条件极其结果如下: 

  那么根据上面的结果(伍老师可没有养鱼啊,因为种种原因王二麻子和朱大标不能娶伍老师),此时,高、不帅、不渣、声音好听的小明前来相亲,请替伍老师判断,该不该嫁?

对于朴素贝叶斯分类器,它的思想是避开联合概率,而采用“属性条件独立性假设”。

什么意思?就是说每个属性独立的对分类的结果发生影响。结合例子也就是说这四个属性互不影响(比如说,这个男嘉宾高不高不影响他渣不渣),单独对伍老师嫁不嫁起作用(比如说,渣不渣和高不高单独对她嫁不嫁起作用)。

所以,我们有:

注意x 是一个向量哦

我们发现,分母P(x)是个固定的值,对于分类没有影响,所以基于贝叶斯判定准则,我们只需要求出:

那么,现在的问题转化为,我们要算出嫁给高、不帅、不渣、声音好听的小明的概率,与不嫁给高、不帅、不渣、声音好听的小明的概率。把二者作比较,如果嫁的概率高于不嫁的概率,那么最终会选择嫁,反之则不嫁。

看得出来,相貌虽然很重要,但是朴素贝叶斯分类器都觉得伍老师不是一个太注重他人外在的人,同时让我们恭喜男女嘉宾牵手成功!!

咳咳,扯远了,学到这里,相信大家已经对贝叶斯分类器有一定了解了。不过,贝叶斯分类器的学习还没有结束哦。欲知后事如何,请您点赞加关注,您的点赞加关注是小编写下去最大的动力!

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>