逻辑回归

admin • 2023-10-26 20:30 • 物联网

逻辑回归

二分类情况

对于二分类问题，在线性可分的情况下，试图构建一个判别式

′

{W'X'+b}

$W^{'} X^{'} + b$ ，为了便于操作将判别式增广为

{WX}

$W X$ 。

{

∈

{Wx_i}=begin{cases} >0, quad x_i in w_1,Y=1\ <0, quad x_i in w_2,Y=0 end{cases}

$W x_{i} = {> 0, x_{i} \in w_{1}, Y = 1 < 0, x_{i} \in w_{2}, Y = 0$
为了将其表示为概率的方式我们对概率建模，将其缩放为

[

]

[0,1]

$[0, 1]$ 的范围上，所以我们利用sigmoid函数

−

frac{1}{1+e^{-x}}

$\frac{1}{1 + e ^{- x}}$ 。

由此我们设分类为

w_1

$w_{1}$ 的概率为

(

∣

)

−

P(Y=1|x)=frac{1}{1+e^{-Wx}}

$P (Y = 1∣ x) = \frac{1}{1 + e ^{- W x}}$
设：

(

∣

)

(

)

(

∣

)

−

(

)

P(Y=1|x_i)=P(x_i)\ P(Y=0|x_i)=1-P(x_i)

$P (Y = 1∣ x_{i}) = P (x_{i}) P (Y = 0∣ x_{i}) = 1 - P (x_{i})$
由此构建似然函数：

(

)

∏

[

(

)

]

[

−

(

)

]

(

−

)

L(W)=prod[P(x_i)]^{y_i}[1-P(x_i)]^{(1-y_i)}

$L (W) = \prod [P (x_{i})]^{y_{i}} [1 - P (x_{i})]^{(1 - y_{i})}$

对似然函数取对数：

(

)

⁡

(

∏

[

(

)

]

[

−

(

)

]

(

−

)

∑

(

⁡

(

[

(

)

]

)

⁡

(

[

−

(

)

]

(

−

)

∑

(

⁡

(

[

(

)

]

)

(

−

)

⁡

(

[

−

(

)

]

)

∑

[

⋅

−

⁡

(

)

]

begin{aligned} In(L(W)) &=ln(prod[P(x_i)]^{y_i}[1-P(x_i)]^{(1-y_i)})\ &=sum (ln([P(x_i)]^{y_i})+ln([1-P(x_i)]^{(1-y_i)}))\ &=sum ({y_i}ln([P(x_i)])+{(1-y_i)}ln([1-P(x_i)]))\ &=sum[y_icdot Wx_i-ln(1+e^{Wx_i})] end{aligned}

$I n (L (W)) = ln (\prod [P (x_{i})]^{y_{i}} [1 - P (x_{i})]^{(1 - y_{i})}) = \sum (ln ([P (x_{i})]^{y_{i}}) + ln ([1 - P (x_{i})]^{(1 - y_{i})})) = \sum (y_{i} ln ([P (x_{i})]) + (1 - y_{i}) ln ([1 - P (x_{i})])) = \sum [y_{i} \cdot W x_{i} - ln (1 + e^{W x_{i}})]$
为了最大化似然，即最小化似然的负数

使似然除以样本总数n（减少梯度爆炸出现的概率），再乘以-1（将求最大值问题转化为求最小值问题

(

)

−

∑

(

⁡

(

[

(

)

]

)

⁡

(

[

−

(

)

]

(

−

)

J(W)=-frac{1}{N}sum (ln([P(x_i)]^{y_i})+ln([1-P(x_i)]^{(1-y_i)}))

$J (W) = - \frac{1}{N} \sum (ln ([P (x_{i})]^{y_{i}}) + ln ([1 - P (x_{i})]^{(1 - y_{i})}))$
采用梯度下降的方法：

∂

(

)

∂

−

∑

(

−

(

)

frac{partial J(W)}{partial W}=-frac{1}{N}sum (y_i-P(x_i))x_i

$\frac{\partial J ( W )}{\partial W} = - \frac{1}{N} \sum (y_{i} - P (x_{i})) x_{i}$
更新

$W$ :

−

∂

(

)

∂

为迭代次数

为学习率

W^{k+1}=W^{k}-alphafrac{partial J(W)}{partial W},quad k为迭代次数,alpha为学习率

$W^{k + 1} = W^{k} - α \frac{\partial J ( W )}{\partial W}, k 为迭代次数, α 为学习率$
当

∣

−

∣

||W^{k+1}-W^{k}||

$∣∣ W^{k + 1} - W^{k} ∣∣$ 小于阈值时或者当

$k$ 达到最大迭代次数时停止迭代。

逻辑回归是在线性回归的基础上加了一个 Sigmoid 函数（非线形）映射，使得逻辑回归称为了一个优秀的分类算法。本质上来说，两者都属于广义线性模型，但他们两个要解决的问题不一样，逻辑回归解决的是分类问题，输出的是离散值，线性回归解决的是回归问题，输出的连续值。

多分类问题

为了实现多分类，我们引入一个softmax函数：

softmax

(

)

∑

text{softmax}(x_i) = frac{e^{x_i}}{sum_j e^{x_j}}

$softmax (x_{i}) = \frac{e ^{x_{i}}}{\sum _{j} e ^{x_{j}}}$ 来代替Sigmoid函数，同构建模型：

Y=WX_i

$Y = W X_{i}$ ，其中

$Y$ 为一个列向量，第

$i$ 个数表示第

$i$ 个类别的概率。

其中修改损失函数:

(

)

−

[

∑

{

(

)

}

⋅

log

⁡

(

∑

)

]

J(W)=-frac{1}{n}left[sum_{i=1}^nsum_{j=1}^k 1_{{j^{(i)}=j}}cdotlog (frac{e^{Wx_i}}{sum_{l=1}^k e^{Wx_i}})right]

$J (W) = - \frac{1}{n} [i = 1 \sum n j = 1 \sum k 1_{{j^{(i)} = j}} \cdot lo g (\frac{e ^{W x_{i}}}{\sum _{l = 1 k} e ^{W x_{i}}})]$
其中

{

(

)

}

1_{{j^{(i)}=j}}

$1_{{j^{(i)} = j}}$ 表示第

$i$ 类分类正确时为1，否则为0，

$k$ 为类别数。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

机器学习算法逻辑回归

二维码

美颜SDK集成指南：为应用添加视频美颜功能

< <上一篇

【24种设计模式】单例模式（Singleton Pattern）

下一篇>>

搜索内容

逻辑回归

逻辑回归

二分类情况

多分类问题

最新文章

分类

标签云