SVM 超平面计算例题

admin • 2022-11-14 19:49 • 人工智能

SVM Summary

Example

Suppose the dataset contains two positive samples

(

)

[

]

x^{(1)}=[1,1]^T

$x^{(1)} = [1, 1]^{T}$ and

(

)

[

]

x^{(2)}=[2,2]^T

$x^{(2)} = [2, 2]^{T}$ , and two negative samples

(

)

[

]

x^{(3)}=[0,0]^T

$x^{(3)} = [0, 0]^{T}$ and

(

)

[

−

]

x^{(4)}=[-1,0]^T

$x^{(4)} = [- 1, 0]^{T}$ . Please calculate the SVM decision hyperplane.

Calculate

min

⁡

(

)

∑

(

)

(

)

(

)

(

)

−

∑

min_lambda {mathcal{J}(lambda)} = frac{1}{2}sum_{i=1}^Nsum_{j=1}^N lambda_ilambda_jy^{(i)}y^{(j)}(x^{(i)})^Tx^{(j)} - sum_{i=1}^Nlambda_i

$λ min J (λ) = \frac{1}{2} i = 1 \sum N j = 1 \sum N λ_{i} λ_{j} y^{(i)} y^{(j)} (x^{(i)})^{T} x^{(j)} - i = 1 \sum N λ_{i}$

⩾

∑

(

)

s.t. lambda_i geqslant 0, sum_{i=1}^Nlambda_iy^{(i)}=0

$s . t . λ_{i} ⩾ 0, i = 1 \sum N λ_{i} y^{(i)} = 0$
由

{

[

]

[

]

[

]

[

−

]

}

{

−

}

Dataset D:{x:{[1,1],[2,2],[0,0],[-1,0]},y:{1,1,-1,-1}}

$D a t a s e t D : {x : {[1, 1], [2, 2], [0, 0], [- 1, 0]}, y : {1, 1, - 1, - 1}}$ 可得下式：

min

⁡

(

)

(

)

−

⩾

−

min_lambda {mathcal{J}(lambda)} = frac{1}{2}(2lambda_1^2+8lambda_2^2+lambda_4^2+8lambda_1lambda_2+2lambda_1lambda_4+4lambda_2lambda_4) \- lambda_1-lambda_2-lambda_3-lambda_4\ s.t lambda_1 geqslant 0,lambda_2geqslant 0,lambda_3geqslant 0,lambda_4geqslant 0\ lambda_1+lambda_2-lambda_3-lambda_4 = 0

$λ min J (λ) = \frac{1}{2} (2 λ_{12} + 8 λ_{22} + λ_{42} + 8 λ_{1} λ_{2} + 2 λ_{1} λ_{4} + 4 λ_{2} λ_{4}) - λ_{1} - λ_{2} - λ_{3} - λ_{4} s . t λ_{1} ⩾ 0, λ_{2} ⩾ 0, λ_{3} ⩾ 0, λ_{4} ⩾ 0 λ_{1} + λ_{2} - λ_{3} - λ_{4} = 0$
since

→

−

lambda_1+lambda_2 = lambda_3+lambda_4 to lambda_3 = lambda_1+lambda_2 - lambda_4

$λ_{1} + λ_{2} = λ_{3} + λ_{4} \to λ_{3} = λ_{1} + λ_{2} - λ_{4}$ :

min

⁡

(

)

−

⩾

⟹

求

偏

导

{

∂

−

∂

−

∂

min_lambda {mathcal{J}(lambda)} = lambda_1^2+4lambda_2^2+frac{1}{2}lambda_4^2+4lambda_1lambda_2+lambda_1lambda_4+2lambda_2lambda_4 - 2lambda_1-2lambda_2\ s.t lambda_1 geqslant 0,lambda_2geqslant 0 \ \ Longrightarrow ^{求偏导}\ left{begin{matrix} frac{partial mathcal{J}}{partial lambda_1} = 2lambda_1 +4lambda_2+lambda_4-2=0 \ frac{partial mathcal{J}}{partial lambda_2} = 4lambda_1 +8lambda_2+2lambda_4-2=0 \ frac{partial mathcal{J}}{partial lambda_4} = lambda_1 +2lambda_2+lambda_4=0 end{matrix}right.

$λ min J (λ) = λ_{12} + 4 λ_{22} + \frac{1}{2} λ_{42} + 4 λ_{1} λ_{2} + λ_{1} λ_{4} + 2 λ_{2} λ_{4} - 2 λ_{1} - 2 λ_{2} s . t λ_{1} ⩾ 0, λ_{2} ⩾ 0 ⟹^{求偏导} ⎩ ⎨ ⎧ \frac{\partial J}{\partial λ _{1}} = 2 λ_{1} + 4 λ_{2} + λ_{4} - 2 = 0 \frac{\partial J}{\partial λ _{2}} = 4 λ_{1} + 8 λ_{2} + 2 λ_{4} - 2 = 0 \frac{\partial J}{\partial λ _{4}} = λ_{1} + 2 λ_{2} + λ_{4} = 0$
Lagrange无解，所以极小值在边界上：

令 $lambda_1 = 0， lambda_3 = lambda_1+lambda_2 - lambda_4 λ1=0，λ3=λ1+λ2−λ4带入 J ( λ ) mathcal{J}(lambda) J(λ)中，得： J ( λ ) = 4 λ 2 2 + 1 2 λ 4 2 + + 2 λ 2 λ 4 − 2 λ 2 ⟹ 求偏导 { ∂ J ∂ λ 2 = 8 λ 2 + 2 λ 4 − 2 = 0 ∂ J ∂ λ 4 = 2 λ 2 + λ 4 = 0 ⟹ { λ 2 = 1 2 λ 4 = − 1 ( ≤ 0 不满足 s . t . ) 再令： λ 2 = 0 , 则 λ 4 = 0 ， J ( λ ) = 0 ；或 λ 4 = 0 , 则 λ 2 = 1 4 ， J ( λ ) = − 1 4 ； mathcal{J}(lambda) = 4lambda_2^2+frac{1}{2}lambda_4^2++2lambda_2lambda_4 -2lambda_2 \ \ Longrightarrow ^{求偏导}\ left{begin{matrix} frac{partial mathcal{J}}{partial lambda_2} = 8lambda_2+2lambda_4-2=0 \ frac{partial mathcal{J}}{partial lambda_4} = 2lambda_2+lambda_4=0 end{matrix}right. Longrightarrow left{begin{matrix} lambda_2=frac{1}{2} \ lambda_4=-1(le0 不满足s.t.) end{matrix}right.\ 再令：\ lambda_2 = 0,则lambda_4=0， mathcal{J}(lambda) = 0；\ 或lambda_4 = 0,则lambda_2=frac{1}{4}， mathcal{J}(lambda) = -frac{1}{4}； J(λ)=4λ22+21λ42++2λ2λ4−2λ2⟹求偏导{∂λ2∂J=8λ2+2λ4−2=0∂λ4∂J=2λ2+λ4=0⟹{λ2=21λ4=−1(≤0 不满足s.t.)再令：λ2=0,则λ4=0，J(λ)=0；或λ4=0,则λ2=41，J(λ)=−41；$

同理可得：

$lambda_2 = 0 λ2=0 λ 1 = 0 , 则 λ 4 = 0 ， J ( λ ) = 0 ；或 λ 4 = 0 , 则 λ 1 = 1 ， J ( λ ) = − 1 ； lambda_1 = 0,则lambda_4=0， mathcal{J}(lambda) = 0；\ 或lambda_4 = 0,则lambda_1=1， mathcal{J}(lambda) =-1； λ1=0,则λ4=0，J(λ)=0；或λ4=0,则λ1=1，J(λ)=−1；$
$lambda_3 = 0 λ3=0 λ 1 = 0 , 则 λ 2 = 2 13 ， J ( λ ) = − 2 13 ；或 λ 2 = 0 , 则 λ 1 = 2 5 ， J ( λ ) = − 2 5 ； lambda_1 = 0,则lambda_2=frac{2}{13}， mathcal{J}(lambda) = -frac{2}{13}；\ 或lambda_2 = 0,则lambda_1=frac{2}{5}， mathcal{J}(lambda) =-frac{2}{5}； λ1=0,则λ2=132，J(λ)=−132；或λ2=0,则λ1=52，J(λ)=−52；$
$lambda_4 = 0 λ4=0 λ 1 = 0 , 则 λ 2 = 1 4 ， J ( λ ) = − 1 4 ；或 λ 2 = 0 , 则 λ 1 = 1 ， J ( λ ) = − 1 ； lambda_1 = 0,则lambda_2=frac{1}{4}， mathcal{J}(lambda) = -frac{1}{4}；\ 或lambda_2 = 0,则lambda_1=1， mathcal{J}(lambda) =-1； λ1=0,则λ2=41，J(λ)=−41；或λ2=0,则λ1=1，J(λ)=−1；综上： λ 1 , 2 , 3 , 4 = { 1 , 0 , 1 , 0 } lambda_{1,2,3,4} ={1,0,1,0} λ1,2,3,4={1,0,1,0} { W = ∑ i = 1 N λ i y ( i ) x ( i ) b = y ( j ) − ∑ i = 1 N λ i y ( i ) ( x ( i ) ) T x ( j ) ⟹ { W = [ 1 , 1 ] T b = − 1 ⟹ x ( 1 ) + x ( 2 ) − 1 = 0 left{begin{matrix} W=sum_{i=1}^{N} lambda_{i} y^{(i)} boldsymbol{x}^{(i)}\ b=y^{(j)}-sum_{i=1}^{N} lambda_{i} y^{(i)}left(x^{(i)}right)^{T} x^{(j)} end{matrix}right. Longrightarrow left{begin{matrix} W = [1,1]^T\ b=-1 end{matrix}right. \Longrightarrow x^{(1)}+x^{(2)} -1 =0 {W=∑i=1Nλiy(i)x(i)b=y(j)−∑i=1Nλiy(i)(x(i))Tx(j)⟹{W=[1,1]Tb=−1⟹x(1)+x(2)−1=0$

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

支持向量机算法

二维码

有含金量的AI证书

< <上一篇

机器学习-集成算法

下一篇>>

搜索内容

SVM 超平面计算例题

SVM Summary

Example

Calculate

最新文章

分类

标签云