Pytorch（二） —— 激活函数、损失函数及其梯度

admin • 2022-06-29 12:23 • 人工智能

Pytorch（二） —— 激活函数、损失函数及其梯度

1.激活函数
2.损失函数
- 2.1 MSE
- 2.2 CorssEntorpy
3. 求导和反向传播
- 3.1 求导
- 3.2 反向传播

1.激活函数

1.1 Sigmoid / Logistic

(

)

−

′

(

)

(

−

)

delta(x)=frac{1}{1+e^{-x}}\delta'(x)=delta(1-delta)

$δ (x) = \frac{1}{1 + e ^{- x}} δ^{'} (x) = δ (1 - δ)$

import matplotlib.pyplot as plt
import torch.nn.functional as F
x = torch.linspace(-10,10,1000)
y = F.sigmoid(x)
plt.plot(x,y)
plt.show()

1.2 Tanh

(

)

−

∂

(

)

∂

−

(

)

tanh(x)=frac{e^x-e^{-x}}{e^x+e^{-x}}\frac{partial tanh(x)}{partial x}=1-tanh^2(x)

$t a n h (x) = \frac{e ^{x} - e ^{- x}}{e ^{x} + e ^{- x}} \frac{\partial t a n h ( x )}{\partial x} = 1 - t a n h^{2} (x)$

import matplotlib.pyplot as plt
import torch.nn.functional as F
x = torch.linspace(-10,10,1000)
y = F.tanh(x)
plt.plot(x,y)
plt.show()

1.3 ReLU

(

)

(

)

f(x)=max(0,x)

$f (x) = m a x (0, x)$

import matplotlib.pyplot as plt
import torch.nn.functional as F
x = torch.linspace(-10,10,1000)
y = F.relu(x)
plt.plot(x,y)
plt.show()

1.4 Softmax

∑

∂

{

(

−

)

−

≠

p_i=frac{e^{a_i}}{sum_{k=1}^N{e^{a_k}}}\ frac{partial p_i}{partial a_j}=left{ begin{array}{lc} p_i(1-p_j) & i=j \ -p_ip_j&ineq j\ end{array} right.

$p_{i} = \frac{e ^{a_{i}}}{\sum _{k = 1 N} e ^{a_{k}}} \frac{\partial p _{i}}{\partial a _{j}} = {p_{i} (1 - p_{j}) - p_{i} p_{j} i = j i \neq = j$

import torch.nn.functional as F
logits = torch.rand(10)
prob = F.softmax(logits,dim=0)
print(prob)

tensor([0.1024, 0.0617, 0.1133, 0.1544, 0.1184, 0.0735, 0.0590, 0.1036, 0.0861,
        0.1275])

2.损失函数

2.1 MSE

import torch.nn.functional as F
x = torch.rand(100,64)
w = torch.rand(64,1)
y = torch.rand(100,1)
mse = F.mse_loss(y,x@w)
print(mse)

tensor(238.5115)

2.2 CorssEntorpy

import torch.nn.functional as F
x = torch.rand(100,64)
w = torch.rand(64,10)
y = torch.randint(0,9,[100])
entropy = F.cross_entropy(x@w,y)
print(entropy)

tensor(3.6413)

3. 求导和反向传播

3.1 求导

Tensor.requires_grad_()
torch.autograd.grad()

import torch.nn.functional as F
import torch
x = torch.rand(100,64)
w = torch.rand(64,1)
y = torch.rand(100,1)
w.requires_grad_()
mse = F.mse_loss(x@w,y)
grads = torch.autograd.grad(mse,[w])
print(grads[0].shape)

torch.Size([64, 1])

3.2 反向传播

Tensor.backward()

import torch.nn.functional as F
import torch
x = torch.rand(100,64)
w = torch.rand(64,10)
w.requires_grad_()
y = torch.randint(0,9,[100,])
entropy = F.cross_entropy(x@w,y)
entropy.backward()
w.grad.shape

torch.Size([64, 10])

by CyrusMay 2022 06 28

人生只是须臾的刹那
人间只是天地的夹缝
——————五月天（因为你所以我）——————

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

二维码

在3Dslicer中使用opencv连接相机

< <上一篇

Opencv导入后无代码提示，1秒解决！

下一篇>>

搜索内容

Pytorch（二） —— 激活函数、损失函数及其梯度

Pytorch（二） —— 激活函数、损失函数及其梯度

1.激活函数

1.1 Sigmoid / Logistic

1.2 Tanh

1.3 ReLU

1.4 Softmax

2.损失函数

2.1 MSE

2.2 CorssEntorpy

3. 求导和反向传播

3.1 求导

3.2 反向传播

最新文章

分类

标签云