1. 求导

1.1 求导公式

在这里插入图片描述

1.2 求导含义

  • 导数:表示某个瞬间的变化量
    • x的 “微小变化” 将导致函数f(x)的值在多大程度上发生变化
    • 微小变化h无限趋近0
      d f ( x ) d x = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \begin{aligned} \frac{df(x)}{dx}&=\lim_{h \rightarrow 0} \frac{f(x+h)-f(x)}{h} \end{aligned} dxdf(x)=h0limhf(x+h)f(x)

2. 常见激活函数

2.1 sigmoid函数

  • 原函数
    s i g m o i d ( x ) = 1 1 + e − x \begin{aligned} sigmoid(x) &= \frac{1}{1 +e^{-x}} \end{aligned} sigmoid(x)=1+ex1

  • 函数图
    在这里插入图片描述

  • 求导过程
    s i g m o i d ′ ( x ) = ( 1 1 + e − x ) ′ = 0 − ( 1 + e − x ) ′ ( 1 + e − x ) 2 = e − x ( 1 + e − x ) 2 = 1 + e − x − 1 ( 1 + e − x ) ( 1 + e − x ) = 1 + e − x − 1 ( 1 + e − x ) . 1 ( 1 + e − x ) = [ 1 − 1 ( 1 + e − x ) ] . 1 ( 1 + e − x ) = [ 1 − s i g m o i d ( x ) ] ∗ s i g m o i d ( x ) \begin{aligned} sigmoid'(x) &= (\frac{1}{1 +e^{-x}})' \\&=\frac{0-(1 +e^{-x})'}{(1 +e^{-x})^2} \\&=\frac{e^{-x}}{(1 +e^{-x})^2} \\&=\frac{1+e^{-x}-1}{(1 +e^{-x})(1 +e^{-x})} \\&=\frac{1+e^{-x}-1}{(1 +e^{-x})}.\frac{1}{(1 +e^{-x})} \\&=[1-\frac{1}{(1 +e^{-x})}].\frac{1}{(1 +e^{-x})} \\&=[1-sigmoid(x)]*sigmoid(x) \end{aligned} sigmoid(x)=(1+ex1)=(1+ex)20(1+ex)=(1+ex)2ex=(1+ex)(1+ex)1+ex1=(1+ex)1+ex1.(1+ex)1=[1(1+ex)1].(1+ex)1=[1sigmoid(x)]sigmoid(x)

2.2 Tanh函数

  • 原函数
    T a n h ( x ) = e x − e − x e x + e − x \begin{aligned} Tanh(x) &=\frac{e^x-e^{-x}}{e^x+e^{-x}} \end{aligned} Tanh(x)=ex+exexex

  • 函数图
    在这里插入图片描述

  • 求导过程
    T a n h ′ ( x ) = e x − e − x e x + e − x ) ′ = ( e x − e − x ) ′ ( e x + e − x ) − ( e x − e − x ) ( e x + e − x ) ′ ( e x + e − x ) 2 = ( e x + e − x ) ( e x + e − x ) − ( e x − e − x ) ( e x − e − x ) ( e x + e − x ) 2 = ( e x + e − x ) 2 − ( e x − e − x ) 2 ( e x + e − x ) 2 = 1 − ( e x − e − x ) 2 ( e x + e − x ) 2 = 1 − ( e x − e − x e x + e − x ) 2 = 1 − T a n h 2 ( x ) \begin{aligned} Tanh'(x) &=\frac{e^x-e^{-x}}{e^x+e^{-x}})' \\&=\frac{(e^x-e^{-x})'(e^x+e^{-x})-(e^x-e^{-x})(e^x+e^{-x})'}{(e^x+e^{-x})^2} \\&=\frac{(e^x+e^{-x})(e^x+e^{-x})-(e^x-e^{-x})(e^x-e^{-x})}{(e^x+e^{-x})^2} \\&=\frac{(e^x+e^{-x})^2-(e^x-e^{-x})^2}{(e^x+e^{-x})^2} \\&=1-\frac{(e^x-e^{-x})^2}{(e^x+e^{-x})^2} \\&=1-(\frac{e^x-e^{-x}}{e^x+e^{-x}})^2 \\&=1-Tanh^2(x) \end{aligned} Tanh(x)=ex+exexex)=(ex+ex)2(exex)(ex+ex)(exex)(ex+ex)=(ex+ex)2(ex+ex)(ex+ex)(exex)(exex)=(ex+ex)2(ex+ex)2(exex)2=1(ex+ex)2(exex)2=1(ex+exexex)2=1Tanh2(x)

2.3 ReLU函数

  • 原函数
    R e l u ( x ) = { x x ≥ 0 0 x < 0 Relu(x)=\begin{cases} x & x\geq0 \\ 0 & x <0 \end{cases} Relu(x={x0x0x<0

  • 函数图
    在这里插入图片描述

  • 求导
    R e l u ′ ( x ) = { 1 x ≥ 0 0 x < 0 Relu'(x) =\begin{cases} 1 & x\geq0 \\ 0 & x <0 \end{cases} Relu(x)={10x0x<0

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐