为什么必须在神经网络中引入非线性

神经网络中，如果使用线性函数，每一层输出都是上层输入的线性函数，无论神经网络多深，输出都是输入的线性组合。加深神经网络的层数就没有什么意义了。线性函数的问题在于不管加深层数到多少，总是存在与之等效的无隐藏层的神经网络。为了稍微直观的理解这一点，考虑下面一个简单的例子。存在一个线性函数f(x)=a∗x(a≠0)f(x)=a*x(a≠0)f(x)=a∗x(a=0)作为激活函数，假设有三层线性网络y

十三吖

1728人浏览 · 2021-10-31 21:42:22

十三吖 · 2021-10-31 21:42:22 发布

神经网络中，如果使用线性函数，每一层输出都是上层输入的线性函数，无论神经网络多深，输出都是输入的线性组合。加深神经网络的层数就没有什么意义了。线性函数的问题在于不管加深层数到多少，总是存在与之等效的无隐藏层的神经网络。为了稍微直观的理解这一点，考虑下面一个简单的例子。

存在一个线性函数 $f (x) = a * x (a \neq = 0)$ 作为激活函数，假设有三层线性网络 $y = f (f (f (x)))$ 。很明显可以想到同样的处理可以由 $y=a*(a*(a*x)) = bx, (b=a^3)$ 。

也就是说，使用线性激活函数时，无法发挥多层网络带来的优势，因为得到的输出与原始输入还是线性关系。相反如果使用非线性函数，例如relu / sigmoid / softplus …等激活函数，给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。

欢迎关注微信公众号（算法工程师面试那些事儿)，建号初期，期待和大家一起刷leecode，刷机器学习、深度学习面试题等，共勉～

算法工程师面试那些事儿

技术共进，成长同行——讯飞AI开发者社区

更多推荐

智科毕业设计本科生课题指导

云计算与人工智能毕业设计选题指南本文为计算机专业学生提供毕业设计选题建议，重点推荐云计算与人工智能方向。选题技巧包括评估能力、兴趣驱动、就业导向等七个维度，并提出逆向思维、项目拆分等九种选题方法。云计算方向推荐容器编排、分布式存储等课题，并列举20个具体题目。同时分享三个优秀案例：基于YOLOv11的果树害虫识别系统、智能安防偷盗行为识别系统和工地安全监控预警系统，分析其技术架构、创新点和应用价