神经网络向量化

神经网络向量化多层神经网络是由单层神经网络叠加而成的，所以形成了成的概念，常见的多层神经网络由如下结构：输入层（Input Layer）：由众多神经元（Neuron）组成，用来接收输入信息，输入的信息成为输入向量输出层（Output Layer）：信息通过神经元链接传输、分析、权衡，形成输出结果，输出的信息称为输出向量隐藏层（Hidden Layer）：简称：“隐层”，是输入层和输出层之间众多神经

人工智能小a

1522人浏览 · 2021-11-20 17:09:18

人工智能小a · 2021-11-20 17:09:18 发布

神经网络概述

多层神经网络是由单层神经网络叠加而成的，所以形成了成的概念，常见的多层神经网络由如下结构：

输入层（Input Layer）：由众多神经元（Neuron）组成，用来接收输入信息，输入的信息成为输入向量
输出层（Output Layer）：信息通过神经元链接传输、分析、权衡，形成输出结果，输出的信息称为输出向量
隐藏层（Hidden Layer）：简称：“隐层”，是输入层和输出层之间众多神经元和链接组成的各层，隐层可以有一层或者多层，隐层的结点（神经元）数目不定，数目越多神经网络的非线性越显著，从而神经网络的强健性（robustness）越显著

多层神经网络

参数定义

x：神经网络输入
y：实际数据标签
$y^\hat{y}$ ：神经网络输出
w：权重参数
b：偏置参数
L：损失函数
J：成本函数
nx：神经元输出x个数
m：隐藏层的节点数

神经元定义

神经元

非向量化实现

$z=w_1*x_1+w_2*x_2+w_3*x_3+...+w_{nx}*x_{nx}+b$

向量化实现

$W=[w_1,w_2,w_3...w_{nx}]^T$
$X = [x_1,x_2,x_3...x_{nx}]^T$
$Z=W^T*X+b$

神经网络定义(一层)

神经网络图示

非向量化实现

$W_{[1]}=[w_{11},w_{12},w_{13}...w_{1nx}]^T\\ W_{[2]}=[w_{21},w_{22},w_{23}...w_{2nx}]^T\\ W_{[3]}=[w_{31},w_{32},w_{33}...w_{3nx}]^T\\ ...\\ W_{[m]}=[w_{m1},w_{m2},w_{m3}...w_{mnx}]^T$
$z_1=W_{[1]}^T*X+b_{[1]}\\ z_2=W_{[2]}^T*X+b_{[2]}\\ z_3=W_{[3]}^T*X+b_{[3]}\\ ...\\ z_m=W_{[m]}^T*X+b_{[m]}$

向量化实现

$W = [W_{[1]}^T,W_{[2]}^T, W_{[3]}^T...W_{[m]}^T]^T$
$X = [x_1,x_2, x_3...x_{nx}]^T$
$B = [b_1,b_2,b_3...b_{m}]^T$
$Z=W^T*X+B=[z_1,z_2,z_3...z_{m}]^T$

神经网络定义(多批次数据输入)

非向量化实现

多批量数据输入：
$X^{(1)}=[x_{11},x_{12},x_{13}...x_{1nx}]^T\\ X^{(2)}=[x_{21},x_{22},x_{23}...x_{2nx}]^T\\ X^{(3)}=[x_{31},x_{32},x_{33}...x_{3nx}]^T\\ ...\\ X^{(n)}=[x_{n1},x_{n2},x_{n3}...x_{nnx}]^T$
多批量神经网络输出：
$Z^{(1)}=W^T*X^{(1)}+B\\ Z^{(2)}=W^T*X^{(2)}+B\\ Z^{(3)}=W^T*X^{(3)}+B\\ ...\\ Z^{(n)}=W^T*X^{(n)}+B$

向量化实现

$X=[X^{(1)},X^{(2)},X^{(3)}...X^{(n)}]$
$Z=W^T*X+B=[Z^{(1)},Z^{(2)},Z^{(3)}...Z^{(n)}]$

总结

在实际运用过程中，往往使用显式循环语句的效率是低下的，将输入数据、训练参数等向量化能够极大地提升神经网络的训练效率。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI智能体—人工智能工作流与人工智能智能体：真正的区别是什么？

本文探讨了人工智能工作流与智能体的核心区别。工作流是静态、可预测的执行序列（如预处理→嵌入→搜索→总结），适合批处理作业；而智能体能动态感知环境、自主决策（感知→推理→决策循环），具备适应性和工具选择能力。关键差异在于：工作流遵循固定路径，智能体则能根据目标调整策略。架构上，工作流使用Airflow等工具，智能体依赖LangChain等框架。智能体的自主性使其更适用于动态环境，代表下一代AI应用方

讯飞AI开发者社区

上下文工程驱动智能体向通用人工智能

例如在文章开头，我们举的产品经理和工程师之间的那一段对话，一个高质量智能体，不再只是让大模型回答用户的问题，而是通过上下文工程，帮助大模型在回答前获得更加结构化的输入，包括项目状态、需求文档、任务历史、甚至团队氛围，实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。这和我们维护我们手机上内存很像，一开始所有应用和历史信息都保留，但当手机出现运