模块化搭建神经网络（Keras）

模块化搭建神经网络（keras）搭建步骤import ：导入相关模块train、test：指定训练数据集的输入特征x_train和训练集的输入标签y_train，测试集的输入特征x_test和测试集的输入标签y_testmodel = tf.keras.models.Sequential：搭建网络结构，定义前向传播model.compile：配置训练参数，定义优化器、损失函数、评测指标等model

人工智能小a

538人浏览 · 2021-11-10 09:11:10

人工智能小a · 2021-11-10 09:11:10 发布

模块化搭建神经网络（keras）

搭建步骤

import ：
导入相关模块
train、test：
指定训练数据集的输入特征x_train和训练集的输入标签y_train，测试集的输入特征x_test和测试集的输入标签y_test
model = tf.keras.models.Sequential：
搭建网络结构，定义前向传播
model.compile：
配置训练参数，定义优化器、损失函数、评测指标等
model.fit：
执行训练过程，输入训练集和测试集的输入特征及标签，定义Batch值和数据集训练次数
model.summary：
输出网络结构和参数统计

函数

Sequential()

描述各层网络结构：

model = tf.keras.models.Sequential([网络结构])

网络结构示例：

拉直层：不含计算，只进行形状转换，将输入特征转换成一维数组。
```
tf.keras.layers.Flatten()
```
全连接层：定义神经元个数、激活函数（relu、softmax、sigmoid、tanh等）、正则化（L1：tf.keras.regularizers.l1()、L2：tf.keras.regularizers.l2()）。
```
tf.keras.layers.Dense(神经元个数, activation="激活函数", kernel_regularizer=正则化)
```

卷积层

tf.keras.layers.Conv2D(filters=卷积核个数, kernel_size=卷积核尺寸, strides=卷积步长, padding="valid" or "same")

LSTM层
```
tf.keras.layers.LSTM()
```

compile()

配置训练参数，定义优化器、损失函数、评测指标等：

model.compile(optimizer=优化器, loss=损失函数, metrics=["准确率"])

optimizer

'sgd' or tf.keras.optimizers.SGD(lr=学习率, momentum=动量参数)
'adagrad' or tf.keras.optimizers.Adgrad(lr=学习率)
'adadelta' or tf.keras.optimizers.Adadelta(lr=学习率)
'adam' or tf.keras.optimizers.Adam(lr=学习率, beta_1=0.9, beta_2=0.999)

loss

'mse' or tf.keras.losses.MeanSquaredError()
'sparse_categorical_crossentropy' or tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False) //from_logits:询问是否经过概率分布，若输出经过概率分布：False, 否则：True

metrics

'accuracy': y_和y都是数值，如y_=[1]、y=[1]
'categorical_accurary': y_和y都是独热码（概率分布），如：y_=[0,1,0]、y=[0.256,0.695,0.048]
'sparse_categoriacl_accuracy': y_是数值，y是独热码（概率分布），如：y_=[1]、y=[0.256,0.695,0.048]

fit()

执行训练过程，输入训练集和测试集的输入特征及标签，定义Batch值和数据集训练次数：

model.fit(训练数据集的输入特征, 训练数据集的输入标签,
		  batch_size= , epochs= ,
		  validation_data=(测试数据集的输入特征, 测试数据集的输入标签),
		  validation_split=从训练数据集中划分给测试数据集的比例
		  validation_freq=多少epoch测试一次)

summary()

输出网络结构和参数统计：

model.summary()

示例

import tensorflow as tf
from sklearn import datasets
import numpy as np

//下载训练数据集
x_train = datasets.load_iris().data
y_train = datasets.load_iris().target

//将数据集乱序
np.random.seed(100)
np.random.shuffle(x_train)
np.random.seed(100)
np.random.shuffle(y_train)

//Sequential()
model = tf.keras.model.Sequential([tf.keras.layers.Dense(3,activation='softmax',kernel_regularizer=tf.keras.regularizers.l2)])
//compile
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),loss=tf.keras.losses.SpaerCategoricalCrossentropy(from_logits=False))
//fit
model.fit(x_train,y_train,batch_size=32,epochs=500,validation_split=0.2,validation_freq=20)
//summary
model.summary()

技术共进，成长同行——讯飞AI开发者社区

更多推荐

[论文阅读] 人工智能 + 软件工程 | 真实场景下GitHub Copilot生产力之谜：2年数据揭示客观提交无提升，开发者却直呼“好用”

讯飞AI开发者社区

上下文工程驱动智能体向通用人工智能

例如在文章开头，我们举的产品经理和工程师之间的那一段对话，一个高质量智能体，不再只是让大模型回答用户的问题，而是通过上下文工程，帮助大模型在回答前获得更加结构化的输入，包括项目状态、需求文档、任务历史、甚至团队氛围，实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。这和我们维护我们手机上内存很像，一开始所有应用和历史信息都保留，但当手机出现运