模块化搭建神经网络(Keras)
模块化搭建神经网络(keras)搭建步骤import :导入相关模块train、test:指定训练数据集的输入特征x_train和训练集的输入标签y_train,测试集的输入特征x_test和测试集的输入标签y_testmodel = tf.keras.models.Sequential:搭建网络结构,定义前向传播model.compile:配置训练参数,定义优化器、损失函数、评测指标等model
·
模块化搭建神经网络(keras)
搭建步骤
- import :
导入相关模块 - train、test:
指定训练数据集的输入特征x_train和训练集的输入标签y_train,测试集的输入特征x_test和测试集的输入标签y_test - model = tf.keras.models.Sequential:
搭建网络结构,定义前向传播 - model.compile:
配置训练参数,定义优化器、损失函数、评测指标等 - model.fit:
执行训练过程,输入训练集和测试集的输入特征及标签,定义Batch值和数据集训练次数 - model.summary:
输出网络结构和参数统计
函数
Sequential()
描述各层网络结构:
model = tf.keras.models.Sequential([网络结构])
网络结构示例:
- 拉直层:不含计算,只进行形状转换,将输入特征转换成一维数组。
tf.keras.layers.Flatten()
- 全连接层:定义神经元个数、激活函数(relu、softmax、sigmoid、tanh等)、正则化(L1:tf.keras.regularizers.l1()、L2:tf.keras.regularizers.l2())。
tf.keras.layers.Dense(神经元个数, activation="激活函数", kernel_regularizer=正则化)
- 卷积层
tf.keras.layers.Conv2D(filters=卷积核个数, kernel_size=卷积核尺寸, strides=卷积步长, padding="valid" or "same")
- LSTM层
tf.keras.layers.LSTM()
compile()
配置训练参数,定义优化器、损失函数、评测指标等:
model.compile(optimizer=优化器, loss=损失函数, metrics=["准确率"])
- optimizer
'sgd' or tf.keras.optimizers.SGD(lr=学习率, momentum=动量参数) 'adagrad' or tf.keras.optimizers.Adgrad(lr=学习率) 'adadelta' or tf.keras.optimizers.Adadelta(lr=学习率) 'adam' or tf.keras.optimizers.Adam(lr=学习率, beta_1=0.9, beta_2=0.999)
- loss
'mse' or tf.keras.losses.MeanSquaredError() 'sparse_categorical_crossentropy' or tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False) //from_logits:询问是否经过概率分布,若输出经过概率分布:False, 否则:True
- metrics
'accuracy': y_和y都是数值,如y_=[1]、y=[1] 'categorical_accurary': y_和y都是独热码(概率分布),如:y_=[0,1,0]、y=[0.256,0.695,0.048] 'sparse_categoriacl_accuracy': y_是数值,y是独热码(概率分布),如:y_=[1]、y=[0.256,0.695,0.048]
fit()
执行训练过程,输入训练集和测试集的输入特征及标签,定义Batch值和数据集训练次数:
model.fit(训练数据集的输入特征, 训练数据集的输入标签,
batch_size= , epochs= ,
validation_data=(测试数据集的输入特征, 测试数据集的输入标签),
validation_split=从训练数据集中划分给测试数据集的比例
validation_freq=多少epoch测试一次)
summary()
输出网络结构和参数统计:
model.summary()
示例
import tensorflow as tf
from sklearn import datasets
import numpy as np
//下载训练数据集
x_train = datasets.load_iris().data
y_train = datasets.load_iris().target
//将数据集乱序
np.random.seed(100)
np.random.shuffle(x_train)
np.random.seed(100)
np.random.shuffle(y_train)
//Sequential()
model = tf.keras.model.Sequential([tf.keras.layers.Dense(3,activation='softmax',kernel_regularizer=tf.keras.regularizers.l2)])
//compile
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),loss=tf.keras.losses.SpaerCategoricalCrossentropy(from_logits=False))
//fit
model.fit(x_train,y_train,batch_size=32,epochs=500,validation_split=0.2,validation_freq=20)
//summary
model.summary()
更多推荐
所有评论(0)