深度学习Keras（四）：波士顿房价(boston_housing)数据集(回归问题)

keras内置数据集下载keras.fit()和evaluate()中的verbose属性不用K折验证import numpy as npimport matplotlib.pyplot as pltfrom keras import layers, modelsfrom keras.datasets import boston_housingimport osos.environ['TF_CPP

WILDCHAP_

4410人浏览 · 2020-07-27 18:58:18

WILDCHAP_ · 2020-07-27 18:58:18 发布

keras内置数据集下载

keras.fit()和evaluate()中的verbose属性

不用K折验证

import numpy as np
import matplotlib.pyplot as plt
from keras import layers, models
from keras.datasets import boston_housing
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

#train_data.shape -> (404, 13)
#test_data.shape -> (102, 13)
(train_data, train_labels), (test_data, test_labels) = boston_housing.load_data()

#数据标准化，减去平均值再除以标准差(测试数据也用训练数据的标准差)
mean = train_data.mean(axis=0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= std
test_data -= mean
test_data /= std

#模型定义
network = models.Sequential()
network.add(layers.Dense(64, activation='relu', input_shape=(13, )))
network.add(layers.Dense(64, activation='relu'))
network.add(layers.Dense(1))	#最后输出预测房价，恒等函数
#损失函数用mes(均方误差), 监控指标为mae(平均绝对误差, 返回误差绝对值)
network.compile(optimizer='rmsprop', loss='mse', metrics=['mae'])

#由于数据量少, 不引入验证集
History = network.fit(train_data, train_labels, epochs=20, batch_size=80)

#用训练好的模型衡量测试数据精确度
results = network.evaluate(test_data, test_labels)
print(results)

#用训练好的网络预测结果
print(network.predict(test_data))

#绘制图像
history_dict = History.history
print(history_dict.keys())
acc_list = history_dict['mae']

x = range(1, len(acc_list) + 1)

plt.plot(x, acc_list, linestyle=':', label='Training_mae')
plt.title('mae data')
plt.xlabel('Epoches')
plt.ylabel('mean abs error')
plt.legend()
plt.show()

在这里插入图片描述

利用K折验证

import numpy as np
import matplotlib.pyplot as plt
from keras import layers, models
from keras.datasets import boston_housing
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

#train_data.shape -> (404, 13)
#test_data.shape -> (102, 13)
(train_data, train_labels), (test_data, test_labels) = boston_housing.load_data()

#数据标准化，减去平均值再除以标准差(测试数据也用训练数据的标准差)
mean = train_data.mean(axis=0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= std
test_data -= mean
test_data /= std

#模型定义
def build_model():
	network = models.Sequential()
	network.add(layers.Dense(64, activation='relu', input_shape=(13, )))
	network.add(layers.Dense(64, activation='relu'))
	network.add(layers.Dense(1))	#最后输出预测房价，恒等函数
	#损失函数用mes(均方误差), 监控指标为mae(平均绝对误差, 返回误差绝对值)
	network.compile(optimizer='rmsprop', loss='mse', metrics=['mae'])
	return network

#利用K折验证输入的数据
k = 4	#将数据分为4个相同的折，每个折的第i-1个分区作为验证集
num_val = len(train_data) // k	#每个分区大小(一定要整除)
num_epochs = 100
mae_list = []

for i in range(k):
	print("当前第" + str(i) + "折：")
	#验证集
	val_x = train_data[i * num_val: (i+1) * num_val]
	val_t = train_labels[i * num_val: (i+1) * num_val]
	#训练集(注意训练集是验证集剩下的，所以要用concatenate在第一维度连接)
	partial_x_train = np.concatenate([train_data[:i * num_val], train_data[(i+1) * num_val:]], axis=0)
	partial_t_train = np.concatenate([train_labels[:i * num_val], train_labels[(i+1) * num_val:]], axis=0)
	
	network = build_model()
	#verbose：静默模式, 详情见https://blog.csdn.net/WILDCHAP_/article/details/107618130
	History = network.fit(partial_x_train, partial_t_train, 
							validation_data=(val_x, val_t), 
							epochs=num_epochs, batch_size=1, verbose=0)
	history_dict = History.history
	#print(history_dict.keys()) ->mae, val_mae, loss, val_loss
	#将验证集的平均绝对误差加入数组
	mae = history_dict['val_mae']
	mae_list.append(mae)
	#print(len(mae))

#求出每一折的平均绝对误差平均值(每一折都经过留num_epochs次)
average_mae_list = []
for i in range(num_epochs):
	for x in mae_list:
		average_mae_list.append(np.mean(x[i]))

#绘制图像
x = range(1, len(average_mae_list)+1)
plt.plot(x, average_mae_list)
plt.xlabel('Epochs')
plt.ylabel('mean_abs_error')
plt.title('mae data')
plt.show()

在这里插入图片描述

技术共进，成长同行——讯飞AI开发者社区

更多推荐

PHP与人工智能：结合案例与可能性探索

讯飞AI开发者社区

[论文阅读] 人工智能 + 软件工程 | 真实场景下GitHub Copilot生产力之谜：2年数据揭示客观提交无提升，开发者却直呼“好用”

讯飞AI开发者社区

上下文工程驱动智能体向通用人工智能

例如在文章开头，我们举的产品经理和工程师之间的那一段对话，一个高质量智能体，不再只是让大模型回答用户的问题，而是通过上下文工程，帮助大模型在回答前获得更加结构化的输入，包括项目状态、需求文档、任务历史、甚至团队氛围，实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。这和我们维护我们手机上内存很像，一开始所有应用和历史信息都保留，但当手机出现运