Keras(二十一)10monkeys基础模型和数据增强

本文将介绍：10monkeys基础模型搭建与训练keras实现数据增强一，下载kaggle-10monkey数据通过下面的链接，下载dataset到本地目录intput中kaggle-10monkey下载地址二，使用keras中ImageDataGenerator读取数据、数据增强1，实例化ImageDataGenerator# 对于图片数据,在keras里有更高层的封装.读取数据且做数据增强 -

TFATS

405人浏览 · 2021-02-26 17:34:46

TFATS · 2021-02-26 17:34:46 发布

本文将介绍：

10monkeys基础模型搭建与训练
keras实现数据增强

一，下载kaggle-10monkey数据

通过下面的链接，下载dataset到本地目录intput中
kaggle-10monkey下载地址

二，使用keras中ImageDataGenerator读取数据、数据增强

1，实例化ImageDataGenerator

# 对于图片数据,在keras里有更高层的封装.读取数据且做数据增强 -> Generator
train_datagen = keras.preprocessing.image.ImageDataGenerator(
    rescale = 1./255,    # 图像中的每个像素点都是在0~255之间,得到一个0~1之间的数
    rotation_range = 40,    # 图片增强的方法,把图片随机旋转一个角度,旋转的角度就在-40~40之间
    width_shift_range = 0.2,    # 做水平位移 - 增加位移鲁棒性(如果0~1之间则位移比例随机选数做位移;如果大于1,则是具体的像素大小)
    height_shift_range = 0.2,   # 做垂直位移 - 增加位移鲁棒性(如果0~1之间则位移比例随机选数做位移;如果大于1,则是具体的像素大小)
    shear_range = 0.2,  # 剪切强度
    zoom_range = 0.2,   # 缩放强度
    horizontal_flip = True, # 是否随机做水平翻转
    fill_mode = 'nearest',  # 填充像素规则,用离其最近的像素点做填充
)

2，使用ImageDataGenerator读取图片

# 从训练集的文件夹中读取图片
train_generator = train_datagen.flow_from_directory(train_dir,# 图片的文件夹位置
                                                   target_size = (height, width),# 将图片缩放到的大小
                                                   batch_size = batch_size, # 多少张为一组
                                                   seed = 7,#随机数种子
                                                   shuffle = True,# 是否做混插
                                                   class_mode = "categorical")  # 控制目标值label的形式-选择onehot编码后的形式 
# 从验证集的文件夹中读取图片
valid_datagen = keras.preprocessing.image.ImageDataGenerator(rescale = 1./255)
valid_generator = valid_datagen.flow_from_directory(valid_dir,
                                                    target_size = (height, width),
                                                    batch_size = batch_size,
                                                    seed = 7,
                                                    shuffle = False,
                                                    class_mode = "categorical")

3,查看训练家和验证集分别有多少张数据

train_num = train_generator.samples
valid_num = valid_generator.samples
print(train_num, valid_num)

4,如何从ImageDataGenerator中读取数据

for i in range(1):
    x, y = train_generator.next()
    print(x.shape, y.shape)
    print(y)

三，定义模型

1，定义模型

model = keras.models.Sequential([
    keras.layers.Conv2D(filters=32, kernel_size=3, padding='same',
                        activation='relu', input_shape=[width, height, channels]),
    keras.layers.Conv2D(filters=32, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Conv2D(filters=64, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.Conv2D(filters=64, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Conv2D(filters=128, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.Conv2D(filters=128, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(num_classes, activation='softmax'),
])

model.compile(loss="categorical_crossentropy",
              optimizer="adam", metrics=['accuracy'])   # adam是更高级一些的优化器,更快速且稳定

2，查看模型结构

model.summary()

四，训练模型

epochs = 20
history = model.fit_generator(train_generator,
                              steps_per_epoch = train_num // batch_size,
                              epochs = epochs,
                              validation_data = valid_generator,
                              validation_steps = valid_num // batch_size)

五，打印模型训练曲线

def plot_learning_curves(history, label, epcohs, min_value, max_value):
    data = {}
    data[label] = history.history[label]
    data['val_'+label] = history.history['val_'+label]
    pd.DataFrame(data).plot(figsize=(8, 5))
    plt.grid(True)
    plt.axis([0, epochs, min_value, max_value])
    plt.show()
    
plot_learning_curves(history, 'accuracy', epochs, 0, 1)
plot_learning_curves(history, 'loss', epochs, 1.5, 2.5)

六，总结代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import os
import pandas as pd
import sklearn
import sys
import tensorflow as tf
import time
from tensorflow import keras

# 打印使用的python库的版本信息
print(tf.__version__)
print(sys.version_info)
for module in mpl, np, pd, sklearn, tf, keras:
    print(module.__name__, module.__version__)
    
# 常量的定义
train_dir = "./input/training/training"
valid_dir = "./input/validation/validation"
label_file = "./input/monkey_labels.txt"
print(os.path.exists(train_dir))
print(os.path.exists(valid_dir))
print(os.path.exists(label_file))
print(os.listdir(train_dir))
print(os.listdir(valid_dir))

# 查看打印出来的label值
labels = pd.read_csv(label_file, header=0)
print(labels)

# 定义常量
height = 128
width = 128
channels = 3
batch_size = 64
num_classes = 10

# 一,使用keras中ImageDataGenerator读取数据
# 1,实例化ImageDataGenerator
# 对于图片数据,在keras里有更高层的封装.读取数据且做数据增强 -> Generator
train_datagen = keras.preprocessing.image.ImageDataGenerator(
    rescale = 1./255,    # 图像中的每个像素点都是在0~255之间,得到一个0~1之间的数
    rotation_range = 40,    # 图片增强的方法,把图片随机旋转一个角度,旋转的角度就在-40~40之间
    width_shift_range = 0.2,    # 做水平位移 - 增加位移鲁棒性(如果0~1之间则位移比例随机选数做位移;如果大于1,则是具体的像素大小)
    height_shift_range = 0.2,   # 做垂直位移 - 增加位移鲁棒性(如果0~1之间则位移比例随机选数做位移;如果大于1,则是具体的像素大小)
    shear_range = 0.2,  # 剪切强度
    zoom_range = 0.2,   # 缩放强度
    horizontal_flip = True, # 是否随机做水平翻转
    fill_mode = 'nearest',  # 填充像素规则,用离其最近的像素点做填充
)
# 2,使用ImageDataGenerator读取图片
# 从训练集的文件夹中读取图片
train_generator = train_datagen.flow_from_directory(train_dir,# 图片的文件夹位置
                                                   target_size = (height, width),# 将图片缩放到的大小
                                                   batch_size = batch_size, # 多少张为一组
                                                   seed = 7,#随机数种子
                                                   shuffle = True,# 是否做混插
                                                   class_mode = "categorical")  # 控制目标值label的形式-选择onehot编码后的形式 
# 从验证集的文件夹中读取图片
valid_datagen = keras.preprocessing.image.ImageDataGenerator(rescale = 1./255)
valid_generator = valid_datagen.flow_from_directory(valid_dir,
                                                    target_size = (height, width),
                                                    batch_size = batch_size,
                                                    seed = 7,
                                                    shuffle = False,
                                                    class_mode = "categorical")
# 3,查看训练家和验证集分别有多少张数据
train_num = train_generator.samples
valid_num = valid_generator.samples
print(train_num, valid_num)

# 4,如何从ImageDataGenerator中读取数据
for i in range(1):
    x, y = train_generator.next()
    print(x.shape, y.shape)
    print(y)

    
# 二,定义模型
model = keras.models.Sequential([
    keras.layers.Conv2D(filters=32, kernel_size=3, padding='same',
                        activation='relu', input_shape=[width, height, channels]),
    keras.layers.Conv2D(filters=32, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Conv2D(filters=64, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.Conv2D(filters=64, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Conv2D(filters=128, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.Conv2D(filters=128, kernel_size=3, padding='same',
                        activation='relu'),
    keras.layers.MaxPool2D(pool_size=2),
    
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(num_classes, activation='softmax'),
])

model.compile(loss="categorical_crossentropy",
              optimizer="adam", metrics=['accuracy'])   # adam是更高级一些的优化器,更快速且稳定
model.summary()


# 三,训练模型
epochs = 20
history = model.fit_generator(train_generator,
                              steps_per_epoch = train_num // batch_size,
                              epochs = epochs,
                              validation_data = valid_generator,
                              validation_steps = valid_num // batch_size)

# 四,打印训练曲线
print(history.history.keys())
def plot_learning_curves(history, label, epcohs, min_value, max_value):
    data = {}
    data[label] = history.history[label]
    data['val_'+label] = history.history['val_'+label]
    pd.DataFrame(data).plot(figsize=(8, 5))
    plt.grid(True)
    plt.axis([0, epochs, min_value, max_value])
    plt.show()

plot_learning_curves(history, 'accuracy', epochs, 0, 1)
plot_learning_curves(history, 'loss', epochs, 0, 2.5)

技术共进，成长同行——讯飞AI开发者社区

更多推荐

第75篇：AI+金融：智能风控、量化交易与个性化理财

摘要：本文系统性地深入探讨人工智能在金融领域的革命性应用。我们首先解析智能风控：AI如何利用XGBoost、LightGBM、深度神经网络（DNN）与图神经网络（GNN），融合多维度数据（征信、行为、社交、设备），实现信贷反欺诈、信用评分、反洗钱与异常交易检测，提升风险识别精度与效率。详解量化交易：AI如何通过LSTM、Transformer、强化学习（RL）分析海量市场数据（行情、新闻、财报），

讯飞AI开发者社区

AIoT（人工智能物联网）：融合范式下的技术演进、系统架构与产业变革

AIoT并非简单的技术叠加，而是一种全新的系统性范式，其核心在于将AI的感知、学习、推理与决策能力内化于物联网的感知、连接与执行体系之中，实现从“万物互联”向“万物智联”的根本性跃迁。通过分析多维度的行业报告、技术白皮书与实践案例，本文揭示了AIoT在智慧城市、智能制造、智慧医疗、智慧农业等领域的深刻变革，并探讨了其在终端AI化、传输多样化、感知融合化等前沿趋势下的产业生态演化。物联网（IoT）的

讯飞AI开发者社区

企业AI Agent的情感智能：提升员工体验与忠诚度

随着人工智能技术的飞速发展，企业AI Agent在企业运营中的应用越来越广泛。本研究的目的在于深入探讨企业AI Agent的情感智能如何对员工体验和忠诚度产生积极影响。具体范围涵盖了情感智能的理论基础、相关算法原理、实际应用场景以及在企业环境中的实践案例等方面。通过研究，旨在为企业提供切实可行的方案，利用AI Agent的情感智能提升员工的工作满意度和忠诚度，进而促进企业的长期发展。本文共分为十个