深度学习笔记(15. TensorFlow实现CNN)

深度学习卷积神经网络——TensorFlow实现CNN，完成手势数字识别实验。这是Ng课程的第四部分。

迷茫猿小明

344人浏览 · 2020-01-14 15:12:47

迷茫猿小明 · 2020-01-14 15:12:47 发布

摘要

本文是学习Ng深度学习课程第四部分——卷积神经网络。看完课程做了一下作业，用TensorFlow实现了一个简单的CNN网络，完成了手势0~5数字识别。基本就是课件代码copy，比较遗憾的是numpy实现的同样结构CNN有问题，损失不下降，还出现梯度爆炸。
程序地址：https://github.com/ConstellationBJUT/Coursera-DL-Study-Notes/blob/master/class4_week1_cnn/tf_cnn_classfier.py

网络结构

在这里插入图片描述
图片->conv1->relu->pool1 -> conv2->relu->pool2 -> flatten ->FC->softmax

程序结构

数据：两个.h5文件，分别是train,X(1080, 64, 64, 3)，一共1080个样本，每个样本图片是64643，label(1080, 6)。dev，X(120,64,64,3)，label(120, 6)
程序文件：tf_cnn_classfier.py，包括CNN网络，分类试验等

主程序

用tf主要完成正向传播网络的构建，用框架不用考虑反向传播，还是相当方便的。

def forward_propagation(X, parameters):
    """
    Implements the forward propagation for the model:
    CONV2D -> RELU -> MAXPOOL -> CONV2D -> RELU -> MAXPOOL -> FLATTEN -> FULLYCONNECTED

    Arguments:
    X -- input dataset placeholder, of shape (input size, number of examples)
    parameters -- python dictionary containing your parameters "W1", "W2"
                  the shapes are given in initialize_parameters

    Returns:
    Z3 -- the output of the last LINEAR unit
    """

    # Retrieve the parameters from the dictionary "parameters"
    W1 = parameters['W1']
    W2 = parameters['W2']

    # CONV2D: stride of 1, padding 'SAME'
    Z1 = tf.nn.conv2d(X, filter=W1, strides=[1, 1, 1, 1], padding='SAME')
    # RELU
    A1 = tf.nn.relu(Z1)
    # MAXPOOL: window 8x8, sride 8, padding 'SAME'
    P1 = tf.nn.max_pool(A1, ksize=[1, 8, 8, 1], strides=[1, 8, 8, 1], padding='SAME')
    # CONV2D: filters W2, stride 1, padding 'SAME'
    Z2 = tf.nn.conv2d(P1, filter=W2, strides=[1, 1, 1, 1], padding='SAME')
    # RELU
    A2 = tf.nn.relu(Z2)
    # MAXPOOL: window 4x4, stride 4, padding 'SAME'
    P2 = tf.nn.max_pool(A2, ksize=[1, 4, 4, 1], strides=[1, 4, 4, 1], padding='SAME')
    # FLATTEN
    P2 = tf.contrib.layers.flatten(P2)
    # FULLY-CONNECTED without non-linear activation function (not not call softmax).
    # 6 neurons in output layer. Hint: one of the arguments should be "activation_fn=None"
    Z3 = tf.contrib.layers.fully_connected(P2, 6, activation_fn=None)

    return Z3

实验结果

直接copy，代码一样，结果也是一样的，老没意思了
在这里插入图片描述

总结

numpy实现的CNN还在查错误，发现实现这种网络结构真的好难纠错啊。这波课程5部分——DNN、改善神经网络(Adam等优化梯度算法)、结构化机器学习（经验之谈）、CNN、RNN（GRU、LSTM），就算刷完了。有些语音和翻译的实验没做，感觉还不错

技术共进，成长同行——讯飞AI开发者社区

更多推荐

机器学习与人工智能

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一

讯飞AI开发者社区

读人形机器人21全球经济格局

1.7.1. 随着机器人接管常规任务，社会对技能的需求转向与自动化互补的技能，包括编程、维护、人工智能开发以及需要创造力、情感智能和复杂人际互动的工作。4.7.1. 为机器人技术和AI制定明确的规章制度，能够确保安全、增进信任，并促进其应用，包括产品安全、数据保护、有道德和负责任地使用AI等方面的标准。初创公司和老牌公司都在投资开发医疗机器人，以提升医疗服务的可及性和质量。2.1.2. 随着对机器