深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用

末蓝、 2023-10-13 20:59 224阅读 0赞

目录

  • 一、二、Tesnsflow入门 & 环境配置 & 认识Tensorflow
  • 三、线程与队列与IO操作
  • 神经网络基础知识
    • 1.简单神经网络
    • 2.卷积神经网络
      • 卷积层
      • 新的激活函数-Relu
      • 池化层(Pooling)计算
  • 案例:Mnist手写数字图片识别卷积网络案例

一、二、Tesnsflow入门 & 环境配置 & 认识Tensorflow

Tensorflow入门(1)——深度学习框架Tesnsflow入门 & 环境配置 & 认识Tensorflow

在这里插入图片描述

三、线程与队列与IO操作

深度学习框架Tesnsflow & 线程+队列+IO操作 & 文件读取案例

在这里插入图片描述

神经网络基础知识

神经网络的种类:
基础神经网络:单层感知器,线性神经网络,BP神经网络,Hopfield神经网络等
进阶神经网络:玻尔兹曼机,受限玻尔兹曼机,递归神经网络等
深度神经网络:深度置信网络,卷积神经网络,循环神经网络,LSTM网络等
• 结构(Architecture)例如,神经网络中的变量可以是神经元连接的权重
• 激励函数(Activity Rule)大部分神经网络模型具有一个短时间尺度的动力学规则,来定义神经元如何根据其他神经元的活动来改变自己的激励值。
• 学习规则(Learning Rule)学习规则指定了网络中的权重如何随着时间推进而调整。(反向传播算法)

在这里插入图片描述

在这里插入图片描述

损失计算-交叉熵损失公式

在这里插入图片描述

1.简单神经网络

在这里插入图片描述

http://yann.lecun.com/exdb/mnist/

在这里插入图片描述

TensorFlow的代码

  1. import tensorflow as tf
  2. old_v = tf.logging.get_verbosity()
  3. tf.logging.set_verbosity(tf.logging.ERROR)
  4. from tensorflow.examples.tutorials.mnist import input_data
  5. FLAGS = tf.app.flags.FLAGS
  6. tf.app.flags.DEFINE_integer("is_train", 1, "指定程序是预测还是训练")
  7. def full_connected():
  8. # 获取真实的数据
  9. mnist = input_data.read_data_sets("./data/mnist/", one_hot=True)
  10. tf.logging.set_verbosity(old_v)
  11. # 1、建立数据的占位符 x [None, 784] y_true [None, 10]
  12. with tf.variable_scope("data"): # 作用域
  13. x = tf.placeholder(tf.float32, [None, 784])
  14. y_true = tf.placeholder(tf.int32, [None, 10])
  15. # 2、建立一个全连接层的神经网络 w [784, 10] b [10]
  16. with tf.variable_scope("fc_model"):
  17. # 随机初始化权重和偏置
  18. weight = tf.Variable(tf.random_normal([784, 10], mean=0.0, stddev=1.0), name="w")
  19. bias = tf.Variable(tf.constant(0.0, shape=[10]))
  20. # 预测None个样本的输出结果matrix [None, 784]* [784, 10] + [10] = [None, 10]
  21. y_predict = tf.matmul(x, weight) + bias
  22. # 3、求出所有样本的损失,然后求平均值
  23. with tf.variable_scope("soft_cross"):
  24. # 求平均交叉熵损失
  25. loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))
  26. # 4、梯度下降求出损失
  27. with tf.variable_scope("optimizer"):
  28. train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)# 学习率和最小化损失
  29. # 5、计算准确率
  30. with tf.variable_scope("acc"):
  31. equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))
  32. # equal_list None个样本 [1, 0, 1, 0, 1, 1,..........]
  33. accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))
  34. # 收集变量 单个数字值收集
  35. tf.summary.scalar("losses", loss)
  36. tf.summary.scalar("acc", accuracy)
  37. # 高纬度变量收集
  38. tf.summary.histogram("weightes", weight)
  39. tf.summary.histogram("biases", bias)
  40. # 定义一个初始化变量的op
  41. init_op = tf.global_variables_initializer()
  42. # 定义一个合并变量的 op
  43. merged = tf.summary.merge_all()
  44. # 创建一个saver
  45. saver = tf.train.Saver()
  46. # 开启会话去训练
  47. with tf.Session() as sess:
  48. # 初始化变量
  49. sess.run(init_op)
  50. # 建立events文件,然后写入
  51. filewriter = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
  52. if FLAGS.is_train == 1:# 如果是1,进行训练
  53. # 迭代步数去训练,更新参数预测
  54. for i in range(2000):
  55. # 取出真实存在的特征值和目标值
  56. mnist_x, mnist_y = mnist.train.next_batch(50)
  57. # 运行train_op训练
  58. sess.run(train_op, feed_dict={
  59. x: mnist_x, y_true: mnist_y})
  60. # 写入每步训练的值
  61. summary = sess.run(merged, feed_dict={
  62. x: mnist_x, y_true: mnist_y})
  63. filewriter.add_summary(summary, i)
  64. print("训练第%d步,准确率为:%f" % (i, sess.run(accuracy, feed_dict={
  65. x: mnist_x, y_true: mnist_y})))
  66. # 保存模型
  67. saver.save(sess, "./tmp/ckpt/fc_model")
  68. else:# 如果是0,做出预测
  69. # 加载模型
  70. saver.restore(sess, "./tmp/ckpt/fc_model")
  71. # 如果是0,做出预测
  72. for i in range(100):
  73. # 每次测试一张图片 [0,0,0,0,0,1,0,0,0,0]
  74. x_test, y_test = mnist.test.next_batch(1)
  75. print("第%d张图片,手写数字图片目标是:%d, 预测结果是:%d" % (
  76. i,
  77. tf.argmax(y_test, 1).eval(),
  78. tf.argmax(sess.run(y_predict, feed_dict={
  79. x: x_test, y_true: y_test}), 1).eval()
  80. ))
  81. return None
  82. if __name__ == "__main__":
  83. full_connected()

2.卷积神经网络

在这里插入图片描述

神经网络的进化

在这里插入图片描述
神经网络(neural networks)的基本组成包括输入层、隐藏层、输出层。而卷积神经网络的特点在于隐藏层分为卷积层和池化层(pooling layer,又叫下采样层)。

  • 卷积层:通过在原始图像上平移来提取特征,每一个特征就是一个特征映射
  • 池化层:通过特征后稀疏参数来减少学习的参数,降低网络的复杂度,(最大池化和平均池化)

在这里插入图片描述

结构示意图

在这里插入图片描述
零填充:
• 卷积核在提取特征映射时的动作称之为padding(零填充),由于移动步长不一定能整除整张图的像素宽度。其中有两种方式,SAME和VALID

  1. SAME:越过边缘取样,取样的面积和输入图像的像素宽度一致。
  2. VALID:不越过边缘取样,取样的面积小于输入人的图像的像素宽度

卷积层

tf.nn.conv2d(input, filter, strides=, padding=, name=None)
计算给定4-D input和filter张量的2维卷积
input:给定的输入张量,具有[batch,heigth,width,
channel],类型为float32,64
filter:指定过滤器的大小,[filter_height, filter_width, in_channels, out_channels]
strides:strides = [1, stride, stride, 1],步长
padding:“SAME”, “VALID”,使用的填充算法的类型,使用“SAME”。其中”VALID”表示滑动超出部分舍弃,“SAME”表示填充,使得变化后height,width一样大

在这里插入图片描述

新的激活函数-Relu

在这里插入图片描述

第一,采用sigmoid等函数,反向传播求误差梯度时,计算量相对大,而采用Relu激活函数,整个过程的计算量节省很多

第二,对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况(求不出权重和偏置)

激活函数:
tf.nn.relu(features, name=None)
features:卷积后加上偏置的结果
return:结果

池化层(Pooling)计算

Pooling层主要的作用是特征提取,通过去掉Feature Map中不重要的样本,进一步减少参数数量。Pooling的方法很多,最常用的是Max Pooling。

在这里插入图片描述
在这里插入图片描述
池化:
tf.nn.max_pool(value, ksize=, strides=, padding=,name=None)
输入上执行最大池数
value:4-D Tensor形状[batch, height, width, channels]
ksize:池化窗口大小,[1, ksize, ksize, 1]
strides:步长大小,[1,strides,strides,1]
padding:“SAME”, “VALID”,使用的填充算法的类型,使用“SAME”

Full Connected层:
分析:前面的卷积和池化相当于做特征工程,后面的全连接相当于做特征加权。最后的全连接层在整个卷积神经网络中起到“分类器”的作用。

案例:Mnist手写数字图片识别卷积网络案例

流程:
1、准备数据
2、卷积、激活、池化(两层)
3、全连接层
4、计算准确率

  1. import tensorflow as tf
  2. old_v = tf.logging.get_verbosity()
  3. tf.logging.set_verbosity(tf.logging.ERROR)
  4. from tensorflow.examples.tutorials.mnist import input_data
  5. # 定义一个初始化权重的函数
  6. def weight_variable(shape):
  7. w = tf.Variable(tf.random_normal(shape=shape,mean=0.0,stddev=1.0))
  8. return w
  9. # 定义一个初始化偏置的函数
  10. def bias_variable(shape):
  11. b = tf.Variable(tf.constant(0.0,shape=shape))
  12. return b
  13. def model():
  14. '''
  15. 自定义的卷积模型
  16. :return:
  17. '''
  18. # 1、准备数据的占位符 x [None, 784] y_true [None, 10]
  19. with tf.variable_scope("data"): # 作用域
  20. x = tf.placeholder(tf.float32, [None, 784])
  21. y_true = tf.placeholder(tf.int32, [None, 10])
  22. # 2、一卷积层 卷积 5x5x1,32个,strides=1
  23. ## 激活 tf.nn.relu,池化
  24. with tf.variable_scope("conv1"): # 作用域
  25. # 随机初始化权重,偏置
  26. w_conv1 = weight_variable([5,5,1,32])
  27. b_conv1 = bias_variable([32])
  28. # 对 x进行形状的改变 [none,784] ---> [none,28,28,1]
  29. x_reshape = tf.reshape(x,[-1,28,28,1])
  30. # 卷积 [none,28,28,1] ---> [none,28,28,32]
  31. x_relu = tf.nn.relu(tf.nn.conv2d(x_reshape,w_conv1,strides=[1,1,1,1],padding="SAME") + b_conv1)
  32. # 池化 2x2,strides=2,[none,28,28,32]---> [none,14,14,32]
  33. x_pool1 = tf.nn.max_pool(x_relu, ksize=[1,2,2,1],strides=[1,2,2,1], padding="SAME")
  34. # 3、二卷积层 卷积 5x5x32,64个,strides=1
  35. # ## 激活 tf.nn.relu,池化
  36. # 随机初始化权重[5, 5, 32, 64],偏置
  37. w_conv2 = weight_variable([5, 5, 32, 64])
  38. b_conv2 = bias_variable([64])
  39. # 卷积,激活,池化计算
  40. # [none,14,14,32] ---> [none,14,14,64]
  41. x_relu2 = tf.nn.relu(tf.nn.conv2d(x_pool1, w_conv2, strides=[1, 1, 1, 1], padding="SAME") + b_conv2)
  42. # 池化 2x2,strides=2,[none,14,14,64]---> [none,7,7,64]
  43. x_pool2 = tf.nn.max_pool(x_relu2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")
  44. # 4、全连接层 [none,7,7,64]---> [none,7*7*64]*[7*7*64,10] +[10] = [none,10]
  45. with tf.variable_scope("conv2"): # 作用域none,
  46. # 随机初始化权重,偏置
  47. w_fc = weight_variable([7*7*64, 10])
  48. b_fc = bias_variable([10])
  49. # 修改形状 [none,7,7,64]---> [none,7*7*64],四维到二维
  50. x_fc_reshape = tf.reshape(x_pool2,[-1,7*7*64])
  51. # 矩阵运算得出每个样本的10个结果
  52. y_predict = tf.matmul(x_fc_reshape, w_fc) + b_fc
  53. return x , y_true ,y_predict
  54. def conv_fc():
  55. #获取真实数据
  56. mnist = input_data.read_data_sets("./data/mnist/", one_hot=True)
  57. # 定义模型,得出输出
  58. x, y_true, y_predict = model()
  59. # 进行交叉熵损失计算
  60. with tf.variable_scope("soft_cross"):
  61. # 求平均交叉熵损失
  62. loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))
  63. # 4、梯度下降求出损失 学习率要比较小
  64. with tf.variable_scope("optimizer"):
  65. train_op = tf.train.GradientDescentOptimizer(0.0001).minimize(loss)# 学习率和最小化损失
  66. # 5、计算准确率
  67. with tf.variable_scope("acc"):
  68. equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))
  69. # equal_list None个样本 [1, 0, 1, 0, 1, 1,..........]
  70. accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))
  71. # 定义一个初始化变量 op
  72. init_op = tf.global_variables_initializer()
  73. # 开启会话去训练
  74. with tf.Session() as sess:
  75. # 初始化变量
  76. sess.run(init_op)
  77. # 循环训练
  78. for i in range(1000):
  79. # 取出真实存在的特征值和目标值
  80. mnist_x, mnist_y = mnist.train.next_batch(50)
  81. # 运行train_op训练
  82. sess.run(train_op, feed_dict={
  83. x: mnist_x, y_true: mnist_y})
  84. print("训练第%d步,准确率为:%f" % (i, sess.run(accuracy, feed_dict={
  85. x: mnist_x, y_true: mnist_y})))
  86. return None
  87. if __name__ == "__main__":
  88. conv_fc()

GoogleNet:

在这里插入图片描述
在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,224人围观)

还没有评论,来说两句吧...

相关阅读