0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

【連載】深度學習筆記13:Tensorflow實戰(zhàn)之手寫mnist手寫數(shù)字識別

人工智能實訓營 ? 2018-10-30 18:50 ? 次閱讀

上一講筆者和大家一起學習了如何使用 Tensorflow 構建一個卷積神經(jīng)網(wǎng)絡模型。本節(jié)我們將繼續(xù)利用 Tensorflow 的便捷性完成 mnist 手寫數(shù)字數(shù)據(jù)集的識別實戰(zhàn)。mnist 數(shù)據(jù)集是 Yann Lecun 大佬基于美國國家標準技術研究所構建的一個研究深度學習的手寫數(shù)字的數(shù)據(jù)集。mnist 由 70000 張不同人手寫的 0-9 10個數(shù)字的灰度圖組成。本節(jié)筆者就和大家一起研究如何利用 Tensorflow 搭建一個 CNN 模型來識別這些手寫的數(shù)字。

640?wx_fmt=png


數(shù)據(jù)導入

mnist 作為標準深度學習數(shù)據(jù)集,在各大深度學習開源框架中都默認有進行封裝。所以我們直接從 Tensorflow 中導入相關的模塊即可:

import tensorflow as tf
from tensorflow.examples.tutorials.mnist
import input_data
# load mnist data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

640?wx_fmt=png

快速搭建起一個簡易神經(jīng)網(wǎng)絡模型

數(shù)據(jù)導入之后即可按照 Tensorflow 的范式創(chuàng)建相應的 Tensor 變量然后創(chuàng)建會話:

# create the session
sess = tf.InteractiveSession()
# create variables and run the session
x = tf.placeholder('float', shape=[None, 784]) y_ = tf.placeholder('float', shape=[None, 10]) W = tf.Variable(tf.zeros([784, 10])) b = tf.Variable(tf.zeros([10])) sess.run(tf.global_variables_initializer())

定義前向傳播過程和損失函數(shù):

#definethenetandlossfunctiony=tf.nn.softmax(tf.matmul(x,W)+b)
cross_entropy=-tf.reduce_sum(y_*tf.log(y))

進行模型訓練:

# train the model
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
for i in range(1000): batch = mnist.train.next_batch(50) train_step.run(feed_dict={x: batch[0], y_: batch[1]})

使用訓練好的模型對測試集進行預測:

# evaluate the model
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) print(accuracy.eval(feed_dict={x: mnist.test.images, y_: mnist.test.labels}))

640?wx_fmt=png
預測準確率為 0.9,雖然說也是一個很高的準確率了,但對于 mnist 這種標準數(shù)據(jù)集來說,這樣的結果還有很大的提升空間。所以我們繼續(xù)優(yōu)化模型結構,為模型添加卷積結構。

搭建卷積神經(jīng)網(wǎng)絡模型

定義初始化模型權重函數(shù):

# initilize the weight
def weight_variable(shape): initial = tf.truncated_normal(shape, stddev=0.1)
return tf.Variable(initial)

def bias_variable(shape): initial = tf.constant(0.1, shape=shape)
return tf.Variable(initial)

定義卷積和池化函數(shù):

# convolutional and pooling
def conv2d(x, W):
return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

def
max_pool_2x2(x):
return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

搭建第一層卷積:

# the first convolution layer
W_conv1 = weight_variable([5, 5, 1, 32]) b_conv1 = bias_variable([32]) x_image = tf.reshape(x, [-1,28,28,1]) h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) h_pool1 = max_pool_2x2(h_conv1)

搭建第二層卷積:

# the second convolution layer
W_conv2 = weight_variable([5, 5, 32, 64]) b_conv2 = bias_variable([64]) h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) h_pool2 = max_pool_2x2(h_conv2)

搭建全連接層:

# dense layer/full_connected layer
W_fc1 = weight_variable([7 * 7 * 64, 1024]) b_fc1 = bias_variable([1024]) h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

設置 dropout 防止過擬合:

# dropout to prevent overfitting
keep_prob = tf.placeholder("float") h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

對輸出層定義 softmax

# model output
W_fc2 = weight_variable([1024, 10]) b_fc2 = bias_variable([10]) y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

訓練模型并進行預測:

# model trainning and evaluating
cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv)) train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) sess.run(tf.initialize_all_variables())
for i in range(20000): batch = mnist.train.next_batch(50)
if i%100 == 0: train_accuracy = accuracy.eval(feed_dict={ x:batch[0], y_: batch[1], keep_prob: 1.0}) print("step %d, training accuracy %g"%(i, train_accuracy)) train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5}) print("test accuracy %g"%accuracy.eval(feed_dict={ x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))

部分迭代過程和預測結果如下:

640?wx_fmt=png

經(jīng)過添加兩層卷積之后我們的模型預測準確率達到了 0.9931,模型訓練的算是比較好了


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4724

    瀏覽量

    100311
  • 人工智能
    +關注

    關注

    1789

    文章

    46324

    瀏覽量

    236496
  • 機器學習
    +關注

    關注

    66

    文章

    8320

    瀏覽量

    132165
收藏 人收藏

    評論

    相關推薦

    繪王原筆跡手寫:高度定制化手寫輸入解決方案

    在過去的數(shù)字化實踐中,手寫輸入產(chǎn)品以其便捷性和準確性,成為通信、銀行、保險、教育、醫(yī)療、稅務、政務等領域不可或缺的工具。面對個性化業(yè)務需求,繪王提供量身定做的原筆跡手寫解決方案,助力企業(yè)在數(shù)字
    的頭像 發(fā)表于 09-28 08:01 ?134次閱讀
    繪王原筆跡<b class='flag-5'>手寫</b>:高度定制化<b class='flag-5'>手寫</b>輸入解決方案

    國產(chǎn)芯上運行TinyMaxi輕量級的神經(jīng)網(wǎng)絡推理庫-米爾基于芯馳D9國產(chǎn)商顯板

    查看cmake版本 make -version 確認文件路徑,盡量不要拷貝到有權限的路徑下 自帶示例 文件結構 MNIST示例MNIST手寫數(shù)字
    發(fā)表于 08-09 18:26

    國產(chǎn)芯上運行TinyMaxi輕量級的神經(jīng)網(wǎng)絡推理庫-米爾基于芯馳D9國產(chǎn)商顯板

    ;/font> 確認文件路徑,盡量不要拷貝到有權限的路徑下 自帶示例 文件結構 MNIST示例MNIST手寫數(shù)字識別
    發(fā)表于 08-07 18:06

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的一個開源深度學習框架,它允許開發(fā)者方便地構建、訓練和部署各種復雜的機器學習模型。TensorFlow
    的頭像 發(fā)表于 07-12 16:38 ?472次閱讀

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度
    的頭像 發(fā)表于 07-02 14:04 ?735次閱讀

    【Vision Board創(chuàng)客營連載體驗】TinyMaix進行手寫數(shù)字識別

    ATmega328 (32KB Flash, 2KB Ram) 都能基于 TinyMaix 跑 mnist(手寫數(shù)字識別) 支持 INT8/FP32/FP16 模型,實驗性地支持 F
    發(fā)表于 06-15 08:40

    智慧教育得力助手:A4手寫板讓筆記輕松數(shù)字

    在追求高效與數(shù)字化的今天,手寫的個性化和準確性依舊無可替代。繪王A4藍牙手寫板正是針對原筆跡手寫數(shù)字化而設計,不僅保留了傳統(tǒng)
    的頭像 發(fā)表于 05-23 08:07 ?392次閱讀
    智慧教育得力助手:A4<b class='flag-5'>手寫</b>板讓<b class='flag-5'>筆記</b>輕松<b class='flag-5'>數(shù)字</b>化

    微軟發(fā)布Windows版OneNote應用AI手寫矯正功能

    微軟官方解釋稱,這一功能旨在優(yōu)化和調整手寫字體,使之更加整潔美觀且更具連貫性。這不僅能提升OneNote中的手寫字體可讀性,而且不會改變原始手寫字效的獨特風格與個性化特點,方便用戶日后再次審閱及分享。
    的頭像 發(fā)表于 04-18 10:59 ?424次閱讀

    HarmonyOS開發(fā)實例:【分布式手寫板】

    使用設備管理及分布式鍵值數(shù)據(jù)庫能力,實現(xiàn)多設備之間手寫板應用拉起及同步書寫內容的功能。
    的頭像 發(fā)表于 04-17 21:45 ?414次閱讀
    HarmonyOS開發(fā)實例:【分布式<b class='flag-5'>手寫</b>板】

    手寫筆及筆尖彈力測試分選應用-磐石測控

    是該行業(yè)需要面對的挑戰(zhàn)。 圖1 傳統(tǒng)手寫筆內部結構 從測試測量的角度來講,所謂8192壓感必須擁有力量測試的重復性,原理上講,內部應該設計有傾角傳感器,力量傳感器來識別對應的壓力力度。如何做到出廠時手寫筆壓力感應的一致性,以及使
    的頭像 發(fā)表于 03-15 11:31 ?280次閱讀
    <b class='flag-5'>手寫</b>筆及筆尖彈力測試分選應用-磐石測控

    162泛海微手寫板專用合封IC芯片

    泛海微推出外圍簡單的合封手寫板芯片,內置集成MOS。162手寫板合封芯片是一款通用的手寫板擦寫自動控制芯片。162手寫板合封芯片為一款內置升壓電路并可以自動產(chǎn)生擦寫脈沖的
    發(fā)表于 03-06 19:27 ?0次下載

    蘋果公司榮獲日歷項手寫技術專利,優(yōu)化Apple Pencil操作體驗

    研究發(fā)現(xiàn),目前通過手寫筆或手指都能完成創(chuàng)建日歷項的工作,然而手寫筆輸入操作繁瑣且效率低下,因而日常生活中多采用手指輸入方式。蘋果公司此次專利旨在設計一種更高效的觸控筆用戶界面。
    的頭像 發(fā)表于 02-27 14:26 ?438次閱讀

    鴻蒙開發(fā)實戰(zhàn)-手寫一個Openharmony投屏工具

    實戰(zhàn)手寫一個Openharmony投屏工具,實現(xiàn)代碼分享如下: java import javax.imageio.ImageIO; import javax.swing.*; import
    發(fā)表于 02-26 16:09

    【先楫HPM5361EVK開發(fā)板試用體驗】TinyMaix進行手寫數(shù)字識別

    ATmega328 (32KB Flash, 2KB Ram) 都能基于 TinyMaix 跑 mnist(手寫數(shù)字識別) 支持 INT8/FP32/FP16 模型,實驗性地支持 F
    發(fā)表于 01-02 23:34

    基于手寫辨識芯片的漢字手寫輸入技術

    電子發(fā)燒友網(wǎng)站提供《基于手寫辨識芯片的漢字手寫輸入技術.pdf》資料免費下載
    發(fā)表于 10-30 11:19 ?0次下載
    基于<b class='flag-5'>手寫</b>辨識芯片的漢字<b class='flag-5'>手寫</b>輸入技術