0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)將教授的白板草圖轉(zhuǎn)換為可用的模型

MATLAB ? 來源:MATLAB ? 作者:MATLAB ? 2022-12-15 15:39 ? 次閱讀

有些研究課題是為了回答理論問題。有些研究課題是為了解決研究人員自己的問題。伊斯坦布爾理工大學(xué)的人工智能智能系統(tǒng)實驗室主任、控制和自動化工程教授 Tufan Kumbasar 的研究就屬于后一種情況。

控制和自動化工程師經(jīng)常使用反饋控制架構(gòu) (FCA) 來設(shè)計閉環(huán)控制,目的是管理或調(diào)節(jié)系統(tǒng)的行為以實現(xiàn)預(yù)期的結(jié)果。系統(tǒng)會反饋當(dāng)前狀態(tài)并將其與期望狀態(tài)進行比較,然后系統(tǒng)進行調(diào)整以保持期望狀態(tài)。這種類型的控制系統(tǒng)用于設(shè)置汽車的巡航控制、調(diào)節(jié)加熱系統(tǒng)和管理工廠。

通常,講授控制理論的教授會在白板上繪制 FCA。為了展示和分析系統(tǒng)的動態(tài)行為(即,它在各種輸入下的行為),教授會在模塊圖旁邊繪圖。但這需要時間,而且每次更改 FCA 后都要重新繪圖。解讀這些繪圖可能也很困難。

d5f29bd0-7b97-11ed-8abf-dac502259ad0.jpg

d60a49d8-7b97-11ed-8abf-dac502259ad0.jpg

d637401e-7b97-11ed-8abf-dac502259ad0.jpg

FCA 白板繪圖示例。(圖片所有權(quán):伊斯坦布爾理工大學(xué))“學(xué)生面臨的主要挑戰(zhàn)是識別我的板書和我糟糕的繪圖,它們根本不成比例,”Kumbasar說。“他們很難理解這種圖。”

一種替代方法是在 MATLABSimulink 等科學(xué)計算軟件中重新創(chuàng)建FCA,并將計算出的繪圖投影到屏幕上?!癕ATLAB 有很好的可視化能力,”Kumbasar 說。”但在課堂上編碼需要花費額外的時間和精力。”

然后,Kumbasar 想到了應(yīng)用人工智能 (AI) 來幫助控制系統(tǒng)課堂上的教學(xué)。

“初衷有點自私,”他說?!爱?dāng)時我擔(dān)任學(xué)院副院長,忙于許多行政工作。我同時承擔(dān)部分教學(xué)工作。有一天,我筋疲力盡,告訴我的研究生,我真的很累。我的教學(xué)要么都在計算機上完成,要么都在白板上完成。”

然后,他找到正在積極合作研究深度學(xué)習(xí)方法的研究生 Dorukhan Erdem 和 AykutBeke?!拔艺f’Dorukhan,既然你們在一起研究新穎的結(jié)構(gòu)。為我創(chuàng)建一個應(yīng)用程序怎么樣?我就當(dāng)你們的實驗小白鼠。’”

Kumbasar教授設(shè)想的應(yīng)用程序是一個深度學(xué)習(xí)系統(tǒng),它可以拍攝白板的照片并在 MATLAB 中自動重新創(chuàng)建 FCA。這種想法在 MathWorks 框架內(nèi)是可行的,其中像Simulink 這樣的控制工具與基于學(xué)科的工具箱(如 Deep Learning Toolbox 和 Computer VisionToolbox)在相同的環(huán)境中工作。

▼使用深度學(xué)習(xí)將白板轉(zhuǎn)換為模型

甘作實驗小白鼠意味著需要繪制很多 FCA。Erdem 對這些繪圖進行拍攝并標(biāo)注,以便計算機基于它們進行學(xué)習(xí)。五個院系的教師為六種 FCA 中的每一種至少繪制 10 個模塊圖,總共得到 306 張圖像。教師在不同光照條件下繪制草圖,使這個挑戰(zhàn)更具有現(xiàn)實意義。然后,Erdem 和 Beke 手動標(biāo)注所有模塊和其中的符號。在訓(xùn)練期間,深度學(xué)習(xí)模型會猜測這些標(biāo)簽,并在不正確時調(diào)整其內(nèi)部參數(shù)。

最終的應(yīng)用程序流程發(fā)表在《IEEE Access》期刊上,包括五個步驟。

d65fa392-7b97-11ed-8abf-dac502259ad0.jpg

將白板草圖轉(zhuǎn)換為代碼的步驟圖。(圖片所有權(quán):伊斯坦布爾理工大學(xué))

首先是識別草圖與六種架構(gòu)類型中的哪一種最匹配。Kumbasar 的團隊使用了一種稱為ResNet-50 的預(yù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),它使用 50 個網(wǎng)絡(luò)層和一些跳過中間層的長距離連接,從而提高性能。

306張圖像對于訓(xùn)練神經(jīng)網(wǎng)絡(luò)來說并不算多,尤其是這么大的神經(jīng)網(wǎng)絡(luò),因此團隊采用了兩個技巧。首先是一種稱為遷移學(xué)習(xí)的做法。他們使用預(yù)訓(xùn)練的 ResNet-50網(wǎng)絡(luò)(該網(wǎng)絡(luò)基于成千上萬張日常物品的照片進行訓(xùn)練)并替換了網(wǎng)絡(luò)的最終層,從而僅基于他們自己的照片訓(xùn)練該層。第二個技巧是數(shù)據(jù)增強,該團隊通過創(chuàng)建經(jīng)過稍微旋轉(zhuǎn)或縮放的版本來增加圖像的數(shù)量。經(jīng)過訓(xùn)練后,他們的流程的第一個步驟在對手寫反饋控制架構(gòu)進行分類方面達到了89% 的準(zhǔn)確度。

流程中的第二個步驟是檢測模塊。程序?qū)D像轉(zhuǎn)換為二值圖像- 在黑色背景上顯示白線,沒有其他顏色或灰色。然后,它去除了字符和噪聲。接下來,它填充封閉的形狀,并將模塊與由模塊之間的反饋回路創(chuàng)建的封閉形狀分離開來。

第三個步驟是,流程識別在模塊中書寫的字符,包括數(shù)字和算術(shù)運算符。它將圖像二值化,圍繞每個字符進行裁剪,并應(yīng)用基于3920 個圖像進行訓(xùn)練的另一個神經(jīng)網(wǎng)絡(luò)。

遇到的一個困難是區(qū)分“5”和“s”。Kumbasar 說,“我寫的 5 和 s太相似了。Dorukhan 總是抱怨我的書寫很糟糕。控制工程師憑直覺會認為我不會寫 55+1,寫的應(yīng)該是 5s+1。但 AI系統(tǒng)不具備這種直覺。”盡管如此,此階段的準(zhǔn)確率達到了 96%。

第四個步驟是,應(yīng)用程序?qū)⒆址M合成 MATLAB函數(shù)。如果一個字符位于另一個字符的右上方,系統(tǒng)稱之為指數(shù),并插入“^”。如果一條水平線的上下都有字符,系統(tǒng)將其視為除法而不是減法。

d67f4936-7b97-11ed-8abf-dac502259ad0.jpg

用深度學(xué)習(xí)分割和區(qū)分字符。(圖片所有權(quán):伊斯坦布爾理工大學(xué))

在第五個步驟中,工作流將這些函數(shù)放到正確的模塊中,在 MATLAB 中將它們連接成一個完整的FCA。它還基于團隊創(chuàng)建的模板創(chuàng)建一個 Simulink 圖。

Erdem表示,對于使用 ResNet-50 這樣的神經(jīng)網(wǎng)絡(luò)進行深度學(xué)習(xí)來說,MATLAB 是有用的解決方案。Kumbasar 補充說,通過 MATLAB可以方便地進行流程步驟之間的集成。他認為,“在MATLAB 中,將數(shù)據(jù)數(shù)組和圖像從一個工具箱發(fā)送到另一個工具箱或從同一個工作區(qū)中讀取數(shù)據(jù)是很容易的?!?/p>

▼從草圖開始“當(dāng)這個 FCA 應(yīng)用程序?qū)崟r工作時,我感到很驚訝,”Kumbasar 說?!拔覀冊诓煌庹諚l件下測試整個流程,并混合了各人的書寫,可以說是盡一切可能增加了難度。

各個單獨部分都能良好地工作。Kumbasar 補充說,“但一旦您連接整個流程,如果一個部分出錯,另一個也會受到影響。因此,誤差始終會在從輸入到輸出的過程中放大。”在這里,一切都在按部就班進行?!癉orukhan說這是有趣的工程,讓他充滿動力。他找了很多超高難度的測試圖像?!?/p>

整個系統(tǒng)的成功程度很難度量,該團隊尚未考察學(xué)生在實際教學(xué)中對該系統(tǒng)的體驗,新冠疫情就出現(xiàn)了。他們在YouTube上發(fā)布了一段視頻,視頻中教師在白板上繪制FCA。片刻后,相同的 FCA 出現(xiàn)在白板上方的 Simulink 投影中,隨后是展示其行為的繪圖。

提供白板繪圖的教授之一 ?lker üsto?lu 說,他對此印象深刻。如果該應(yīng)用程序作為產(chǎn)品推出,他會使用它。“它為教學(xué)提供了便利。”

FCA 白板繪圖實時轉(zhuǎn)換為 Simulink。(視頻所有權(quán):伊斯坦布爾理工大學(xué))▼進入理論領(lǐng)域不管該系統(tǒng)多么出色,仍有部分課堂不準(zhǔn)備用 MATLAB 轉(zhuǎn)換白板 FCA。Erdem 對該應(yīng)用程序進行了優(yōu)化,例如將 ResNet 限制在 50 層,使其可以僅在一個 GPU 上實時運行,但它仍需要一臺高分辨率相機和一臺具有GPU的筆記本電腦,而許多課堂并未配備這些設(shè)備。

“科學(xué)研究或者是出于好奇,或者是出于滿足需求。這項研究是滿足我的個人需求?!薄?Tufan Kumbasar,伊斯坦布爾理工大學(xué)人工智能和智能系統(tǒng)實驗主任、控制和自動化工程教授

d6a0d52e-7b97-11ed-8abf-dac502259ad0.jpg

d6c71dce-7b97-11ed-8abf-dac502259ad0.jpg

d6e2e540-7b97-11ed-8abf-dac502259ad0.jpg

借助深度學(xué)習(xí),應(yīng)用程序能夠?qū)⒉煌L(fēng)格的書寫轉(zhuǎn)換為 MATLAB 函數(shù),并將函數(shù)放在正確的模塊中。(圖片所有權(quán):伊斯坦布爾理工大學(xué))

與此同時,研究人員正在考慮進行幾項改進。Erdem 希望該程序能夠處理六種以上的架構(gòu)。當(dāng)字符接觸到周圍的框時,系統(tǒng)也會難以識別,因此 Kumbasar 增加了置信水平,使系統(tǒng)能夠指示其標(biāo)簽的確定性。

集成模糊邏輯也是一個優(yōu)先事項?!霸谀:壿嬛?,您不會說超過一定身高的每個人都是高個子,而其他人都不是,”Kumbasar 解釋道。“人們可能會說個子有點高,從而導(dǎo)致后續(xù)更微妙的決定。在 MATLAB 中很容易建立模糊層,模糊層將其與神經(jīng)網(wǎng)絡(luò)結(jié)合使用,或用于組成完整的模糊系統(tǒng)。”

如果該流程真的成為一種產(chǎn)品,其應(yīng)用范圍可能不僅限于課堂上。教授可能會用它將學(xué)生的手寫試卷或課下作業(yè)轉(zhuǎn)換為 MATLAB 模型來評分。學(xué)生可能用它將自己的課堂筆記數(shù)字化,并在 MATLAB 中使用 FCA。Kumbasar 說他想在研究中做同樣的事情。MathWorks 的工程師 Marco Rossi 指出,許多學(xué)生和研究人員更喜歡用筆和紙來分析問題,然后將手寫內(nèi)容放入 Simulink 中來生成 C 代碼。這種習(xí)慣可能源于控制理論的教學(xué)方式。但有了類似 Kumbasar 推出的這種工具,可能會促使人們在設(shè)計過程中更早地從紙上轉(zhuǎn)移到屏幕上,從而更輕松地使用模塊。

除了解決他自己的問題和推進到理論研究之外,Kumbasar 還提到此項目的另一個好處?!斑@項研究也能很好地激勵本科生,”他說。讓他們認識到工程靈感可以來自每天面對的難題。“科學(xué)研究或者是出于好奇,或者是出于滿足需求?!盞umbasar 說。“這項研究滿足了我的個人需求。”

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 控制系統(tǒng)
    +關(guān)注

    關(guān)注

    41

    文章

    6472

    瀏覽量

    110302
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120793
  • FCA
    FCA
    +關(guān)注

    關(guān)注

    1

    文章

    24

    瀏覽量

    5190

原文標(biāo)題:教學(xué)前沿 | 深度學(xué)習(xí)將教授的白板草圖轉(zhuǎn)換為可用的模型

文章出處:【微信號:MATLAB,微信公眾號:MATLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI大模型深度學(xué)習(xí)的關(guān)系

    AI大模型深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大
    的頭像 發(fā)表于 10-23 15:25 ?96次閱讀

    深度學(xué)習(xí)模型有哪些應(yīng)用場景

    深度學(xué)習(xí)模型作為人工智能領(lǐng)域的重要分支,已經(jīng)在多個應(yīng)用場景中展現(xiàn)出其巨大的潛力和價值。這些應(yīng)用不僅改變了我們的日常生活,還推動了科技進步和產(chǎn)業(yè)升級。以下詳細探討
    的頭像 發(fā)表于 07-16 18:25 ?1106次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型量化的基本方法

    盡量保持模型的性能。這一技術(shù)通過降低模型參數(shù)的位數(shù)來顯著減小模型的大小,加速推理過程,并降低能耗,從而有助于深度
    的頭像 發(fā)表于 07-15 11:26 ?526次閱讀

    深度學(xué)習(xí)模型量化方法

    深度學(xué)習(xí)模型量化是一種重要的模型輕量化技術(shù),旨在通過減少網(wǎng)絡(luò)參數(shù)的比特寬度來減小模型大小和加速推理過程,同時盡量保持
    的頭像 發(fā)表于 07-15 11:01 ?413次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>量化方法

    深度學(xué)習(xí)模型中的過擬合與正則化

    深度學(xué)習(xí)的廣闊領(lǐng)域中,模型訓(xùn)練的核心目標(biāo)之一是實現(xiàn)對未知數(shù)據(jù)的準(zhǔn)確預(yù)測。然而,在實際應(yīng)用中,我們經(jīng)常會遇到一個問題——過擬合(Overfitting)。過擬合是指模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)
    的頭像 發(fā)表于 07-09 15:56 ?566次閱讀

    keras模型轉(zhuǎn)tensorflow session

    在這篇文章中,我們討論如何Keras模型轉(zhuǎn)換為TensorFlow session。 Keras和TensorFlow簡介 Keras是一個高級神經(jīng)網(wǎng)絡(luò)API,它提供了一種簡單、快
    的頭像 發(fā)表于 07-05 09:36 ?387次閱讀

    深度學(xué)習(xí)中的模型權(quán)重

    深度學(xué)習(xí)這一充滿無限可能性的領(lǐng)域中,模型權(quán)重(Weights)作為其核心組成部分,扮演著至關(guān)重要的角色。它們不僅是模型學(xué)習(xí)的基石,更是
    的頭像 發(fā)表于 07-04 11:49 ?608次閱讀

    人工智能深度學(xué)習(xí)的五大模型及其應(yīng)用領(lǐng)域

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)特別是深度學(xué)習(xí)在各個領(lǐng)域展現(xiàn)出了強大的潛力和廣泛的應(yīng)用價值。深度學(xué)習(xí)作為人工智能的一個核心分支,通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實現(xiàn)了對復(fù)雜數(shù)
    的頭像 發(fā)表于 07-03 18:20 ?3000次閱讀

    深度學(xué)習(xí)的典型模型和訓(xùn)練過程

    深度學(xué)習(xí)作為人工智能領(lǐng)域的一個重要分支,近年來在圖像識別、語音識別、自然語言處理等多個領(lǐng)域取得了顯著進展。其核心在于通過構(gòu)建復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,從大規(guī)模數(shù)據(jù)中自動學(xué)習(xí)并提取特征,進而實
    的頭像 發(fā)表于 07-03 16:06 ?942次閱讀

    深度學(xué)習(xí)模型訓(xùn)練過程詳解

    深度學(xué)習(xí)模型訓(xùn)練是一個復(fù)雜且關(guān)鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法。訓(xùn)練一個深度學(xué)習(xí)模型
    的頭像 發(fā)表于 07-01 16:13 ?776次閱讀

    深度學(xué)習(xí)模型優(yōu)化與調(diào)試方法

    深度學(xué)習(xí)模型在訓(xùn)練過程中,往往會遇到各種問題和挑戰(zhàn),如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學(xué)習(xí)
    的頭像 發(fā)表于 07-01 11:41 ?570次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或取代GPU

    對神經(jīng)網(wǎng)絡(luò)進行任何更改,也不需要學(xué)習(xí)任何新工具。不過你可以保留你的 GPU 用于訓(xùn)練。” Zebra 提供了深度學(xué)習(xí)代碼轉(zhuǎn)換為 FPGA
    發(fā)表于 03-21 15:19

    深度學(xué)習(xí)如何訓(xùn)練出好的模型

    算法工程、數(shù)據(jù)派THU深度學(xué)習(xí)在近年來得到了廣泛的應(yīng)用,從圖像識別、語音識別到自然語言處理等領(lǐng)域都有了卓越的表現(xiàn)。但是,要訓(xùn)練出一個高效準(zhǔn)確的深度學(xué)習(xí)
    的頭像 發(fā)表于 12-07 12:38 ?1010次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>如何訓(xùn)練出好的<b class='flag-5'>模型</b>

    如何利用SSTSPICE模型轉(zhuǎn)換為Saber模型呢?

    SaberRD軟件自帶的SPICE-to-SabreTranslator (SST) 實用程序允許您將SPICE(HSPICE、PSPICE)網(wǎng)表或庫轉(zhuǎn)換為MAST網(wǎng)表或模板,使用SST可以自動生成符號。
    的頭像 發(fā)表于 12-05 14:00 ?1273次閱讀
    如何利用SST<b class='flag-5'>將</b>SPICE<b class='flag-5'>模型</b><b class='flag-5'>轉(zhuǎn)換為</b>Saber<b class='flag-5'>模型</b>呢?

    基于深度學(xué)習(xí)的情感語音識別模型優(yōu)化策略

    情感語音識別技術(shù)是一種人類語音轉(zhuǎn)化為情感信息的技術(shù),其應(yīng)用范圍涵蓋了人機交互、智能客服、心理健康監(jiān)測等多個領(lǐng)域。隨著人工智能技術(shù)的不斷發(fā)展,深度學(xué)習(xí)在情感語音識別領(lǐng)域的應(yīng)用越來越廣泛。本文
    的頭像 發(fā)表于 11-09 16:34 ?591次閱讀