0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Flex Logix公司稱它解決了深度學習的DRAM問題

IEEE電氣電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-11-08 14:12 ? 次閱讀

深度學習有一個DRAM問題。設計用來實時處理復雜任務(比如,在汽車的備份攝像頭視頻流中分辨貓和孩子)的系統(tǒng),不斷地將構成神經(jīng)網(wǎng)絡內容的數(shù)據(jù)從存儲器傳送到處理器。

根據(jù)初創(chuàng)公司Flex Logix的說法,問題并不是缺乏存儲這些數(shù)據(jù)的空間,而是處理器和存儲器之間缺乏帶寬。為了將數(shù)百千兆比特的數(shù)據(jù)提供給處理器,有些系統(tǒng)需要4個甚至8個DRAM芯片,這既使占用的空間增加了不少,又消耗了大量的電能。Flex Logix表示,它為可重構芯片開發(fā)的互連技術和tile-based架構將使AI系統(tǒng)只需要1個DRAM芯片的帶寬,且功耗僅為十分之一。

圖片來源:Flex Logix

NMAX512tile的架構。

位于加州山景城的Flex Logix公司已經(jīng)開始將一種新的嵌入式現(xiàn)場可編程門陣列(eFPGA)架構商業(yè)化。但經(jīng)過一番探索后,其創(chuàng)始人之一Cheng C. Wang意識到,這項技術可以加快神經(jīng)網(wǎng)絡的速度。

神經(jīng)網(wǎng)絡由連接和表示連接強度的“權重”組成。另一位創(chuàng)始人Geoff Tate解釋說,一個好的AI芯片需要兩樣東西。一種是一些做關鍵“推斷”計算(即乘法和累加)的電路?!暗щy的是,你必須非常擅長引入所有這些權重,以便其乘法器總能得到它們需要的數(shù)據(jù),從而進行所需的數(shù)學運算。Wang意識到我們在FPGA的互連方面所擁有的技術,他可以對它做適應性改造,來創(chuàng)建一種非常擅長快速高效地加載權重、高性能和低功耗的架構。”

需要快速連續(xù)地將數(shù)百萬個權重加載到網(wǎng)絡中,這就是每秒要做數(shù)萬億次到數(shù)十萬億次運算的AI系統(tǒng)為什么需要那么多DRAM芯片的原因。DRAM芯片上的每個引腳每秒最多可以傳輸4Gb數(shù)據(jù),因此要達到所需的每秒數(shù)百Gb的數(shù)據(jù)傳輸速度,就需要多個芯片。

在為FPGA開發(fā)最初的技術時,Wang注意到,這些芯片有約80%的面積互連,因此他尋求一種能夠縮小互連面積并考慮到更多邏輯的架構。他和他在加州大學洛杉磯分校的同事對一種稱為folded-Bene?網(wǎng)絡的電信架構做了適應性改造來完成這項工作。這使得FPGA架構看起來像一堆邏輯和SRAM的瓦片(tile)。

圖片來源:Flex Logix

Flex Logix公司表示,在芯片中構建分布式SRAM可加快計算速度并降低功耗。

Tate說,在這種專用互連方案中使用分布式SRAM最終會對深度學習的DRAM帶寬問題產(chǎn)生重大影響?!拔覀冋谟眯酒系腟RAM取代DRAM帶寬?!?/p>

圖片來源:Flex Logix

若干NMAXtile可以置于一個芯片上并連在一起,以擴大計算能力。

用于Flex Logix的AI產(chǎn)品的tile稱為NMAX,采用了臺積電的16納米技術,面積不到2平方毫米。每個tile都由一組核心組成,這些核心這些核心負責關鍵的乘法和累加計算、控制數(shù)據(jù)的處理和流動的可編程邏輯以及SRAM。這涉及三種不同類型的互連技術。一種tile上的所有零件連接在一起。另一種將tile與位于tile之間的附加SRAM及外部的DRAM相連接。第三種將相鄰的tile連接在一起。

在深度學習領域,很難進行真正的橫向比較。但Flex Logix的分析顯示,將使用1個DRAM芯片的模擬的6×6tile的NMAX512陣列與使用8個DRAM的Nvidia Tesla T4進行比較,結果是新架構每秒能識別4,600張圖像,而Nvidia每秒識別3,920張圖像。在一項名為YOLOv3的實時視頻處理測試中,同樣大小的NMAX陣列可達到每秒22萬億次運算,而使用的DRAM帶寬是其他系統(tǒng)的十分之一。

Tate表示,首批NMAX芯片的設計將于2019年下半年送至代工廠以便進行制造。

Flex Logix將波音公司視作其高吞吐量嵌入式FPGA產(chǎn)品的客戶之一。但Tate承認,與神經(jīng)網(wǎng)絡相比,嵌入式FPGA是個很難賣的產(chǎn)品?!扒度胧紽PGA是一項很好的業(yè)務,但是推理可能很快就會超越它?!盩ate說。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DRAM
    +關注

    關注

    40

    文章

    2292

    瀏覽量

    183139
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4726

    瀏覽量

    100318
  • 深度學習
    +關注

    關注

    73

    文章

    5439

    瀏覽量

    120797

原文標題:Flex Logix公司稱它解決了深度學習的DRAM問題

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI大模型與深度學習的關系

    人類的學習過程,實現(xiàn)對復雜數(shù)據(jù)的學習和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大,需要龐大的計算資源來進行訓練和推理。深度學習算法為AI大模型提供
    的頭像 發(fā)表于 10-23 15:25 ?132次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之一,廣泛應用于人體活動識別、系統(tǒng)監(jiān)測、金融預測、醫(yī)療診斷等多個領域。隨著深度
    的頭像 發(fā)表于 07-09 15:54 ?536次閱讀

    深度學習中的無監(jiān)督學習方法綜述

    深度學習作為機器學習領域的一個重要分支,近年來在多個領域取得了顯著的成果,特別是在圖像識別、語音識別、自然語言處理等領域。然而,深度學習模型
    的頭像 發(fā)表于 07-09 10:50 ?290次閱讀

    深度學習與nlp的區(qū)別在哪

    方法,通過模擬人腦的神經(jīng)網(wǎng)絡結構,實現(xiàn)對數(shù)據(jù)的自動特征提取和學習。深度學習的核心是構建多層的神經(jīng)網(wǎng)絡結構,每一層都包含大量的神經(jīng)元,這些神經(jīng)元通過權重連接,實現(xiàn)對輸入數(shù)據(jù)的逐層抽象和
    的頭像 發(fā)表于 07-05 09:47 ?658次閱讀

    深度學習中的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是模型智能的源泉。本文將從模型權重的定義、作用、優(yōu)化、管理以及應用等多個方面,深入探討
    的頭像 發(fā)表于 07-04 11:49 ?614次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的一個重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了深度學習研究和應用的首選工具。
    的頭像 發(fā)表于 07-03 16:04 ?473次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,涉及大量的數(shù)據(jù)、計算資源和精心設計的算法。訓練一個深度學習模型,本質上是通過優(yōu)化算法調整模型參數(shù),
    的頭像 發(fā)表于 07-01 16:13 ?794次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器學習的范疇,但
    的頭像 發(fā)表于 07-01 11:40 ?967次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統(tǒng)領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術,使得
    發(fā)表于 04-23 17:18 ?1169次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    FPGA在深度學習應用中或將取代GPU

    現(xiàn)場可編程門陣列 (FPGA) 解決 GPU 在運行深度學習模型時面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達 (Nvidia) 和 AMD 等公司
    發(fā)表于 03-21 15:19

    為什么深度學習的效果更好?

    導讀深度學習是機器學習的一個子集,已成為人工智能領域的一項變革性技術,在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度
    的頭像 發(fā)表于 03-09 08:26 ?542次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的效果更好?

    【技術科普】主流的深度學習模型有哪些?AI開發(fā)工程師必備!

    接近于人工智能。通過學習樣本數(shù)據(jù)的內在規(guī)律和表示層次,對文字、圖像和聲音等數(shù)據(jù)進行解釋。深度學習的目標是讓機器像人一樣具有分析學習能力,能
    的頭像 發(fā)表于 01-30 15:26 ?542次閱讀
    【技術科普】主流的<b class='flag-5'>深度</b><b class='flag-5'>學習</b>模型有哪些?AI開發(fā)工程師必備!

    什么是深度學習?機器學習深度學習的主要差異

    2016年AlphaGo 擊敗韓國圍棋冠軍李世石,在媒體報道中,曾多次提及“深度學習”這個概念。
    的頭像 發(fā)表于 01-15 10:31 ?913次閱讀
    什么是<b class='flag-5'>深度</b><b class='flag-5'>學習</b>?機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的主要差異

    GPU在深度學習中的應用與優(yōu)勢

    人工智能的飛速發(fā)展,深度學習作為其重要分支,正在推動著諸多領域的創(chuàng)新。在這個過程中,GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣,GPU在深度學習中擁有舉足輕重的地位。那么
    的頭像 發(fā)表于 12-06 08:27 ?1158次閱讀
    GPU在<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中的應用與優(yōu)勢

    深度學習在人工智能中的 8 種常見應用

    深度學習簡介深度學習是人工智能(AI)的一個分支,教神經(jīng)網(wǎng)絡學習和推理。近年來,
    的頭像 發(fā)表于 12-01 08:27 ?3110次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在人工智能中的 8 種常見應用