0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數(shù)字中國建設整體布局規(guī)劃,能給ChatGPT帶來什么機會呢?

GPU視覺識別 ? 來源:GPU視覺識別 ? 作者:GPU視覺識別 ? 2023-03-07 11:03 ? 次閱讀

人工智能| NLP|GPU架構

深度學習 | AMD|ChatGPT

最近,ChatGPT又引發(fā)了不少新聞。比如,香港大學已經正式宣布,禁用ChatGPT,目的是防止論文抄襲。再比如,近日,不少美國企業(yè)已經把ChatGPT應用到了日常工作中,甚至代替了部分員工。據(jù)美媒報道,本月早些時候,一家提供就業(yè)服務的平臺對1000家企業(yè)進行了調查,結果顯示,近50%的企業(yè)表示,已經在使用ChatGPT;30%表示,有計劃使用ChatGPT。而在已經使用ChatGPT的企業(yè)中,48%已經讓其代替員工工作。ChatGPT的具體職責包括:客服、代碼編寫、招聘信息撰寫、文案和內容創(chuàng)作、會議記錄和文件摘要等。

中國的商業(yè)力量也開始對ChatGPT進行布局。除了百度和阿里的布局,前段時間美團的原聯(lián)合創(chuàng)始人王慧文,也發(fā)布了一條AI英雄榜,說出資5000萬美元,要打造中國的OpenAI,也就是制造ChatGPT的那家公司。

ChatGPT是由OpenAI開發(fā)的大型語言模型,要求較高的算力才能支持其正常的運行。目前OpenAI提供的ChatGPT-3模型需要數(shù)千億次的浮點運算能力,并且需要超過350GB的存儲空間來存儲模型參數(shù)和相關數(shù)據(jù)。為了支持ChatGPT-3這樣的大型語言模型的運行,需要使用大規(guī)模的GPU集群或者專門的超級計算機。在實際應用中,為了提高性能和減少延遲,通常會使用分布式計算來支持模型的運行。對于較小規(guī)模的語言模型,例如ChatGPT-2,也需要相對較高的算力才能正常運行,通常需要使用高性能計算機或者GPU來支持模型的訓練和推理。

Chat GPT的局限

要想知道,ChatGPT的局限到底是什么?它又會帶來什么樣的問題?必須得先了解,ChatGPT的本質到底是什么?

一、ChatGPT的本質

ChatGPT 的本質是一種基于神經網(wǎng)絡的自然語言處理模型,它通過深度學習技術來學習語言的規(guī)律和語義信息,并生成人類可讀的文本。

具體而言,ChatGPT 采用了一種被稱為“Transformer”的神經網(wǎng)絡架構,它由多個編碼器和解碼器組成,可以有效地處理長序列的文本數(shù)據(jù),并在學習中自動地學習語言規(guī)律和語義信息。ChatGPT 還使用了大量的文本數(shù)據(jù)進行無監(jiān)督學習,使得模型具有較強的泛化能力和語言理解能力。

ChatGPT 的核心思想是基于預訓練的方式,先在大規(guī)模語料庫上進行無監(jiān)督訓練,使得模型具有較強的語言理解和生成能力,然后在特定任務上進行微調,以適應具體的應用場景。這種基于預訓練的方式已經成為了自然語言處理領域的一個重要研究方向,并在各種文本生成和處理任務中取得了顯著的成果。

二、ChatGPT的局限

ChatGPT 作為一種語言模型,能夠在各種自然語言處理任務中表現(xiàn)出色。然而,它仍然存在一些局限性,包括:

1、數(shù)據(jù)偏差

ChatGPT 是基于大規(guī)模的語料庫進行訓練的,如果訓練數(shù)據(jù)存在偏差,例如種族、性別、社會階層等方面的偏差,模型可能會產生與現(xiàn)實世界不一致的結果。

2、計算資源需求高

ChatGPT 模型的參數(shù)非常多,需要大量的計算資源進行訓練和推理。因此,只有大型機構或公司才有能力訓練和使用這種模型。

3、長期依賴問題

雖然 ChatGPT 能夠處理大量的文本信息,但它仍然存在長期依賴問題。在處理長文本時,模型可能會出現(xiàn)信息遺漏或信息重復等問題。

4、對話一致性問題

ChatGPT 在生成對話時,可能會產生與上下文不一致的回答,導致對話的連貫性受到影響。

5、語義理解問題

ChatGPT 能夠生成人類可讀的文本,但其對語義理解的能力仍然有限。在處理某些復雜的語義問題時,模型可能會出現(xiàn)錯誤的回答。

雖然 ChatGPT 存在一些局限性,但隨著技術的不斷發(fā)展,相信這些問題也將逐漸得到解決。

ChatGPT 是否是AI的革命

在人工智能技術的發(fā)展歷程中,ChatGPT代表了自然語言處理技術的一個重要突破,為語言模型的研究和應用提供了新的思路和方法。ChatGPT的成功表明,通過大規(guī)模數(shù)據(jù)的訓練和深度學習技術的應用,人工智能可以在自然語言處理領域取得更好的表現(xiàn)。

因此,可以說ChatGPT代表了人工智能技術的進步和創(chuàng)新,但它并不是整個人工智能的革命,因為人工智能技術的進步還需要依賴于許多其他方面的技術和應用,例如計算機視覺、機器學習、自動化等等。

一、人形機器人

ChatGPT 促進了人機交互能力的提升,加速了算法的采用。NLP技術帶來的人機交互能力,只有人形機器人才有必要,尤其是C端場景。截至2022年10月,Tesla已經發(fā)布了Optimus人形機器人原型機,需要配合算法,形成全面的軟硬件協(xié)同才能落地。我們認為ChatGPT有望提升人形機器人的人機交互能力,加速人形機器人體驗的提升。

在場景2C中,人形機器人需要基于NLP的人機交互能力。人形機器人在與C端用戶打交道時,由于其人形形態(tài)特征,需要人機交互能力作為接受指令的入口。在人機交互技能中,NLP能力無疑是重中之重。人形機器人必須能夠理解人類的指令才能更好地完成各種任務。基于NLP的人機交互能力是類人機器人所需要的。

特斯拉Optimus人形機器人原型機于2022年10月發(fā)布,將在上海進博會上首次面向公眾展出。2022年10月1日,特斯拉在AIDay發(fā)布了人形機器人Optimus原型機,并于2022年11月5日在上海進博會上展示了原件,現(xiàn)場展示的是附殼的二代機。雖然由于交貨時間短,運行功能還不成熟,但現(xiàn)場展示版直立不動,但完成率高現(xiàn)場視頻顯示,樣機已經可以完成物體搬運、澆花等動作。這是TeslaBot首次面向公眾展示,為后續(xù)B端、C端落地埋下伏筆。

pYYBAGQGqWWAeTqfAASsUk-9WOQ929.png

上海進博會現(xiàn)場展示的特斯拉人形機器人

二代版本訓練時間短未能行走,還有出色的組合動作和手部動作。裝殼的最新版本(2代Optimus),這個版本剛出廠還沒有完全訓練,現(xiàn)場也沒有展示其行走功能,但視頻顯示了四肢和細微的手部動作組合,指關節(jié)快速執(zhí)行1、2、6、拳頭等動作,展現(xiàn)高精度、高靈敏度,為未來功能迭代留下巨大想象空間。

poYBAGQGqWaAQkBPAAFoWGb2y6c994.png

現(xiàn)場視頻展示了 TeslaBot 手部精細度

以 AI 算法為核心的運動迭代展示了開創(chuàng)性的想法,從艱難移步到雙腳離地快速行走用了 5 個月的時間。在特斯拉之前,本田ASIMO與波士頓動力機器人等其他人形機器人已經存在很長時間,能夠實現(xiàn)的功能一般為直立行走、揮手、握手、搬運物品、擰瓶蓋等。根據(jù)特斯拉發(fā)布會的官方公告,Tesla Optimus 僅開發(fā)了六個月,但已經基本實現(xiàn)了直立行走、揮手、給植物澆水、搬箱子等算法功能。一口氣提升 4個月,軟件迭代高效。此時,由于二代機才到貨一個月,還沒有完全調試好;但是,我們希望二代機在落地之后能夠在應用中快速學習,實現(xiàn)快速的技術進步和可迭代性。

poYBAGQGqWeAYRC5AASqb3r0yrY914.png

機器人共享汽車自動駕駛算法

機器人是智能手機的超越版本,單靠硬件無法實現(xiàn),需要與軟件算法協(xié)同工作,形成全面協(xié)同。統(tǒng)一的硬件是機器人運行的基礎,需要高精度、高靈敏度和高力矩以滿足各種活動對機器人活動能力的要求。機器人的實際功能是通過綜合算法來實現(xiàn)的,需要智能感知能力、運動控制能力、感控一體技術和AI算法等軟硬件能力的綜合配合。總之,硬件是機器人的軀體,軟件是機器人的靈魂,軟件與硬件的結合,靈魂與肉體的結合,才能構成一個完整的、可用的智能機器人。特斯拉的機器人產品迭代過程以及大量的算法和軟件發(fā)布表明,軟件的生態(tài)進步是推動當前機器人應用場景實現(xiàn)的關鍵因素。

特斯拉人形機器人擁有強大的AI軟硬件完整備份,增加了后續(xù)開發(fā)的效率。除了對感知和控制算法的高要求外,人形機器人應用訓練需要密集的計算負荷、強大的硬件平臺以及合適的軟件開發(fā)工具和框架;同時,迭代改進的算法模型可以提升AI芯片的性能,幫助解決長尾場景難題。軟件、硬件和AI算法的融合,更有利于進一步激活生態(tài),促進機器人未來場景的拓展。

算法框架和AI軟硬件加速訓練的備份,TESLAOT將進入快速迭代時代。強大的算法框架和AI軟硬件儲備才是機器人功能實現(xiàn)的真正核心。未來隨著FSD的逐漸成熟和DOJO的落地,其算法和數(shù)據(jù)的閉環(huán)將進一步夯實。人形機器人在各種場景下的準確度和靈敏度訓練將更加容易,TESLABOT將進入快速迭代時代。

我們認為ChatGPT有望提升人形機器人的人機交互能力,加快算法迭代過程,提升機器人體驗升級。ChatGPT的出現(xiàn)進一步推進了NLP技術前沿,使人機對話體驗不斷優(yōu)化。如果接入機器人應用,有望帶來更好的人形機器人交互體驗,加快人形機器人的落地過程。

二、AI 語音語義

NLP 技術正在不斷優(yōu)化被認為是AI皇冠上的明珠。對話式AI和知識圖譜正在推動行業(yè)發(fā)展。到2026年,國內NLP驅動的相關產業(yè)規(guī)??善魄|。我們認為,ChatGPT算法的突破,進一步提升了NLP技術的天花板,有望加速NLP技術在千行百業(yè)中的應用。

NLP被譽為人工智能皇冠上的明珠,由于語義理解需要海量數(shù)據(jù)讓AI理解常識而壁壘較高。NLP或者說自然語義理解,技術上是指讓人工智能理解人類預測背后的含義。NLP衍生的應用涵蓋方方面面,包括機器翻譯、AI應答機器人等。從技術角度來看,如果要讓人工智能理解人類語言,最大的難點在于讓機器理解人類對話背后的海量常識設定。因此,NLP訓練需要海量數(shù)據(jù),比訓練其他AI技能難度更大,因此被稱為“人工智能皇冠上的明珠”。

對話式人工智能和知識圖譜正在推動工業(yè)規(guī)模的增長。到2026年,國內NLP驅動的相關產業(yè)規(guī)??赏黄魄|。與其他人工智能技術相比,NLP一般不作為獨立產品出售,而是作為一項基礎技術,結合智能語音和知識圖譜等技術,通常以對話式人工智能、機器翻譯、知識庫等形式出現(xiàn),產品不斷涌現(xiàn),在獨立生產模塊的情況下,開發(fā)速度較慢。近兩年,在對話機器人應用的推動下,智能知識庫、分模塊對話、對話語義理解、評論正負識別、對話自動輸出等NLP產品迎來了發(fā)展機遇,并伴隨著通用或垂直行業(yè)知識的發(fā)展在圖譜構建中,NLP 與知識圖譜的綁定關系將更加緊密。據(jù)艾瑞統(tǒng)計研究,到2021年,中國NLP核心產品規(guī)模將達到171億元,帶動規(guī)模將達到450億元,到2026年,核心產品規(guī)模將達到459億元,驅動規(guī)模將超過1000億元。

pYYBAGQGqWeAQxWBAAHFb0A_YSY589.png

2019-2026 年中國 NLP 核心產品及帶動相關產業(yè)規(guī)模

我們認為,作為NLP模型,ChatGPT算法的突破帶來了NLP技術的進一步提升,有望加速NLP技術在智能語音、智能客服、機器人等各個行業(yè)和領域的應用。

三、AI 視覺

AIGC方興未艾,圖像識別技術進入落地階段,有望催化進一步迭代。一方面AIGC技術方興未艾。這種基于AI的人工智能創(chuàng)作有望在未來徹底改變內容生產方式,而NLP能力是其生產力的重要組成部分。ChatGPT有望加速其技術迭代。另一方面,AI圖像識別技術進入廣泛應用階段,以??低?/u>、大華為首的龍頭企業(yè)已將該技術應用于G端安防、B端產業(yè)/文旅等領域,助力降低成本和提高效率。

1、圖像識別技術已經相對成熟,進入廣泛落地階段

人工智能圖像識別技術進入廣闊應用階段,以???、大華為首的人工智能視覺領軍企業(yè)已將技術應用于安防、工業(yè)、文旅等領域。???、大華等企業(yè)以愿景為切入點,落地AI應用,賦能千行百業(yè)降本增效。基于人臉識別、溫度識別、動態(tài)追蹤等技術,???、大華等人工智能龍頭企業(yè)為制造、旅游、金融等行業(yè)提出了智能化解決方案,有效降本增效。

1)在制造業(yè),老板車間與??低暫献?,實現(xiàn)AR數(shù)字車間,助力智能生產。??低暲肁R視頻技術結合企業(yè)生產信息化,推出AR數(shù)字車間業(yè)務,為老板電器無人工廠“九天中樞”智能制造平臺提供助力。AR數(shù)字車間可以在直觀的物理世界屏幕上為現(xiàn)場管理人員提供生產線和設備的實時數(shù)據(jù),并將大量視頻畫面、生產數(shù)據(jù)和設備數(shù)據(jù)組合成一個視圖,幫助企業(yè)更快地應對突發(fā)事件;還可以將現(xiàn)場人員與管理人員或遠程專家聯(lián)系起來,提供遠程實時指導;同時,通過視頻圖像可以確定分配給高周轉量產品的線邊空間量,實時監(jiān)控裝卸、計劃數(shù)據(jù)、產出數(shù)據(jù),幫助公司優(yōu)化空間。

poYBAGQGqWiASixhAAbnbvH8t0g400.png

??低?AR 數(shù)字工廠示意圖

2)旅游景區(qū):AI機器視覺助力實現(xiàn)客流管理、智能運維、火災預警和環(huán)境動植物監(jiān)測?;谥悄軝z測終端、智能網(wǎng)絡、物聯(lián)網(wǎng)技術和移動應用,人工智能機器視覺可實現(xiàn)景區(qū)地理、自然資源、基礎設施和景區(qū)管理的數(shù)字化和可視化;完善旅游景區(qū)車輛、人員、資產和事件的安全管理。同時,通過智能分析和數(shù)據(jù)應用,增強景區(qū)安全,優(yōu)化景區(qū)管理,豐富游客服務,助力景區(qū)環(huán)境和經濟可持續(xù)發(fā)展。目前,大華股份的旅游景區(qū)解決方案已應用于四川大邑縣、福建清源山景區(qū)等地的全域旅游項目。

大華股份智慧景區(qū)項目展示

2、AIGC技術方興未艾,基于NLP技術未來有望創(chuàng)新內容創(chuàng)作方式

AIGC是一種利用AI技術自動生成內容的生產方式,包括文本、圖片、視頻等多種形式的內容。AIGC 是基于人工智能的內容生產,一般來說,使用形式是將需要生成的內容通過句子以一定的格式描述出來,然后讓AI系統(tǒng)自動生成文字/圖片/視頻等。目前,國內外已有多家廠商在AIGC領域布局,比如國內的 AI 小說續(xù)寫軟件彩云小夢、OpenAI 推出的 AI 繪畫 模型 Dall-E、知名 AI 繪畫網(wǎng)站 midjourney 等。

poYBAGQGqWmAcpi3AAJ-FI-tKMA124.png

AIGC 應用領域一覽

NLP 能力決定了 AIGC 應用對用戶意圖的理解力,是生產力的重要組成部分,ChatGPT 的到來有望加速其技術迭代。由于目前 AIGC 的生產模式,是通過語言文字的方式輸入 用戶需求,所以,如何理解用戶所描述的內容,就成為決定成品效果的重要因素。而 NLP 技術,正是理解用戶意圖的關鍵所在。ChatGPT 作為當前效果最好的對話式 NLP 模型之 一,它的出現(xiàn)有望提升 AI 理解人類意圖的水平,從而加速 AIGC 技術的迭代。

Chat GPT 的底層架構

作為一種人工智能模型,ChatGPT 的訓練和推理需要大量的計算資源。與 CPU 相比,GPU 具有更高的并行性和處理能力,因此常常被用來加速深度學習任務的運算。因此,ChatGPT 的訓練和推理通常會利用 GPU 來加速計算。

在訓練過程中,ChatGPT 的架構可以采用分布式訓練的方式,使用多個 GPU 并行計算,以加速訓練過程。在推理階段,ChatGPT 可以使用 GPU 進行加速,以實現(xiàn)更快的響應時間和更高的吞吐量。

對于 GPU 的選擇,一般來說,需要考慮 GPU 的計算能力、內存大小、功耗、價格等因素。同時,也需要考慮 GPU 的架構是否與 ChatGPT 的計算需求相匹配,以獲得最佳的性能和效率。例如,NVIDIA 的 Volta、Turing 和 Ampere 架構都被廣泛應用于深度學習領域,包括 ChatGPT 的訓練和推理。

GPU的核心競爭力在于架構等因素決定的性能先進性和計算生態(tài)壁壘。國內GPU廠商紛紛大力投入研發(fā)快速迭代架構,推動產業(yè)開放構建自主生態(tài),加速追趕全球頭部企業(yè)。國產替代需求持續(xù)釋放疊加國際局勢不確定性加劇, AI、數(shù)據(jù)中心、智能汽車、游戲等GPU需求有望高增,國產GPU迎來發(fā)展黃金期,我們看好國產GPU公司的發(fā)展與投資機遇。

一、如何理解GPU的架構

為了充分理解GPU的架構,讓我們再返回來看下第一張圖,一個顯卡中絕大多數(shù)都是計算核心core組成的海洋。在圖像縮放的例子中,core與core之間不需要任何協(xié)作,因為他們的任務是完全獨立的,然而,GPU解決的問題不一定這么簡單,讓我們來舉個例子。

假設我們需要對一個數(shù)組里的數(shù)進行求和,這樣的運算屬于reductuin family類型,因為這樣的運算試圖將一個序列“reduce”簡化為一個數(shù)。計算數(shù)組的元素總和的操作看起來是順序的,我們只需要獲取第一個元素,求和到第二個元素中,獲取結果,再將結果求和到第三個元素,以此類推。

pYYBAGQGqWqAUpPgAABAzCsyUSs043.jpg

令人驚訝的是,一些看起來本質是順序的運算,其實可以再并行算法中轉化。假設一個長度為8的數(shù)組,在第一步中完全可以并行執(zhí)行兩個元素和兩個元素的求和,從而同時獲得四個元素,兩兩相加的結果,以此類推,通過并行的方式加速數(shù)組求和的運算速度。具體的操作如下圖所示,

poYBAGQGqWqAFUWbAABBnPKEzGI823.jpg

如上圖計算方式,如果是長度為8的數(shù)組兩兩并行求和計算,那么只需要三次就可以計算出結果。如果是順序計算需要8次。如果按照兩兩并行相加的算法,N個數(shù)字相加,那么僅需要log2(N)次就可以完成計算。

從GPU的角度來講,只需要四個core就可以完成長度為8的數(shù)組求和算法,我們將四個core編號為0,1,2,3。

那么第一個時鐘下,兩兩相加的結果通過0號core計算,放入了0號core可以訪問到的內存中,另外兩兩對分別由1號2號3號core來計算,第二個個時鐘繼續(xù)按照之前的算法計算,只需要0號和1號兩個core即可完成,以此類推,最終的結果將在第三個時鐘由0號core計算完成,并儲存在0號core可以訪問到的內存中。這樣實際三次就能完成長度為8的數(shù)組求和計算。

pYYBAGQGqWuATCcoAABwpCWUByg206.jpg

如果GPU想要完成上述的推理計算過程,顯然,多個core之間要可以共享一段內存空間以此來完成數(shù)據(jù)之間的交互,需要多個core可以在共享的內存空間中完成讀/寫的操作。我們希望每個Cores都有交互數(shù)據(jù)的能力,但是不幸的是,一個GPU里面可以包含數(shù)以千計的core,如果使得這些core都可以訪問共享的內存段是非常困難和昂貴的。出于成本的考慮,折中的解決方案是將各類GPU的core分類為多個組,形成多個流處理器(Streaming Multiprocessors )或者簡稱為SMs。

二、最終的GPU架構

poYBAGQGqWyAXZwwAAFK6Gm7ZDs066.jpg

The Turing architecture

上圖的綠色部分意味著Core計算單元,綠色的塊就是上文談到的Streaming Multiprocessors,理解為Core的集合。黃色的部分名為RT COREs畫的離SMs非常近。單個SM的圖靈架構如下圖所示

pYYBAGQGqWyAJZZqAADsZuNMnE0242.jpg

The Turing SM

在SM的圖靈結構中,綠色的部分CORE相關的,我們進一步區(qū)分了不同類型的CORE。主要分為INT32,FP32,TENSOR CORES。FP32 Cores,執(zhí)行單進度浮點運算,在TU102卡中,每個SM由64個FP32核,TU120由72個SMs因此,F(xiàn)P32 Core的數(shù)量是 72 * 64。

FP64 Cores. 實際上每個SM都包含了2個64位浮點計算核心FP64 Cores,用來計算雙精度浮點運算,雖然上圖沒有畫出,但是實際是存在的。Integer Cores,這些core執(zhí)行一些對整數(shù)的操作,例如地址計算,可以和浮點運算同時執(zhí)行指令。在前幾代GPU中,執(zhí)行這些整型操作指令都會使得浮點運算的管道停止工作。TU102總共有4608個Integer Cores,每個SM有64個SM。

Tensor Cores,張量core是FP16單元的變種,認為是半精度單元,致力于張量積算加速常見的深度學習操作。圖靈張量Core還可以執(zhí)行INT8和INT4精度的操作,用于可以接受量化而且不需要FP16精度的應用場景,在TU102中,我們每個SM有8個張量Cores,一共有8 * 72個Tensor Cores。

在大致描述了GPU的執(zhí)行部分之后,讓我們回到上文提出的問題,各個核心之間如何完成彼此的協(xié)作?

在四個SM塊的底部有一個96KB的L1 Cache,用淺藍色標注的。這個cache段是允許各個Core都可以訪問的段,在L1 Cache中每個SM都有一塊專用的共享內存。作為芯片上的L1 cache的大小是有限的,但它非???,肯定比訪問GMEM快得多。

實際上L1 CACHE擁有兩個功能,一個是用于SM上Core之間相互共享內存,另一個則是普通的cache功能。當Core需要協(xié)同工作,并且彼此交換結果的時候,編譯器編譯后的指令會將部分結果儲存在共享內存中,以便于不同的core獲取到對應數(shù)據(jù)。當用作普通cache功能的時候,當core需要訪問GMEM數(shù)據(jù)的時候,首先會在L1中查找,如果沒找到,則回去L2 cache中尋找,如果L2 cache也沒有,則會從GMEM中獲取數(shù)據(jù),L1訪問最快 L2 以及GMEM遞減。緩存中的數(shù)據(jù)將會持續(xù)存在,除非出現(xiàn)新的數(shù)據(jù)做替換。從這個角度來看,如果Core需要從GMEM中多次訪問數(shù)據(jù),那么編程者應該將這塊數(shù)據(jù)放入功能內存中,以加快他們的獲取速度。其實可以將共享內存理解為一段受控制的cache,事實上L1 cache和共享內存是同一塊電路中實現(xiàn)的。編程者有權決定L1 的內存多少是用作cache多少是用作共享內存。

最后,也是比較重要的是,可以儲存各個core的計算中間結果,用于各個核心之間共享的內存段不僅僅可以是共享內存L1,也可以是寄存器,寄存器是離core最近的內存段,但是也非常小。最底層的思想是每個線程都可以擁有一個寄存器來儲存中間結果,每個寄存器只能由相同的一個線程來訪問,或者由相同的warp或者組的線程訪問。

三、海外復盤:NVIDIA與AMD(ATI)的競爭貫穿GPU發(fā)展歷程,架構創(chuàng)新升級和新興AI等領域前瞻探索是領跑的關鍵

1、NVIDIA長期居于GPU市場領導地位,近年AMD憑借RDNA架構在游戲市場強勢崛起。Verified Market Research數(shù)據(jù)顯示,2022年全球獨立GPU市場規(guī)模約448.3億美元,NVIDIA和AMD的市場份額占比約為8:2。根據(jù)JPR數(shù)據(jù),NVIDIA憑借自身性能領先和CUDA生態(tài)優(yōu)勢性 始終占有GPU領域超50%的市場份額,數(shù)據(jù)中心業(yè)務更是全面領先,在游戲顯卡領域,近年AMD憑借RDNA系列架構強勢崛起。

2、NVIDIA先后與AMD等企業(yè)在性能方面競爭博弈,架構創(chuàng)新升級和新興領域前瞻探索是領跑GPU行業(yè)的關鍵。NVIDIA憑借性能領先長期占據(jù)超五成市場份額,AMD(ATI)也曾因架構出色、性能驚艷實現(xiàn)反超。同時NVIDIA早在2006年前瞻性布局通用計算、構建CUDA生態(tài),為如今AI&數(shù)據(jù)中心領域的全面領先構筑牢固的壁壘。NVIDIA積極布局異構芯片、汽車、元宇宙等新市場,尋找新的強有力業(yè)務增長點。

四、國內GPU市場:各應用場景市場廣闊,國內廠商大有可為

1、GPU市場空間廣闊,國內企業(yè)規(guī)模逐步起量

2022年全球GPU市場規(guī)模達到448.3億美元,國內外市場空間正高速增長,年復合增長率達到32.8% ,Verified Market Research 數(shù)據(jù)顯示,2020年,全球GPU市場規(guī)模為254.1億美元,且該機構預計2028年市場規(guī)模將達到2465.1億美元, 對應年復合增長率達32.8%。

國際獨立GPU市場由Nvidia、AMD八二分成,國內市場中國企業(yè)體量快速增長國際市場上,英偉達、AMD瓜分市場,Jon Peddie Research數(shù)據(jù)顯示2022Q1英偉達占據(jù)79%市場份額,AMD占據(jù)21%。英偉達在獨立GPU領域一枝獨秀,AMD在集成GPU領域可與英偉達競爭。根據(jù)各公司財報,國內GPU龍頭企業(yè)景嘉微2022年上半年營業(yè)收入5.44億人民幣,2021年營業(yè)收入10.93億人民幣;2022年上半年海光信息營業(yè)收入為25.3億元,而英偉達2022Q2營收為67億美元,2021年NVIDIA中國區(qū)的營收約為71億美元。相比之下,國產廠商相對規(guī)模暫時較小,未來成長空間廣闊。

poYBAGQGqW2AdbI7AADPQfjBeys108.png

2、國內市場:GPU應用市場可劃分為—AI和數(shù)據(jù)中心、智能汽車、游戲

1)需求端1—AI

ChatGPT等AI大模型加速對大算力的需求

2022年11月人工智能實驗室 OpenAI 推出了一款AI對話系統(tǒng)—ChatGPT,ChatGPT模型從 GPT-3.5 系列中的一個模型微調而成,并在 Azure AI 超級計算基礎設施上進行訓練,能夠進行有邏輯的對話、撰寫代碼、撰寫劇本、糾正錯誤、拒絕不正當?shù)恼埱蟮?,效果超越大眾預期。這標志著對話類人工智能可以在大范圍、細節(jié)問題上給出較合理準確的答案,并根據(jù)上下文形成一定像人類一樣有邏輯且有創(chuàng) 造力的回答。ChatGPT的優(yōu)化主要來自模型的增大,以及因此帶來的算力增加。GPT、GPT-2和GPT-3(當前開放的版本為GPT-3.5)的參數(shù)量從1.17 億增加到1750億,預訓練數(shù)據(jù)量從5GB增加到45TB,其中GPT-3訓練單次的成本就高達460萬美元。

pYYBAGQGqW2AJNTrAAMRqXp_368346.png

大模型算力

數(shù)據(jù)中心和終端場景不斷落地對計算芯片提出更多更高需求

依據(jù)部署位置劃分,AI芯片可以細分為終端芯片和云端芯片,云端芯片市場空間約為終端芯片的2-3倍。云端芯片:云端芯片應用于云端服務器,可以進一步細分為推理芯片和訓練芯片。根據(jù)甲子光年數(shù)據(jù),2018年中國云端芯片市場約46.1 億元,該機構預計2023年增長至384.6億元。終端芯片:應用于嵌入式、移動終端、智能制造、智能家居等領域的AI芯片,終端芯片需要低功耗和更高的能效比,但是對算力的需求也相對較低,主要應用于AI推理。根據(jù)甲子光年數(shù)據(jù),2018年中國終端芯片市場約15億元,該機構預計2023年增長至173億元。

AI芯片總市場232億元,其中云端芯片市場空間更大,預計終端芯片將隨著AI在多行業(yè)落地將進一步放量。甲子光年預測,中國AI芯片市場規(guī)模將從2021年232億元增長至2023年的500億元左右,對應中國云端芯片市場的復合增長率為52.8%;終端芯片市場規(guī)模相對較小,但由于人工智能在汽車、安防、智能家居等行業(yè)滲透,屆時市場規(guī)模增長率達到62.2%。

poYBAGQGqW6AFhYtAACBiuk0DW8761.png

中國終端AI芯片市場規(guī)模(億元)

2)需求端2—汽車:汽車智能化浪潮下控制器GPU市場前景廣闊。自動駕駛和智能座艙是智能汽車中具有廣闊前景的方向。蓋世汽車數(shù)據(jù)預計,2025年自動駕駛域控制器出貨量將達到432萬臺,每臺自動駕駛域控制器配備1-4片高性能計算GPU;智能座艙域控制器出貨量達到528萬臺,絕大多數(shù)智能座艙域控制器配備1片GPU。自動駕駛技術進一步智能化拉動汽車GPU市場規(guī)??焖贁U張。

3)需求端3—游戲:游戲玩家人數(shù)持續(xù)增長,游戲GPU市場穩(wěn)中有升。Newzoo Expert數(shù)據(jù)顯示全球游戲玩家人數(shù)在2021年已達到30.57億人,且預計2020-2025年全球游戲玩家人數(shù)復合年增率為4.2%;游戲市場內,游戲機和PC兩大主體出貨量再創(chuàng)新高,游戲機三大巨頭2021年出貨量高達4008萬臺;2021年Q4全球PC GPU出貨量(包括集成和獨立顯卡)高達11000萬片。

3、國內GPU發(fā)展現(xiàn)狀

1)GPU市場規(guī)模逐年增長:據(jù)市場研究公司IDC數(shù)據(jù)顯示,2020年中國GPU市場規(guī)模為92.9億美元,同比增長15.5%。其中游戲、數(shù)據(jù)中心、人工智能等領域是GPU市場的主要需求方。

2)國內GPU廠商崛起:中國有多家GPU廠商在市場中嶄露頭角,例如華為、寒武紀、顯現(xiàn)科技、紫光展銳等。這些公司在GPU技術研發(fā)、產品創(chuàng)新、市場拓展等方面取得了不少成果,并開始在一些領域嶄露頭角。

3)國內GPU技術水平提升:中國在GPU技術研發(fā)領域也取得了一些成果,例如國產化的GPU服務器、AI加速卡、圖像處理器等,這些技術的出現(xiàn)使得國內GPU應用的范圍進一步擴大。

4)GPU在科研領域的應用逐步增多:GPU在科研領域的應用逐步增多,例如天河系列超級計算機、中國科學院的高性能計算平臺等。GPU的應用不僅加速了科研進程,也為國家科技創(chuàng)新提供了支撐。

pYYBAGQGqW-AB_WtAAVfv5U7Wd4052.png

總結

數(shù)字中國建設是中國國家發(fā)展戰(zhàn)略的一部分,旨在推動數(shù)字化、信息化和網(wǎng)絡化的全面發(fā)展,提高數(shù)字經濟的貢獻率,構建數(shù)字社會和數(shù)字政府,加強國家信息安全和網(wǎng)絡安全等。數(shù)字中國建設的整體布局規(guī)劃應該包括以下幾個方面:

1、建設數(shù)字基礎設施:包括建設高速寬帶網(wǎng)絡、移動通信網(wǎng)絡、物聯(lián)網(wǎng)等數(shù)字基礎設施,提高網(wǎng)絡帶寬和速度,實現(xiàn)全國覆蓋。

2、推進數(shù)字產業(yè)發(fā)展:包括培育數(shù)字經濟新業(yè)態(tài),加強數(shù)字產業(yè)集聚區(qū)建設,促進數(shù)字化轉型,提高數(shù)字產業(yè)的國際競爭力。

3、構建數(shù)字社會:加強數(shù)字技術與社會發(fā)展的融合,建立數(shù)字健康、數(shù)字教育、數(shù)字文化等數(shù)字社會基礎設施,提高人民群眾的數(shù)字素養(yǎng)和數(shù)字生活質量。

4、推進數(shù)字政府建設:通過建設數(shù)字政府平臺、數(shù)字化行政審批、電子政務等手段,提高政府工作效率和公共服務水平,推進政府治理現(xiàn)代化。

5、加強信息安全和網(wǎng)絡安全:建設信息安全和網(wǎng)絡安全的法律制度體系,強化網(wǎng)絡空間安全管理,提高信息安全和網(wǎng)絡安全能力。

通過數(shù)字中國建設的整體布局規(guī)劃,可以實現(xiàn)數(shù)字化、信息化和網(wǎng)絡化的全面發(fā)展,加速數(shù)字經濟的發(fā)展,提高社會生產力和國家綜合實力。此外,ChatGPT可以通過學習數(shù)字中國建設的整體布局規(guī)劃,深入了解數(shù)字技術在國家戰(zhàn)略和社會發(fā)展中的應用,從而提高對數(shù)字經濟、數(shù)字社會、數(shù)字政府等領域的理解和認知,為未來發(fā)展提供更加全面和深入的思路和支持。

審核編輯黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5402

    瀏覽量

    133707
  • 人工智能
    +關注

    關注

    1789

    文章

    46316

    瀏覽量

    236480
  • 深度學習
    +關注

    關注

    73

    文章

    5431

    瀏覽量

    120790
  • npl
    npl
    +關注

    關注

    0

    文章

    5

    瀏覽量

    2346
  • ChatGPT
    +關注

    關注

    28

    文章

    1523

    瀏覽量

    7249
收藏 人收藏

    評論

    相關推薦

    科技大廠競逐AIGC,中國ChatGPT在哪?

    。 圖源:OpenAI官網(wǎng) 中國AI水平與ChatGPT有多大的差距?中國如何訓練出這樣的GPT大模型?難點又在哪里? ChatGPT是AIGC的一種實現(xiàn)。在AIGC的大模型
    發(fā)表于 03-03 14:28

    紫光集團從“芯”到“云”戰(zhàn)略布局,助推數(shù)字中國建設

    2018年4月22日——首屆數(shù)字中國建設成果峰會在福建省福州市福州海峽國際會展中心盛大開幕。紫光集團作為中國最大的綜合性集成電路企業(yè),以“從芯到云 紫光芯 ? 強國夢”為主題,攜“芯”、“云”系列成果受邀參加首屆
    的頭像 發(fā)表于 04-24 10:58 ?5425次閱讀

    數(shù)字中國建設峰會開幕,百度亮出科研成果

    首屆數(shù)字中國建設峰會將在福建省福州市舉行。作為峰會的重要組成部分,首屆數(shù)字中國建設峰會成果展覽會率先拉開帷幕,展覽會集中展示十八大以來數(shù)字
    發(fā)表于 06-11 02:27 ?1886次閱讀

    軟件定義存儲助力數(shù)字中國建設

    2021年初發(fā)布的“十四五”規(guī)劃綱要中提出:“迎接數(shù)字時代,激活數(shù)據(jù)要素潛能,推進網(wǎng)絡強國建設,加快建設數(shù)字經濟、
    發(fā)表于 05-27 14:13 ?362次閱讀
    軟件定義存儲助力<b class='flag-5'>數(shù)字</b><b class='flag-5'>中國建設</b>

    第五屆數(shù)字中國建設峰會亮點一文看

    第五屆數(shù)字中國建設峰會亮點一文看 第五屆數(shù)字中國建設峰會于2022年7月23日至24日在福建省福州市舉辦本屆峰會的主題是創(chuàng)新驅動新變革,數(shù)字
    發(fā)表于 07-22 18:20 ?799次閱讀

    中興通訊正持續(xù)推動數(shù)字中國建設

    以“創(chuàng)新驅動新變革,數(shù)字引領新格局”為主題的第五屆數(shù)字中國建設峰會在福州舉行。中興通訊作為數(shù)字經濟筑路者,正持續(xù)推動數(shù)字
    的頭像 發(fā)表于 07-25 11:43 ?2697次閱讀

    數(shù)字中國建設整體布局規(guī)劃印發(fā) 做強做優(yōu)做大數(shù)字經濟

    據(jù)新華社報道,《數(shù)字中國建設整體布局規(guī)劃》正式印發(fā),要求各地區(qū)各部門結合實際認真貫徹落實。 《規(guī)劃
    的頭像 發(fā)表于 02-28 13:49 ?638次閱讀

    航天宏圖以數(shù)字鄉(xiāng)村架構體系探索踐行數(shù)字中國建設

    鄉(xiāng)村是鄉(xiāng)村振興的戰(zhàn)略方向之一,也是建設數(shù)字中國的重要內容。 由于城鄉(xiāng)“數(shù)字鴻溝”的存在,農村地區(qū)的數(shù)字
    的頭像 發(fā)表于 02-28 15:13 ?1863次閱讀

    數(shù)字中國升級為國策!IoT產業(yè)細分賽道迎來黃金期-IOTE物聯(lián)網(wǎng)展

    近日,中共中央、國務院印發(fā)了《數(shù)字中國建設整體布局規(guī)劃》(以下簡稱《規(guī)劃》),對
    的頭像 發(fā)表于 03-01 09:02 ?489次閱讀
    <b class='flag-5'>數(shù)字</b><b class='flag-5'>中國</b>升級為國策!IoT產業(yè)細分賽道迎來黃金期-IOTE物聯(lián)網(wǎng)展

    王春暉解讀《數(shù)字中國建設整體布局規(guī)劃

    其次,構建數(shù)據(jù)資源體系,主要是統(tǒng)籌和建立國家公共數(shù)據(jù)資源體系。國家公共數(shù)據(jù)資源體系的建設應當遵循五項原則,即統(tǒng)籌規(guī)劃、需求導向、分類分級、統(tǒng)一標準、規(guī)范應用、安全有序。
    的頭像 發(fā)表于 03-08 10:08 ?574次閱讀

    數(shù)字中國規(guī)劃出臺,軟通動力用數(shù)字技術夯實數(shù)字經濟的&quot;底層邏輯&quot;

    、醫(yī)療、交通、能源等重點領域,加快數(shù)字技術創(chuàng)新應用"。近日,中共中央、國務院印發(fā)《數(shù)字中國建設整體布局規(guī)
    的頭像 發(fā)表于 03-09 21:48 ?600次閱讀

    4月26日飛騰亮相第六屆數(shù)字中國建設峰會

    式現(xiàn)代化” 為主題,以宣傳貫徹落實《規(guī)劃》為主線,設置了 “1+3+N” 的系列活動,旨在展示數(shù)字中國建設最新成果,分享發(fā)展經驗,進一步加快數(shù)字中國
    的頭像 發(fā)表于 04-25 18:05 ?864次閱讀

    西「景」洞察丨《關于落實數(shù)字中國建設總體部署,加快推動智慧民航建設發(fā)展的指導意見》

    日前,中國民用航空局發(fā)布 《關于落實數(shù)字中國建設總體部署加快推動智慧民航建設發(fā)展的指導意見》 (以下簡稱《指導意見》)。《指導意見》是中國
    的頭像 發(fā)表于 07-21 18:25 ?957次閱讀
    西「景」洞察丨《關于落實<b class='flag-5'>數(shù)字</b><b class='flag-5'>中國建設</b>總體部署,加快推動智慧民航<b class='flag-5'>建設</b>發(fā)展的指導意見》

    元宇宙與AI加速推進數(shù)字中國建設,需關注降本增效

    黨的二十大以來,發(fā)展數(shù)字經濟和建設數(shù)字中國被反復提及。在今年全國兩會召開前夕,中共中央、國務院印發(fā)《數(shù)字
    的頭像 發(fā)表于 11-15 17:09 ?499次閱讀

    中興通訊亮相第七屆數(shù)字中國建設峰會

    第七屆數(shù)字中國建設峰會在福州拉開帷幕,峰會以“釋放數(shù)據(jù)要素價值,發(fā)展新質生產力”為主題,展示數(shù)字成果、探索未來方向,推進數(shù)字中國建設
    的頭像 發(fā)表于 10-15 10:43 ?278次閱讀