GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過程中能夠發(fā)揮更大的效能。例如:當(dāng)前最頂級(jí)的CPU只有4核或者6核,模擬出8個(gè)或者12個(gè)處理線程來(lái)進(jìn)行運(yùn)算,但是普通級(jí)別的GPU就包含了成百上千個(gè)處理單元,高端的甚至更多,這對(duì)于多媒體計(jì)算中大量的重復(fù)處理過程有著天生的優(yōu)勢(shì)。下圖展示了CPU和GPU架構(gòu)的對(duì)比。
從硬件設(shè)計(jì)上來(lái)講,CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成。另一方面,GPU 則由數(shù)以千計(jì)的更小、更高效的核心組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。
通過上圖我們可以較為容易地理解串行運(yùn)算和并行運(yùn)算之間的區(qū)別。傳統(tǒng)的串行編寫軟件具備以下幾個(gè)特點(diǎn):要運(yùn)行在一個(gè)單一的具有單一中央處理器(CPU)的計(jì)算機(jī)上;一個(gè)問題分解成一系列離散的指令;指令必須一個(gè)接著一個(gè)執(zhí)行;只有一條指令可以在任何時(shí)刻執(zhí)行。而并行計(jì)算則改進(jìn)了很多重要細(xì)節(jié):要使用多個(gè)處理器運(yùn)行;一個(gè)問題可以分解成可同時(shí)解決的離散指令;每個(gè)部分進(jìn)一步細(xì)分為一系列指示;每個(gè)部分的問題可以同時(shí)在不同處理器上執(zhí)行。
舉個(gè)生活中的例子來(lái)說,你要點(diǎn)一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個(gè)人收到外賣的時(shí)間必然很長(zhǎng);而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點(diǎn)餐之后收貨就會(huì)比大貨車快很多。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
發(fā)表于 10-17 10:07
?77次閱讀
8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢(shì),適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)境。
發(fā)表于 08-23 16:08
?626次閱讀
的方案與實(shí)踐,摩爾線程受邀參展。 此次展覽,摩爾線程展示了基于國(guó)產(chǎn)空間智能軟件技術(shù)SuperMap開發(fā)的最新成果——“摩爾線程全功能GPU加速三維GIS全國(guó)產(chǎn)解決方案”。方案顯示,在國(guó)產(chǎn)GPU的算力支持下,SuperMap三維G
發(fā)表于 06-27 18:15
?847次閱讀
NVIDIA DeepStream 是一款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺 AI 管線的 GPU 加速構(gòu)建模塊。
發(fā)表于 05-23 10:09
?473次閱讀
4月28日至29日,2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)在蘇州召開。作為中國(guó)移動(dòng)合作伙伴,瀚博半導(dǎo)體受邀參與本次大會(huì)并全面展示瀚博產(chǎn)品家族及云電腦、云手機(jī)、云游戲、AI大模型場(chǎng)景下的最新技術(shù)與解決方案,與眾多產(chǎn)業(yè)生態(tài)合作伙伴共話前沿發(fā)展趨勢(shì)與算力未來(lái)。
發(fā)表于 04-30 14:32
?1484次閱讀
基于GPU的向量索引和搜索加速能力,性能可提升 50 倍。 Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆。基準(zhǔn)測(cè)試顯示,與目前市面上最先進(jìn)的基于 CPU 處理器的索引技術(shù)
發(fā)表于 04-01 14:33
?407次閱讀
ASR 是自然語(yǔ)言中一項(xiàng)頗具挑戰(zhàn)性的任務(wù),它由語(yǔ)音分割、聲學(xué)建模和語(yǔ)言建模等一系列子任務(wù)組成,根據(jù)噪聲和未分割的輸入數(shù)據(jù)形成預(yù)測(cè)(標(biāo)簽序列)。
發(fā)表于 02-28 15:01
?4124次閱讀
盡管谷歌團(tuán)隊(duì)于今年初就推介了這個(gè)GPU加速的人臉生成項(xiàng)目,但仍有部分用戶反映出生成的歷史名人形象存在著錯(cuò)誤,因此決定實(shí)行技術(shù)停擺,并謀劃對(duì)這一功能進(jìn)行調(diào)整和優(yōu)化。
發(fā)表于 02-27 14:16
?409次閱讀
本期視頻將會(huì)給人工智能愛好者們帶來(lái)超級(jí)震撼!視頻中,我們將深入了解利用GPU加速在OrangePi5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速,在OrangePi上跑
發(fā)表于 01-22 15:29
?902次閱讀
學(xué)習(xí)中究竟擔(dān)當(dāng)了什么樣的角色?又有哪些優(yōu)勢(shì)呢?一、GPU加速深度學(xué)習(xí)訓(xùn)練并行處理GPU的核心理念在于并行處理。在深度學(xué)習(xí)訓(xùn)練過程中,需要處理大量的數(shù)據(jù)。GPU通過
發(fā)表于 12-06 08:27
?1154次閱讀
這樣,在云端使用 H100 GPU 的排隊(duì)時(shí)間可能會(huì)縮短。數(shù)據(jù)中心提供商和前比特幣挖礦公司正在開設(shè)具有 H100 集群的數(shù)據(jù)中心。這些公司承諾以大型云提供商成本的一小部分提供 H100 GPU 計(jì)算,而大型云提供商對(duì) H100 GPU
發(fā)表于 11-23 15:59
?1552次閱讀
2022年加速服務(wù)器市場(chǎng)規(guī)模達(dá)到67億美元,同比增長(zhǎng)24%。其中GPU服務(wù)器依然是主導(dǎo)地位,占據(jù)89%的市場(chǎng)份額,達(dá)到60億美元。同時(shí)NPU、ASIC和FPGA等非GPU加速服務(wù)器以同
發(fā)表于 11-23 15:56
?914次閱讀
國(guó)內(nèi)一家從事油氣勘探的領(lǐng)先企業(yè)承接了大量的國(guó)內(nèi)外石油天然氣勘探項(xiàng)目,每年的地震數(shù)據(jù)分析處理的任務(wù)量非常大,傳統(tǒng)的 HPC 計(jì)算方法無(wú)法大幅提升數(shù)據(jù)處理效率。 在傳統(tǒng)的地震數(shù)據(jù)處理和解釋過程中,有一些操作需要人工來(lái)完成,或使用傳統(tǒng)的特征提取的方法,如去噪、初至拾取、速度拾取、斷層檢測(cè)、地質(zhì)體識(shí)別等。傳統(tǒng)方法不僅工作效率低下,而且對(duì)專業(yè)經(jīng)驗(yàn)要求非常高,成為提高地震處理和解釋效率的瓶頸。 傳統(tǒng) HPC 計(jì)算方法 無(wú)法大幅提
發(fā)表于 11-20 21:00
?481次閱讀
數(shù)天的云計(jì)算和科學(xué)實(shí)踐項(xiàng)目,旨在幫助科研領(lǐng)域研究人員在各種云上數(shù)據(jù)中心架構(gòu)(包括 CPU 和 GPU)下移植、加速和優(yōu)化其研究項(xiàng)目和應(yīng)用程序。 大賽主辦方將安排專業(yè)的云計(jì)算和 GPU 加速
發(fā)表于 11-09 19:25
?377次閱讀
但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個(gè)使用GPU加速SDF建圖的庫(kù)。計(jì)算速度非常快,相較CPU計(jì)算TSDF甚至快了177倍。更重要的是,因?yàn)樗袛?shù)據(jù)都已經(jīng)存儲(chǔ)在GPU上,所以很容易和深度學(xué)習(xí)方案結(jié)合!
發(fā)表于 11-09 16:46
?1026次閱讀
評(píng)論