0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU和CPU誰(shuí)最強(qiáng)呢?

馬哥Linux運(yùn)維 ? 來源:馬哥Linux運(yùn)維 ? 2023-05-10 10:23 ? 次閱讀

近幾個(gè)月,幾乎每個(gè)行業(yè)的小伙伴都了解到了ChatGPT的可怕能力。你知道么,ChatGPT之所以如此厲害,是因?yàn)樗玫搅藥兹f(wàn)張NVIDA Tesla A100顯卡做AI推理和圖形計(jì)算。

本文就簡(jiǎn)單分享下GPU的相關(guān)內(nèi)容,歡迎閱讀。

GPU是什么?

GPU的英文全稱Graphics Processing Unit,圖形處理單元。

說直白一點(diǎn):GPU是一款專門的圖形處理芯片,做圖形渲染、數(shù)值分析、金融分析、密碼破解,以及其他數(shù)學(xué)計(jì)算與幾何運(yùn)算的。GPU可以在PC、工作站、游戲主機(jī)、手機(jī)、平板等多種智能終端設(shè)備上運(yùn)行。

GPU和顯卡的關(guān)系,就像是CPU和主板的關(guān)系。前者是顯卡的心臟,后者是主板的心臟。有些小伙伴會(huì)把GPU和顯卡當(dāng)成一個(gè)東西,其實(shí)還有些差別的,顯卡不僅包括GPU,還有一些顯存、VRM穩(wěn)壓模塊、MRAM芯片、總線、風(fēng)扇、外圍設(shè)備接口等等。

GPU和CPU誰(shuí)最強(qiáng)呢?

這個(gè)其實(shí)不好說,好點(diǎn)的GPU內(nèi)部的晶體管數(shù)量可以超過CPU,CPU的強(qiáng)項(xiàng)是做邏輯運(yùn)算,GPU的強(qiáng)項(xiàng)是做數(shù)學(xué)運(yùn)算和圖形渲染。這就ChatGPT用大量高性能顯卡做AI推理的原因。

接下來,我們做個(gè)簡(jiǎn)單的對(duì)比。

結(jié)構(gòu)組成不同

CPU和GPU都是運(yùn)算的處理器,在架構(gòu)組成上都包括3個(gè)部分:運(yùn)算單元ALU、控制單元Control和緩存單元Cache。

但是,三者的組成比例卻相差很大。

在CPU中緩存單元大概占50%,控制單元25%,運(yùn)算單元25%;

在GPU中緩存單元大概占5%,控制單元5%,運(yùn)算單元90%。

f971b858-ee7d-11ed-90ce-dac502259ad0.png

結(jié)構(gòu)組成上的巨大差異說明:CPU的運(yùn)算能力更加均衡,但是不適合做大量的運(yùn)算;GPU更適合做大量運(yùn)算。

這倒不是說GPU更牛X,實(shí)際上GPU更像是一大群工廠流水線上的工人,適合做大量的簡(jiǎn)單運(yùn)算,很復(fù)雜的搞不了。但是簡(jiǎn)單的事情做得非???,比CPU要快得多。

相比GPU,CPU更像是技術(shù)專家,可以做復(fù)雜的運(yùn)算,比如邏輯運(yùn)算、響應(yīng)用戶請(qǐng)求、網(wǎng)絡(luò)通信等。但是因?yàn)锳LU占比較少、內(nèi)核少,所以適合做相對(duì)少量的復(fù)雜運(yùn)算。

f97fc8ee-ee7d-11ed-90ce-dac502259ad0.png

在CPU里面,大概50%是緩存單元,并且是四級(jí)緩存結(jié)構(gòu);而在GPU中,緩存是一級(jí)或者二級(jí)的。

CPU性能更加注重線程的性能,在控制部分做的事情較多,這樣做就是為了確??刂浦噶畈荒苤袛?,在浮點(diǎn)計(jì)算上功耗少。

相較于CPU,GPU的結(jié)構(gòu)更為簡(jiǎn)單,基本上它也只做單精度或雙精度浮點(diǎn)運(yùn)算。GPU的運(yùn)算速度更快,吞吐量也更高。

CPU基本上是實(shí)時(shí)響應(yīng),采用多級(jí)緩存來保障多個(gè)任務(wù)的響應(yīng)速度。

GPU往往采用的是批處理的機(jī)制,即:任務(wù)先排好隊(duì),挨個(gè)處理。

fa2f672c-ee7d-11ed-90ce-dac502259ad0.png

GPU對(duì)于圖形處理

我們假設(shè)在實(shí)時(shí)渲染中,一幀1080*720P的圖片,那么這張圖就有大概777600個(gè)像素點(diǎn)。如果按照最基本的24幀/秒的幀率計(jì)算。1秒鐘就要求計(jì)算機(jī)處理18662400個(gè),即:1866.24萬(wàn)個(gè)像素點(diǎn)。

這還是高清的情況下,如果是1090*1080、2K、4K甚至8K的視頻渲染,可想而知,這個(gè)計(jì)算量是何其巨大。尤其是在像游戲這樣的實(shí)時(shí)渲染場(chǎng)景下,顯然僅僅依靠CPU渲染是會(huì)超時(shí)的。

實(shí)際上,在屏幕中顯示的三維物體都要經(jīng)過多重的坐標(biāo)變換,并且物體的表面會(huì)受到環(huán)境中各種光線的影響,呈現(xiàn)不同的顏色和陰影。這就包括了光線的漫射、折射、透射、散射等。

fa5e68b0-ee7d-11ed-90ce-dac502259ad0.jpg

接下來,我們以英偉達(dá)NVIDIA RTX3090 為例,看下GPU是如何進(jìn)行渲染的。

RTX3090的流式多處理器有10496個(gè),每個(gè)內(nèi)核都有具備整數(shù)運(yùn)算和浮點(diǎn)運(yùn)算的部分,還有用于在操作數(shù)中排隊(duì)和收集結(jié)果的部分。

所謂流式多處理器可以認(rèn)為是一個(gè)獨(dú)立的任務(wù)處理單元,也可以認(rèn)為一顆GPU包含了10496個(gè)CPU同時(shí)處理各個(gè)圖片處理任務(wù)。

fa66a96c-ee7d-11ed-90ce-dac502259ad0.png

我們就可以通過算法和程序,對(duì)1秒鐘18662400個(gè)像素點(diǎn)的整體任務(wù)進(jìn)行切割分片,讓10496顆處理器并行計(jì)算。

這樣的話,每個(gè)處理器負(fù)責(zé)大概每秒處理18662400/10496,即1778個(gè)像素點(diǎn)的渲染任務(wù)就行了。

如下圖所示,在GPU中會(huì)劃分為多個(gè)流式處理區(qū),每個(gè)處理區(qū)包含數(shù)百個(gè)內(nèi)核,每個(gè)內(nèi)核相當(dāng)于一顆簡(jiǎn)化版的CPU,具備整數(shù)運(yùn)算和浮點(diǎn)運(yùn)算的功能,以及排隊(duì)和結(jié)果收集功能。

fa7050ca-ee7d-11ed-90ce-dac502259ad0.png

注意,除了流處理器CUDA以外,影響GPU性能的還有

緩存不同

浮點(diǎn)運(yùn)算方式不同

響應(yīng)方式不同

核心頻率:頻率越高,性能越強(qiáng)、功耗也越高。

顯示位寬:?jiǎn)挝皇莃it,位寬決定了顯卡同時(shí)可以處理的數(shù)據(jù)量,越大越好。

顯存容量:顯存容量越大,代表能緩存的數(shù)據(jù)就越多。

顯存頻率:?jiǎn)挝皇荕Hz或bps,顯存頻率越高,圖形數(shù)據(jù)傳輸速度就越快。

總結(jié)

一言以蔽之,GPU不管是處理圖形渲染、數(shù)值分析,還是處理AI推理。底層邏輯都是將極為繁重的數(shù)學(xué)進(jìn)行任務(wù)拆解,化繁為簡(jiǎn)。

然后,利用GPU多流處理器的機(jī)制,將大量的運(yùn)算拆解為一個(gè)個(gè)小的、簡(jiǎn)單的運(yùn)算,并行處理。我們也可以認(rèn)為一個(gè)GPU就是一個(gè)集群,里面每個(gè)流處理器都是一顆CPU,這樣就容易理解了。

fb1fc564-ee7d-11ed-90ce-dac502259ad0.png

以上是關(guān)于GPU概念、工作原理的簡(jiǎn)要介紹。說是簡(jiǎn)單,其實(shí)在圖形處理方面,還有很多深層次的處理邏輯沒有展開,比如像素位置變換、三角原理等等。感興趣的小伙伴可以深入研究下。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4639

    瀏覽量

    128474
  • 主板
    +關(guān)注

    關(guān)注

    53

    文章

    1811

    瀏覽量

    70250
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2409

    瀏覽量

    67280

原文標(biāo)題:總結(jié)

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CPU內(nèi)存或GPU內(nèi)存進(jìn)行分組方式實(shí)戰(zhàn)

    CPU+GPU協(xié)同計(jì)算中,CPUGPU的計(jì)算能力不同,靜態(tài)地給CPUGPU劃分任務(wù)會(huì)導(dǎo)致CPU
    的頭像 發(fā)表于 05-03 09:01 ?7031次閱讀
    <b class='flag-5'>CPU</b>內(nèi)存或<b class='flag-5'>GPU</b>內(nèi)存進(jìn)行分組方式實(shí)戰(zhàn)

    FPGA比CPUGPU快的原理是什么

    本文首先闡述了FPGA的原理了,其次分析了FPGA比CPUGPU快的原理,最后闡述了CPUGPU的區(qū)別。
    的頭像 發(fā)表于 05-31 09:00 ?1.6w次閱讀
    FPGA比<b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>快的原理是什么

    CPUGPU的Intel可能砍掉最強(qiáng)核顯Iris Pro

    Intel不是GPU公司,但因?yàn)槠煜碌淖烂?b class='flag-5'>CPU基本上都整合了GPU單元,半賣半送之下Intel坐擁全球最大的GPU份額,而且大部分時(shí)間都超過70%,簡(jiǎn)直是“壟斷”。2013年隨著Ha
    發(fā)表于 09-23 15:08 ?2392次閱讀
    買<b class='flag-5'>CPU</b>送<b class='flag-5'>GPU</b>的Intel可能砍掉<b class='flag-5'>最強(qiáng)</b>核顯Iris Pro

    CPU、GPU和內(nèi)存知識(shí)科普

    本文內(nèi)容包括CPU、內(nèi)存和GPU知識(shí),本期重點(diǎn)更新GPUCPU部分知識(shí)。比如:GPU更新包括架構(gòu)演進(jìn),最新產(chǎn)品A100、選型策略、架構(gòu)分析
    的頭像 發(fā)表于 11-13 11:47 ?1747次閱讀
    <b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>和內(nèi)存知識(shí)科普

    誰(shuí)才是CPUGPU融合的領(lǐng)先者?

    如果要評(píng)選2011年度的計(jì)算機(jī)行業(yè)最大變革,那么CPUGPU的融合就是當(dāng)之無(wú)愧的頭號(hào)熱門。兩大芯片巨頭,無(wú)論是AMD還是Intel,都堅(jiān)定不移地讓CPUGPU兩個(gè)原本各自獨(dú)立的概念
    發(fā)表于 10-14 11:01 ?2086次閱讀
    <b class='flag-5'>誰(shuí)</b>才是<b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>融合的領(lǐng)先者?

    CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差,為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力

    為什么 CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差,為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力?
    的頭像 發(fā)表于 03-16 15:12 ?1.6w次閱讀

    CPU-GPU同步暫停

    使用Intel INDE工具刪除CPU-GPU同步暫停,該暫停導(dǎo)致CPUGPU之間的某些并行性丟失。
    的頭像 發(fā)表于 05-31 15:18 ?1511次閱讀

    華為Nova5Pro遇上華為P30Pro后,誰(shuí)才是最強(qiáng)的華為旗艦?

    隨著華為旗下拍照手機(jī)華為Nova5系列的發(fā)布,大家對(duì)于華為強(qiáng)大的拍照能力又有了一個(gè)新認(rèn)識(shí)。此前華為手機(jī)中拍照以及綜合性能最強(qiáng)的旗艦是華為P30Pro,那么當(dāng)華為Nova5Pro遇上華為P30Pro后,誰(shuí)才是最強(qiáng)的華為旗艦
    的頭像 發(fā)表于 08-14 10:23 ?1.4w次閱讀

    GPUCPU間的比較

    GPUCPU比較,GPU為什么更適合深度學(xué)習(xí)?
    的頭像 發(fā)表于 08-26 15:32 ?4602次閱讀

    CPUGPU的區(qū)別有哪些

    CPUGPU的區(qū)別有哪些?接下來簡(jiǎn)單給大家介紹一下關(guān)于GPUCPU的區(qū)別。
    的頭像 發(fā)表于 01-06 17:07 ?3.1w次閱讀

    gpucpu有什么區(qū)別?

    gpucpu有什么區(qū)別? GPUCPU是電腦中兩個(gè)重要的計(jì)算器件。如果想要了解這兩個(gè)設(shè)備的區(qū)別,需要從它們的含義和工作原理入手。 首先,CPU
    的頭像 發(fā)表于 08-09 16:15 ?1.3w次閱讀

    什么是GPUCPU?GPUCPU的區(qū)別及聯(lián)系

    GPUCPU是計(jì)算機(jī)系統(tǒng)中最重要的兩種處理器,它們?cè)诓煌膽?yīng)用中發(fā)揮不同的作用。
    發(fā)表于 08-09 18:24 ?5243次閱讀

    cpu gpu npu的區(qū)別 NPU與GPU哪個(gè)好?gpu是什么意思?

    cpu gpu npu的區(qū)別 NPU與GPU哪個(gè)好?gpu是什么意思? 在當(dāng)今數(shù)字化和人工智能的時(shí)代,高效的計(jì)算能力是現(xiàn)代技術(shù)發(fā)展的重要基礎(chǔ)。因此,Central Processing
    的頭像 發(fā)表于 08-27 17:03 ?1w次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時(shí)處理多個(gè)任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項(xiàng)任務(wù)。這是因?yàn)?b class='flag-5'>GPU的架構(gòu)使得它可以同時(shí)
    的頭像 發(fā)表于 01-26 08:30 ?2032次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    gpu是什么和cpu的區(qū)別

    GPUCPU是兩種常見的計(jì)算機(jī)處理器,它們?cè)诮Y(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU的區(qū)別,并詳細(xì)介紹它們的原理、應(yīng)用領(lǐng)域和性能特點(diǎn)。 一、概述 1.1
    的頭像 發(fā)表于 02-20 11:24 ?1.8w次閱讀