0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nvidia GPU的風(fēng)扇和電源報(bào)錯(cuò)解決方案

454398 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:胡里糊涂 ? 2020-10-05 07:36 ? 次閱讀

問(wèn)題

最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候,沒(méi)有問(wèn)題,過(guò)一會(huì)再訓(xùn)練出現(xiàn)非常卡頓,使用nvidia-smi查看發(fā)現(xiàn),顯示GPU的風(fēng)扇和電源報(bào)錯(cuò):

解決方案

自動(dòng)風(fēng)扇控制

在nvidia論壇有人給出了解決方案,即問(wèn)題的根源可能是風(fēng)扇轉(zhuǎn)速不足使GPU過(guò)熱導(dǎo)致的。

首先開(kāi)啟GPU的persistent mode,再設(shè)置風(fēng)扇的功率,重啟即可生效。其中250代表的是風(fēng)扇的最大功率限制,可以將其設(shè)置為最大,這樣過(guò)熱的時(shí)候風(fēng)扇就會(huì)自動(dòng)加大功率。

sudo nvidia-smi -pm 1

sudo nvidia-smi -pl 250

手動(dòng)風(fēng)扇控制

此外,還可以將GPU風(fēng)扇的手動(dòng)風(fēng)速控制打開(kāi)。方法為:

首先,使用sudo nvidia-xconfig --enable-all-gpus命令打開(kāi)所有g(shù)pu在xserver中的設(shè)置(不使用sudo可能無(wú)權(quán)限寫入新配置)

然后修改配置文件:sudo vim /etc/X11/xorg.conf,在其中的DeviceSection中加入Option “Coolbits” “4”如下圖所示:

如果機(jī)器上有多塊gpu,在第一步命令執(zhí)行后,會(huì)在這個(gè)xorg.conf中出現(xiàn)多個(gè)DeviceSection,都依次執(zhí)行第三步操作

重啟機(jī)器后,命令行執(zhí)行nvidia-settings,會(huì)打開(kāi)設(shè)置界面,在其中的會(huì)顯示所有GPU的設(shè)置選項(xiàng),每個(gè)GPU控制選項(xiàng)下面都有一個(gè)Thermal settings,進(jìn)入后打開(kāi)enable GPU Fan Setting即可對(duì)風(fēng)扇進(jìn)行手動(dòng)風(fēng)速調(diào)整了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4818

    瀏覽量

    102645
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4639

    瀏覽量

    128472
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    NVIDIA全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

    借助 R515 驅(qū)動(dòng)程序,NVIDIA 于 2022 年 5 月發(fā)布了一套開(kāi)源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中心計(jì)算 GPU,而 GeForce 和工作站
    的頭像 發(fā)表于 07-25 09:56 ?306次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開(kāi)源<b class='flag-5'>GPU</b>內(nèi)核模塊

    遠(yuǎn)程IO常見(jiàn)報(bào)錯(cuò)解決方案,輕松應(yīng)對(duì)遠(yuǎn)程控制難題

    隨著科技的發(fā)展,遠(yuǎn)程IO技術(shù)在工業(yè)、醫(yī)療、家居等領(lǐng)域得到了廣泛應(yīng)用。然而,在使用過(guò)程中,我們難免會(huì)遇到一些報(bào)錯(cuò)問(wèn)題。本文將為您盤點(diǎn)遠(yuǎn)程IO常見(jiàn)報(bào)錯(cuò)解決方案,讓您輕松應(yīng)對(duì)遠(yuǎn)程控制難題。
    的頭像 發(fā)表于 07-23 18:19 ?1240次閱讀

    恒訊科技的GPU解決方案有什么特點(diǎn)和優(yōu)勢(shì)?

    GPU解決方案通常指的是云服務(wù)提供商提供的、基于圖形處理單元(GPU)的計(jì)算服務(wù)。這些服務(wù)利用GPU的并行處理能力,為用戶提供高性能的計(jì)算資源,特別適用于需要大量圖形處理或并行計(jì)算的
    的頭像 發(fā)表于 06-12 17:24 ?339次閱讀

    英偉達(dá)考慮縮減RTX 5090 Founder版顯卡尺寸,配備雙槽雙風(fēng)扇設(shè)計(jì)

    目前的NVIDIA GeForce RTX 4090及RTX 4080 Founders Edition GPU均為三插槽雙軸風(fēng)扇設(shè)計(jì),若此消息屬實(shí),那么GeForce RTX 5090 Founders Edition的具體設(shè)
    的頭像 發(fā)表于 05-30 10:24 ?493次閱讀

    使用OpenUSD和NVIDIA Omniverse開(kāi)發(fā)虛擬工廠解決方案

    工業(yè)開(kāi)發(fā)者正在借助 NVIDIA AI、NVIDIA Omniverse 和通用場(chǎng)景描述 (OpenUSD)生態(tài)系統(tǒng)的力量構(gòu)建虛擬工廠解決方案,通過(guò)優(yōu)化棕地和綠地開(kāi)發(fā)流程加快產(chǎn)品上市時(shí)間、實(shí)現(xiàn)產(chǎn)能的最大化并降低成本。
    的頭像 發(fā)表于 05-28 18:12 ?1185次閱讀
    使用OpenUSD和<b class='flag-5'>NVIDIA</b> Omniverse開(kāi)發(fā)虛擬工廠<b class='flag-5'>解決方案</b>

    是德網(wǎng)絡(luò)分析儀常見(jiàn)報(bào)錯(cuò)總結(jié)

    是德網(wǎng)絡(luò)分析儀常見(jiàn)的報(bào)錯(cuò)及其可能原因可以總結(jié)如下: 常見(jiàn)報(bào)錯(cuò): 1.電源故障 現(xiàn)象:前面板電源指示燈不亮、風(fēng)扇不轉(zhuǎn)動(dòng)、儀器無(wú)法正常啟動(dòng)或
    的頭像 發(fā)表于 05-27 11:44 ?488次閱讀

    NVIDIA推出兩款基于NVIDIA Ampere架構(gòu)的全新臺(tái)式機(jī)GPU

    兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來(lái)實(shí)時(shí)光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?528次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?578次閱讀

    NVIDIA的Maxwell GPU架構(gòu)功耗不可思議

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架構(gòu),它有著極高的能效,出場(chǎng)方式也非常特別。
    的頭像 發(fā)表于 02-19 16:39 ?883次閱讀
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b>架構(gòu)功耗不可思議

    巨頭豪購(gòu)35萬(wàn)塊NVIDIA最強(qiáng)GPU H100

    NVIDIA AI GPU無(wú)疑是當(dāng)下的硬通貨,從科技巨頭到小型企業(yè)都在搶。
    的頭像 發(fā)表于 01-29 09:58 ?958次閱讀
    巨頭豪購(gòu)35萬(wàn)塊<b class='flag-5'>NVIDIA</b>最強(qiáng)<b class='flag-5'>GPU</b> H100

    如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢?

    NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強(qiáng)大功能帶入虛擬桌面、應(yīng)用程序和工作站,加速圖形和計(jì)算,使在家辦公或在任何地方工作的創(chuàng)意和技術(shù)專業(yè)人員能夠訪問(wèn)虛擬化工作
    的頭像 發(fā)表于 01-12 09:26 ?921次閱讀
    如何選擇<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虛擬化軟件的組合<b class='flag-5'>方案</b>呢?

    NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來(lái)了解一些相關(guān)的基本知識(shí)。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時(shí)首先提出,從此
    發(fā)表于 11-21 09:40 ?1322次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架構(gòu)及架構(gòu)演進(jìn)

    電源管理解決方案

    電子發(fā)燒友網(wǎng)站提供《電源管理解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 11-16 10:15 ?0次下載
    <b class='flag-5'>電源</b>管理<b class='flag-5'>解決方案</b>

    177倍加速!NVIDIA最新開(kāi)源 | GPU加速各種SDF建圖!

    但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個(gè)使用GPU加速SDF建圖的庫(kù)。計(jì)算速度非常快,相較CPU計(jì)算TSDF甚至快了177倍。更重要的是,因?yàn)樗袛?shù)據(jù)都已經(jīng)存儲(chǔ)在GPU上,所以很容易和深度學(xué)習(xí)
    的頭像 發(fā)表于 11-09 16:46 ?1041次閱讀
    177倍加速!<b class='flag-5'>NVIDIA</b>最新開(kāi)源 | <b class='flag-5'>GPU</b>加速各種SDF建圖!