0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU加速AI推理洞察,推動跨行業(yè)創(chuàng)新

NVIDIA英偉達(dá) ? 來源:英偉達(dá)NVIDIA中國 ? 2020-07-02 15:00 ? 次閱讀

隨著數(shù)據(jù)集的增長和分析神經(jīng)網(wǎng)絡(luò)的復(fù)雜化,越來越多的用戶選擇通過NVIDIA GPU加速AI推理。當(dāng)前,人工智能的應(yīng)用正從農(nóng)業(yè)領(lǐng)域擴(kuò)展到X射線領(lǐng)域,而NVIDIA GPU正是AI推理跨行業(yè)創(chuàng)新的助燃劑。

人工智能的應(yīng)用,正從農(nóng)業(yè)領(lǐng)域拓展醫(yī)學(xué)、X射線等各個領(lǐng)域,原因是因為它們擁有著基于海量數(shù)據(jù)迅速推斷出精明之選的神奇能力。

隨著數(shù)據(jù)集的增長和分析神經(jīng)網(wǎng)絡(luò)的復(fù)雜化,越來越多的用戶選擇用NVIDIA GPU來加速AI推理。

想要了解它們的實際應(yīng)用,看看下面這些家喻戶曉的公司產(chǎn)品就能明白。

美國通用的GEResearch在航空、醫(yī)療保健、電力和運(yùn)輸行業(yè)中部署了使用GPU加速的AI模型。這些模型實現(xiàn)了工廠檢查自動化,為智能列車的運(yùn)行提供保障,并能監(jiān)控電站以及解釋醫(yī)學(xué)圖像。

這些AI模型被運(yùn)行在裝載了V100Tensor Core GPU的NVIDIADGX系統(tǒng)上的數(shù)據(jù)中心服務(wù)器上,以及裝載了JetsonAGX Xavier模塊的邊緣計算網(wǎng)絡(luò)中。該硬件運(yùn)行NVIDIA的TensorRT推理引擎及其用于深度學(xué)習(xí)的CUDA/ cuDNN加速庫,以及用于Jetson模塊的NVIDIAJetPack工具套件。

推理賦能視頻應(yīng)用程序與合同管理

在消費(fèi)市場上,全球兩個最受歡迎的移動視頻應(yīng)用程序均在NVIDIA GPU上運(yùn)行AI推理。

TikTok及其在中國的前身“抖音”在2019年2月全球下載量達(dá)到10億次。字節(jié)跳動作為這兩個應(yīng)用程序的開發(fā)者和所有者,每天為4億活躍用戶每天上傳多達(dá)5000萬個新視頻。

字節(jié)跳動在數(shù)千個NVIDIA T4和P4 GPU服務(wù)器上運(yùn)行TensorRT,用戶因此可以搜索并獲得有關(guān)精彩視頻的推薦。該公司估計, NVIDIA產(chǎn)品已幫助公司節(jié)省了數(shù)百萬美元,同時將在線服務(wù)的延遲減少了一半。

在商業(yè)領(lǐng)域,德勤在其dTrax軟件中使用AI推理來幫助公司管理復(fù)雜的合同。例如,當(dāng)法規(guī)發(fā)生變化或公司計劃進(jìn)行大規(guī)模收購時,dTrax可以定位并更新長期協(xié)議中的關(guān)鍵條款。

當(dāng)前全球有多家公司使用dTrax。該軟件在數(shù)據(jù)中心的NVIDIA DGX-1系統(tǒng)和云中的AWS P3實例上運(yùn)行,在2019年獲得了《金融時報》的智能商業(yè)獎。

GPU加速推理運(yùn)行速度

金融服務(wù)公司Square的測試結(jié)果顯示,一般模型的推理任務(wù)在GPU上的運(yùn)行速度是CPU的兩倍,而在大型模型(例如RoBERTa)上,推理工作的完成速度提升了10倍。

因此,NVIDIA GPU對于其實現(xiàn)將Square Assistant從虛擬調(diào)度程序擴(kuò)展到驅(qū)動公司所有產(chǎn)品的對話式AI引擎的目標(biāo)至關(guān)重要。

寶馬集團(tuán)近期宣布將使用NVIDIA Isaac機(jī)器人平臺開發(fā)五種新型機(jī)器人,以增強(qiáng)其汽車制造廠的物流水平。其中一款由NVIDIA Jetson AGX Xavier支持的機(jī)器人可以每秒執(zhí)行多達(dá)32萬億次操作,以執(zhí)行諸如感知、姿勢估計和路徑規(guī)劃之類的計算機(jī)視覺任務(wù)。

AI推理也在汽車內(nèi)部發(fā)生。中國的小鵬汽車于4月下旬推出了P7純電動轎車,它使用NVIDIA DRIVE AGX Xavier通過推理傳感器的數(shù)據(jù)以幫助實現(xiàn)3級自動駕駛功能。

過去三年來,NVIDIA數(shù)據(jù)中心平臺的推理性能提高了近50倍,這在很大程度上要?dú)w功于Tensor Core的引入以及TensorRT中正在進(jìn)行的軟件優(yōu)化以及PyTorch和TensorFlow等AI框架的提速。

來自世界各地的醫(yī)學(xué)專家在2020年GPU技術(shù)大會(GTC)上就放射、基因組學(xué)、顯微學(xué)和其他醫(yī)療保健領(lǐng)域的AI應(yīng)用進(jìn)行了數(shù)十次演講。在一次演講中,美國放射學(xué)院主席杰拉爾丁·麥金提(Geraldine McGinty)將AI稱為同時達(dá)成提高醫(yī)療質(zhì)量和降低成本的“千載難逢的機(jī)會”。

在農(nóng)業(yè)領(lǐng)域,越來越多的初創(chuàng)公司正在使用AI來提高效率。例如,NVIDIA 初創(chuàng)加速計劃會員Rabbit Tractors通過在多功能機(jī)器人上使用Jetson Nano模塊,從攝像頭和雷達(dá)數(shù)據(jù)中推斷出需要進(jìn)行播種、澆水或收獲作物的位置。

還有其他公司也在通過GPU加速推理,其中包括美國運(yùn)通的欺詐檢測、寶潔的工業(yè)檢查以及網(wǎng)絡(luò)巨頭的搜索引擎。

AI推理在NVIDIA DGX A100 GPU上的增益高達(dá)7倍

GPU推理的潛力在不斷上升,準(zhǔn)確性不斷提高。

借助多實例GPU功能,NVIDIA Ampere架構(gòu)將推理速度提高了7倍。A100 GPU中支持深度神經(jīng)網(wǎng)絡(luò)中稀疏性的新方法有望帶來更多收益。這是在A100 GPU的技術(shù)概述中討論的架構(gòu)的幾個新功能之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4726

    瀏覽量

    100311
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4816

    瀏覽量

    102633
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46348

    瀏覽量

    236506

原文標(biāo)題:NVIDIA GPU加速AI推理洞察,推動跨行業(yè)創(chuàng)新

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動科學(xué)創(chuàng)新的道路。在閱讀這一章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來的革命性變化,以下是我個人的學(xué)習(xí)心得: 1.
    發(fā)表于 10-14 09:12

    NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發(fā)表于 10-10 09:35 ?188次閱讀

    NVIDIA加速計算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計算和生成式 AI 領(lǐng)域的
    的頭像 發(fā)表于 09-09 09:18 ?429次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?609次閱讀

    MediaTek與NVIDIA TAO加速物聯(lián)網(wǎng)邊緣AI應(yīng)用發(fā)展

    在即將到來的COMPUTEX 2024科技盛會上,全球知名的芯片制造商MediaTek宣布了一項重要合作——將NVIDIA的TAO(TensorRT Accelerated Optimizer)與其NeuroPilot SDK(軟件開發(fā)工具包)集成,共同推動邊緣
    的頭像 發(fā)表于 06-12 14:49 ?408次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化AI模型部署過程,為全球的2800萬英偉達(dá)開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?577次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    推理能力提升 15 倍 GB200由兩個B200Blackwell GPU和一個基于Arm的Grace CPU組成,采用[臺積電]4納米工藝制程,共有2080億個[晶體管],其AI性能為每秒20
    發(fā)表于 05-13 17:16

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優(yōu)化從 PC 到云端的 NVID
    的頭像 發(fā)表于 04-28 10:36 ?437次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
    的頭像 發(fā)表于 04-20 09:39 ?571次閱讀

    NVIDIA的專用AI平臺如何推動下一代醫(yī)療健康行業(yè)的發(fā)展

    醫(yī)療科技創(chuàng)新企業(yè)在 GTC 上介紹了 NVIDIA 的專用 AI 平臺如何推動下一代醫(yī)療健康行業(yè)的發(fā)展。
    的頭像 發(fā)表于 04-09 10:10 ?1200次閱讀

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計算巨頭的計算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?506次閱讀

    運(yùn)營商持續(xù)深化雙向賦能 跨行業(yè)共建共享擴(kuò)大基建價值

    實施電信基礎(chǔ)設(shè)施跨行業(yè)共建共享,推進(jìn)社會各行業(yè)資源雙向開放共享和融合創(chuàng)新應(yīng)用,一方面能夠加速“雙千兆”網(wǎng)絡(luò)建設(shè),進(jìn)而加強(qiáng)賦能各行業(yè)數(shù)字化發(fā)展
    的頭像 發(fā)表于 01-09 17:10 ?591次閱讀

    NVIDIA 初創(chuàng)加速計劃 Omniverse 加速

    新的 AI 技術(shù)和迅速發(fā)展的應(yīng)用正在改變各行各業(yè),生成式 AI 已經(jīng)展示出在藝術(shù)、設(shè)計、影視動畫、互娛、建筑等領(lǐng)域加速內(nèi)容創(chuàng)作的價值,助力實現(xiàn)高質(zhì)量、高效率、多樣化的內(nèi)容生產(chǎn),成為推動
    的頭像 發(fā)表于 12-04 20:35 ?589次閱讀
    <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計劃 Omniverse <b class='flag-5'>加速</b>營

    創(chuàng)新企業(yè)云福利:騰訊云 × NVIDIA 初創(chuàng)加速計劃

    助力生成式 AI、大模型訓(xùn)練與推理、自動駕駛、圖像處理等場景初創(chuàng)企業(yè)加速成長,最高獲贈 10 萬元扶持基金、NVIDIA 深度學(xué)習(xí)培訓(xùn)中心(DLI)優(yōu)惠課程,以及免費(fèi)的
    的頭像 發(fā)表于 11-13 20:40 ?518次閱讀
    <b class='flag-5'>創(chuàng)新</b>企業(yè)云福利:騰訊云 × <b class='flag-5'>NVIDIA</b> 初創(chuàng)<b class='flag-5'>加速</b>計劃

    周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

    由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會,將幫助您了解 NVIDIA 開源大型語言模型(LLM)
    的頭像 發(fā)表于 10-26 09:05 ?308次閱讀