0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Cloud面向全球各地推出NVIDIA T4 GPU

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:lq ? 2019-05-09 08:48 ? 次閱讀

近日起,Google Cloud 面向全球各地推出NVIDIA T4 GPU,為包括高性能計(jì)算(HPC)、機(jī)器學(xué)習(xí)訓(xùn)練及推理、數(shù)據(jù)分析和圖形處理等在內(nèi)的各類云工作負(fù)載提供加速。今年1月,Google Cloud宣布推出了NVIDIA T4 GPU公測(cè)版,幫助客戶以更快的速度和更低的成本運(yùn)行推理工作負(fù)載。今年四月早些時(shí)候,在Google Next '19上,Google Cloud宣布在八個(gè)地區(qū)率先推出NVIDIA T4,使Google Cloud成為全球第一家基于NVIDIA T4提供服務(wù)的主要供應(yīng)商。

注重速度與成本效益

每個(gè)T4 GPU都擁有16 GB的GPU內(nèi)存,提供多精度(或數(shù)據(jù)類型)支持(FP32,F(xiàn)P16,INT8和INT4),具有可為訓(xùn)練提供加速的NVIDIA Tensor核心,以及可用于更快速的光線追蹤的RTX硬件加速平臺(tái)。用戶可以使用四個(gè)T4 GPU、96個(gè)vCPU、624 GB主機(jī)內(nèi)存和高達(dá)3 TB的服務(wù)器本地SSD,來(lái)搭建最能滿足其需求的自定義VM配置。

自發(fā)布之時(shí),在搶占式VM實(shí)例上,T4實(shí)例的售價(jià)僅為每GPU每小時(shí)0.29美元。按需實(shí)例的售價(jià)為每GPU每小時(shí)0.95美元起,而且持續(xù)使用還可享受高達(dá)30%的折扣。

可用于訓(xùn)練和推理的Tensor 核心

憑借NVIDIA Turing架構(gòu),T4 GPU引入了第二代Tensor核心。Tensor 核心首次亮相于NVIDIA V100 GPU之上(Google Cloud平臺(tái)(GCP)也提供基于NVIDIA V100 GPU的服務(wù)),支持混合精度,可以為在機(jī)器學(xué)習(xí)工作負(fù)載中普遍采用的矩陣乘法運(yùn)算提供加速。如果您的訓(xùn)練工作量還未達(dá)到需要使用功能更加強(qiáng)大的V100的程度,那么T4將能夠以更低的價(jià)格為您提供Tensor 核心的加速優(yōu)勢(shì)。T4非常適合應(yīng)用于大規(guī)模訓(xùn)練工作負(fù)載中,特別是當(dāng)您擴(kuò)展更多資源來(lái)加快訓(xùn)練或訓(xùn)練更大的模型的時(shí)候。

Tensor核心也可以為推理提供加速,或運(yùn)用機(jī)器學(xué)習(xí)模型加速生成預(yù)測(cè),以實(shí)現(xiàn)低延遲或高吞吐量。當(dāng)以混合精度啟用Tensor核心時(shí),與僅以FP32運(yùn)行相比,借助于TensorRT, GCP上的T4 GPU可以將ResNet-50的推理速度提高10倍以上。受益于全球供貨和谷歌的高速網(wǎng)絡(luò),GCP上的NVIDIA T4能夠以高性價(jià)比,為那些需要高效運(yùn)作的全球性服務(wù)供應(yīng)商提供服務(wù)。例如,Snap Inc. 就在使用NVIDIA T4為其全球用戶群創(chuàng)建更有效的算法的同時(shí),保持了低成本。

“Snap的貨幣化算法對(duì)我們的廣告客戶和股東有著最顯著的影響。借助于GCP上由NVIDIA T4賦能的GPU,我們提高了我們的廣告效率,與僅使用CPU的方式相比,成本也得到了降低?!?/p>

— Nima Khajehnouri, Sr. Director, Monetization, Snap Inc.

GCP 的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施讓Google與NVIDIA強(qiáng)強(qiáng)聯(lián)手。

借助于Google Cloud上的深度學(xué)習(xí)VM鏡像(Deep Learning VM images),可以在NVIDIA T4 GPU上快速啟動(dòng)和運(yùn)行機(jī)器學(xué)習(xí)模型的訓(xùn)練和服務(wù)推理工作負(fù)載。這些應(yīng)用包括了您需要的所有軟件:驅(qū)動(dòng)程序,CUDA-X AI庫(kù),以及主流AI框架,如TensorFlow和PyTorch。此外,Google Cloud會(huì)為您進(jìn)行軟件更新,使您不必再為了兼容性和性能優(yōu)化的問(wèn)題額外費(fèi)心。您只需創(chuàng)建一個(gè)新的Compute Engine實(shí)例,選擇您的鏡像,單擊Start,幾分鐘后,您就可以訪問(wèn)和啟用您的由T4賦能的實(shí)例。您也可以在Google Cloud的AI平臺(tái)上啟動(dòng)您的實(shí)例,這是一個(gè)端到端的開(kāi)發(fā)環(huán)境,可幫助機(jī)器學(xué)習(xí)開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家在任何地方構(gòu)建、共享和運(yùn)行機(jī)器學(xué)習(xí)應(yīng)用程序。一旦準(zhǔn)備就緒,只需幾行代碼,您就可以借助于Tensor核心的自動(dòng)混合精度實(shí)現(xiàn)加速。

規(guī)模效益

NVIDIA T4 GPU還能為HPC批量計(jì)算和渲染工作負(fù)載帶來(lái)卓越的性能和效率,將大規(guī)模部署的效用價(jià)值最大化。一位來(lái)自于普林斯頓大學(xué)(Princeton University)的神經(jīng)科學(xué)研究人員對(duì)T4的獨(dú)特價(jià)格和性能有著這樣的說(shuō)法:

“我們很高興能夠與Google Cloud合作,為神經(jīng)科學(xué)帶來(lái)了一項(xiàng)里程碑式的成就:重建立方毫米新皮層的連接組。能夠使用數(shù)千個(gè)由Kubernetes Engine驅(qū)動(dòng)的T4 GPU是件令人十分興奮的事情。憑借這些計(jì)算資源,我們能夠追蹤長(zhǎng)達(dá)5公里的神經(jīng)元布線,并在微小體積范圍內(nèi)識(shí)別十億個(gè)突觸?!?/p>

— Sebastian Seung,普林斯頓大學(xué)

GCP上的Quadro虛擬工作站

T4 GPU也是運(yùn)行虛擬工作站的絕佳選擇,能夠?yàn)?a target="_blank">工程師和專業(yè)創(chuàng)意人員提供支持。借助于GCP Marketplace中的NVIDIA Quadro虛擬工作站,用戶可以運(yùn)行基于NVIDIA RTX平臺(tái)的應(yīng)用程序,能在任何地方體驗(yàn)新一代計(jì)算機(jī)圖形技術(shù),包括實(shí)時(shí)光線追蹤和AI增強(qiáng)型圖形,以及視頻和圖像處理。

“通過(guò)Google Cloud訪問(wèn)NVIDIA Quadro虛擬工作站,使得我們的客戶在任何地方都能快速部署并開(kāi)始使用Autodesk軟件。對(duì)于某些工作流程,運(yùn)用NVIDIA T4和RTX技術(shù)的客戶能在渲染場(chǎng)景、創(chuàng)建逼真的3D模型和仿真的時(shí)候看到很大的不同。我們很高興繼續(xù)與NVIDIA和Google合作,為藝術(shù)工作流程帶來(lái)更高的效率和速度?!?/p>

—Eric Bourque, Senior Software Development Manager, Autodesk

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57334
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8330

    瀏覽量

    132220
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1402

    瀏覽量

    33970

原文標(biāo)題:Google Cloud近日起全面推出NVIDIA T4 GPU,實(shí)現(xiàn)機(jī)器學(xué)習(xí)和其他計(jì)算工作負(fù)載的高效拓展

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場(chǎng),AMD和NVIDIA是兩大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。
    的頭像 發(fā)表于 10-27 11:15 ?168次閱讀

    NetApp與Google Cloud深化合作,強(qiáng)化分布式云存儲(chǔ)

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級(jí)。此次合作中,NetApp將統(tǒng)一數(shù)據(jù)存儲(chǔ)和智能服務(wù)融入Google Distributed Cloud
    的頭像 發(fā)表于 10-11 17:21 ?392次閱讀

    NVIDIA全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

    借助 R515 驅(qū)動(dòng)程序,NVIDIA 于 2022 年 5 月發(fā)布了一套開(kāi)源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中心計(jì)算
    的頭像 發(fā)表于 07-25 09:56 ?308次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開(kāi)源<b class='flag-5'>GPU</b>內(nèi)核模塊

    NVIDIA 通過(guò) CUDA-Q 平臺(tái)為全球各地的量子計(jì)算中心提供加速

    —— NVIDIA 于今日宣布將通過(guò)開(kāi)源的 NVIDIA CUDA-Q? 量子計(jì)算平臺(tái),助力全球各地的國(guó)家級(jí)超算中心加快量子計(jì)算的研究發(fā)展。 ? 德國(guó)、日本和波蘭的超算中心將使用該平
    發(fā)表于 05-13 15:21 ?167次閱讀
    <b class='flag-5'>NVIDIA</b> 通過(guò) CUDA-Q 平臺(tái)為<b class='flag-5'>全球</b><b class='flag-5'>各地</b>的量子計(jì)算中心提供加速

    Flutter首次亮相Google Cloud Next大會(huì)

    Flutter 團(tuán)隊(duì)在近期首次參加了 Google Cloud Next 大會(huì),這意味著 Flutter 在開(kāi)發(fā)社區(qū)中的影響力正在日益增長(zhǎng)。
    的頭像 發(fā)表于 05-09 10:15 ?422次閱讀

    NVIDIA推出兩款基于NVIDIA Ampere架構(gòu)的全新臺(tái)式機(jī)GPU

    兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來(lái)實(shí)時(shí)光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?529次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺(tái)已成為云服務(wù)提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google
    的頭像 發(fā)表于 04-16 14:30 ?555次閱讀

    NVIDIA宣布推出基于Omniverse Cloud API構(gòu)建的全新軟件框架

    NVIDIA 在 GTC 大會(huì)上宣布推出基于 Omniverse Cloud API(應(yīng)用編程接口)構(gòu)建的全新軟件框架。
    的頭像 發(fā)表于 03-25 09:09 ?464次閱讀

    全新NVIDIA Omniverse Cloud API有何亮點(diǎn)?

    NVIDIA Omniverse Cloud API 使開(kāi)發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計(jì)與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 13:42 ?394次閱讀

    NVIDIA宣布將以API形式提供Omniverse? Cloud

    NVIDIA Omniverse Cloud API 使開(kāi)發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計(jì)與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 09:45 ?398次閱讀

    Google Gemma優(yōu)化后可在NVIDIA GPU上運(yùn)行

    2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺(tái)上發(fā)布面向 Gemma 的優(yōu)化功能,Gemma 是
    的頭像 發(fā)表于 02-25 11:01 ?412次閱讀

    NVIDIA的Maxwell GPU架構(gòu)功耗不可思議

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架構(gòu),它有著極高的能效,出場(chǎng)方式也非常特別。
    的頭像 發(fā)表于 02-19 16:39 ?895次閱讀
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b>架構(gòu)功耗不可思議

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實(shí)踐

    以下文章來(lái)源于谷歌云服務(wù),作者 Google Cloud 立即預(yù)約 長(zhǎng)按識(shí)別/掃描 右方二維碼 預(yù)約觀看直播 各行各業(yè)的組織都積極將業(yè)務(wù)遷移到云端,但同時(shí)發(fā)現(xiàn),無(wú)論單個(gè)本地應(yīng)用,還是跨多個(gè)
    的頭像 發(fā)表于 11-28 17:45 ?442次閱讀

    NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來(lái)了解一些相關(guān)的基本知識(shí)。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時(shí)首先提出,從此
    發(fā)表于 11-21 09:40 ?1332次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架構(gòu)及架構(gòu)演進(jìn)

    NVIDIA GPU 助力筷子科技,升級(jí)更全面和 AI 原生化的內(nèi)容商業(yè)全鏈路平臺(tái)

    了 Kuaizi 的 AI 服務(wù)能力。 本案例主要應(yīng)用到 T4 、 V100 、 NVIDIA GTX 1080 Ti 和 TensorRT 。 客戶簡(jiǎn)介及應(yīng)用背景 筷子科技是服務(wù)于全球內(nèi)容商業(yè)生態(tài)的技術(shù)提供商
    的頭像 發(fā)表于 11-13 20:45 ?491次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b> 助力筷子科技,升級(jí)更全面和 AI 原生化的內(nèi)容商業(yè)全鏈路平臺(tái)