免费观看a级毛片在线播放,天天拍天天操国产三级片

Microsoft 的目標(biāo)是，通過(guò)結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

如果您的軟件能喚起人們喜悅的淚水，您就是在傳播歡樂(lè)。

Translator 是一項(xiàng) Microsoft Azure 認(rèn)知服務(wù)，通過(guò)應(yīng)用一些規(guī)模龐大的 AI 模型來(lái)幫助更多人進(jìn)行交流。

“有太多精彩的故事可以講了!” Translator 開(kāi)發(fā)經(jīng)理 Vishal Chowdhary 表示。

比如，在 2010 年海地遭受 7.0 級(jí)地震后，在短短 5 天的沖刺期里為相關(guān)應(yīng)用緊急添加海地克里奧爾語(yǔ)支持，進(jìn)而為救援人員提供幫助。再比如，祖父母在使用這款軟件，與講著他們不懂的語(yǔ)言的遠(yuǎn)方孫輩進(jìn)行第一次實(shí)時(shí)交流時(shí)，感動(dòng)到哽咽。

雄心勃勃的目標(biāo)

“我們的愿景是，讓成千上萬(wàn)的開(kāi)發(fā)者都已經(jīng)在使用的這個(gè) API，能打破不同語(yǔ)言、不同模式之間的阻礙?！?Chowdhary 說(shuō)。

考量全球現(xiàn)行的語(yǔ)言大約有 7000 種，這真的是個(gè)雄心勃勃的目標(biāo)。

因此，團(tuán)隊(duì)采用了一種強(qiáng)大而復(fù)雜的工具，即是混合專(zhuān)家系統(tǒng)(MoE)AI 方法。

在推動(dòng)自然語(yǔ)言處理快速發(fā)展進(jìn)步的 Transformer 模型中，這是非常先進(jìn)的一種。它具有 50 億個(gè)參數(shù)，其規(guī)模比團(tuán)隊(duì)在生產(chǎn)過(guò)程中用于自然語(yǔ)言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計(jì)算量，很難找到能將其投入生產(chǎn)環(huán)境中使用的用戶(hù)。在初始測(cè)試中，基于 CPU 的服務(wù)器無(wú)法滿(mǎn)足團(tuán)隊(duì)要在一秒鐘內(nèi)完成翻譯一個(gè)文檔的要求。

27 倍的提速

隨后，該團(tuán)隊(duì)使用 NVIDIA Triton 推理服務(wù)器(本周 GTC 大會(huì)上宣布的 NVIDIA AI Enterprise 2.0 平臺(tái)的其中一部分)在加速系統(tǒng)上進(jìn)行了測(cè)試。

Chowdhary 說(shuō)：“借助 NVIDIA GPU 和 Triton，我們得以實(shí)現(xiàn)這一目標(biāo)，且非常高效?！?/p>

事實(shí)上，相較于未經(jīng)優(yōu)化的 GPU 運(yùn)行時(shí)，該團(tuán)隊(duì)實(shí)現(xiàn)了高達(dá) 27 倍的提速。

“這讓我們可以構(gòu)建一個(gè)模型來(lái)執(zhí)行不同的語(yǔ)言理解任務(wù)，例如匯總、生成文本和翻譯等，而不必為每個(gè)任務(wù)開(kāi)發(fā)單獨(dú)的模型。” 負(fù)責(zé)監(jiān)督測(cè)試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(wù)(如翻譯多個(gè)文檔)拆分為許多個(gè)小任務(wù)，在每個(gè)小任務(wù)中翻譯幾百個(gè)句子。Triton 的動(dòng)態(tài)批處理功能將諸多此類(lèi)請(qǐng)求整合起來(lái)，從而充分利用 GPU 的強(qiáng)大功能。

對(duì)于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運(yùn)行各種模型的能力，讓該團(tuán)隊(duì)贊不絕口。

Chowdhary 的團(tuán)隊(duì)十多年來(lái)一直在開(kāi)發(fā)大規(guī)模分布式系統(tǒng)。Chowdhary 表示：“這種解決方案周到地考慮了我的工作場(chǎng)景，提供了我想要的各種功能，就像是我給自己親手定制的解決方案一樣。

在幕后，有兩個(gè)軟件組件是 Triton 取得成功的關(guān)鍵。一個(gè)是 NVIDIA 擴(kuò)展型 FasterTransformer，這是一個(gè)處理推理計(jì)算的軟件層，可支持 MoE 模型。另一個(gè)是 CUTLASS，這是一個(gè) NVIDIA 數(shù)學(xué)庫(kù)，有助于高效實(shí)現(xiàn)模型。

在四周內(nèi)提供已驗(yàn)證的原型

盡管測(cè)試十分復(fù)雜，但該團(tuán)隊(duì)通過(guò)與 NVIDIA 工程師合作并運(yùn)用 Triton 的強(qiáng)大力量，在不到一個(gè)月的時(shí)間內(nèi)就獲得了可投入正常運(yùn)轉(zhuǎn)的端到端原型。

“在如此之短的時(shí)間內(nèi)制作出一款達(dá)到可發(fā)布程度的產(chǎn)品，這樣的效率實(shí)在令人印象深刻，對(duì)此我真的非常感激?！?Awadalla 這樣說(shuō)道。

雖然這是該團(tuán)隊(duì)第一次使用 Triton，但 “我們使用它來(lái)發(fā)布 MoE 模型，不用花費(fèi)太多力氣就重新構(gòu)建了運(yùn)行時(shí)環(huán)境，現(xiàn)在我衷心希望在我們的長(zhǎng)期托管系統(tǒng)中納入這款解決方案?！?Chowdhary 補(bǔ)充表示。

采取后續(xù)措施

加速后的服務(wù)將采用審慎的步驟實(shí)施，初期會(huì)用于少數(shù)幾種主要語(yǔ)言的文檔翻譯。

Chowdhary 表示：“我們的最終目標(biāo)是，讓客戶(hù)能在所有場(chǎng)景中通過(guò)透明的方式獲享這些新模型的優(yōu)點(diǎn)。”

這項(xiàng)工作是 Microsoft 的一項(xiàng)涉獵更廣泛的計(jì)劃的一部分。其目的是推動(dòng) Office 和 Teams 等眾多產(chǎn)品的進(jìn)步，幫助各類(lèi)開(kāi)發(fā)者與客戶(hù)(從專(zhuān)注于打造一款應(yīng)用的小型公司到財(cái)富 500 強(qiáng)企業(yè))取得發(fā)展。

為了給這一計(jì)劃鋪平道路，Awadalla 的團(tuán)隊(duì)于去年 9 月發(fā)表了一項(xiàng)研究成果，介紹如何在 NVIDIA A100 Tensor Core GPU 上訓(xùn)練具有多達(dá) 2 千億個(gè)參數(shù)的 MoE 模型。自那之后，該團(tuán)隊(duì)還在具有超過(guò) 3 千億個(gè)參數(shù)的模型上使用 80G 版本的 A100 GPU，將性能提升了 8 倍。

Adawalla 表示：“為了更好地表示更多的語(yǔ)言，尤其是我們手頭沒(méi)有太多數(shù)據(jù)的語(yǔ)言，模型必定會(huì)越來(lái)越大?！?/p>

原文標(biāo)題：GTC22 | 促進(jìn)人際交流：微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處：【微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4818

瀏覽量
102649
gpu

gpu

+關(guān)注

關(guān)注
27

文章
4639

瀏覽量
128474
AI

AI

+關(guān)注

關(guān)注
87

文章
29435

瀏覽量
267747
Microsoft

Microsoft

+關(guān)注

關(guān)注
0

文章
208

瀏覽量
6817

原文標(biāo)題：GTC22 | 促進(jìn)人際交流：微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

NVIDIA CorrDiff生成式AI模型能夠精準(zhǔn)預(yù)測(cè)臺(tái)風(fēng)

在 NVIDIA GPU 上運(yùn)行的一個(gè)擴(kuò)散模型向天氣預(yù)報(bào)工作者展示了加速計(jì)算如何實(shí)現(xiàn)新的用途并提升能效。

發(fā)表于 09-13 17:13 ?584次閱讀

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開(kāi)源生態(tài)的優(yōu)勢(shì)，為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和

發(fā)表于 09-09 09:19 ?382次閱讀

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

借助 NVIDIA AI Foundry，企業(yè)和各國(guó)現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對(duì)，來(lái)構(gòu)建“超級(jí)

發(fā)表于 07-24 09:39 ?665次閱讀

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

使用PyTorch搭建Transformer模型

Transformer模型自其問(wèn)世以來(lái)，在自然語(yǔ)言處理（NLP）領(lǐng)域取得了巨大的成功，并成為了許多先進(jìn)模型（如BERT、GPT等）的基礎(chǔ)。本文將深入解讀如何使用PyTorch框架搭建Trans

發(fā)表于 07-02 11:41 ?1322次閱讀

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù)，將簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程，加速生成式 AI 的發(fā)展步伐。 NVIDIA

發(fā)表于 06-21 14:39 ?265次閱讀

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

作為極具開(kāi)創(chuàng)性的一站式“交鑰匙”私有云人工智能（private-cloud AI）解決方案，NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生

發(fā)表于 06-20 17:36 ?637次閱讀

Microsoft AI 推進(jìn)行業(yè)企業(yè)智慧化創(chuàng)新

2024年6月17日，北京—— 近日，微軟在北京舉辦以“共創(chuàng)AI創(chuàng)新，智啟無(wú)限可能”為主題的Microsoft AI Day活動(dòng)，集中展示了在生成式智能技術(shù)加速發(fā)展普及的過(guò)程中，微軟取

發(fā)表于 06-17 16:59 ?925次閱讀

NVIDIA與微軟擴(kuò)展合作，幫助開(kāi)發(fā)者更快構(gòu)建和部署AI應(yīng)用

NVIDIA 在 Microsoft Build 開(kāi)發(fā)者大會(huì)上展示了與 Microsoft Azure 和 Windows PC 的集成解決方案，簡(jiǎn)化了 AI

發(fā)表于 05-23 10:14 ?339次閱讀

NVIDIA加速微軟最新的Phi-3 Mini開(kāi)源語(yǔ)言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開(kāi)源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開(kāi)源庫(kù)，用于優(yōu)化從 PC 到云端的

發(fā)表于 04-28 10:36 ?446次閱讀

NVIDIA在加速識(shí)因智能AI大模型落地應(yīng)用方面的重要作用介紹

本案例介紹了 NVIDIA 在加速識(shí)因智能 AI 大模型落地應(yīng)用方面的重要作用。生成式大模型已廣泛應(yīng)用于各領(lǐng)域，通過(guò)學(xué)習(xí)人類(lèi)思維方式，能快速

發(fā)表于 03-29 15:28 ?543次閱讀

使用NVIDIA Triton推理服務(wù)器來(lái)加速AI預(yù)測(cè)

這家云計(jì)算巨頭的計(jì)算機(jī)視覺(jué)和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來(lái)加速 AI 預(yù)測(cè)。

發(fā)表于 02-29 14:04 ?517次閱讀

NVIDIA 初創(chuàng)加速計(jì)劃 Omniverse 加速營(yíng)

的重要力量?；?NVIDIA 全棧式 AI 計(jì)算平臺(tái)和 Omniverse TM 平臺(tái)上的生成式 AI 創(chuàng)作實(shí)踐，讓企業(yè)、開(kāi)發(fā)者能夠了解可落地的生成式 AI 內(nèi)容創(chuàng)作技術(shù)及其技術(shù)趨勢(shì)

發(fā)表于 12-04 20:35 ?593次閱讀

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

AI Enterprise 軟件進(jìn)行部署 NVIDIA 于今日推出一項(xiàng) AI foundry 服務(wù)，助力企業(yè)和初創(chuàng)公司在 Microsoft Azure 上開(kāi)發(fā)、調(diào)優(yōu)和部署其自定義生

發(fā)表于 11-16 21:15 ?464次閱讀

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

AI Enterprise 軟件進(jìn)行部署 ? ? ? Microsoft Ignite — 2023 年 11 月 15 日 — NVIDIA 于今日推出一項(xiàng) AI foundry

發(fā)表于 11-16 14:13 ?299次閱讀

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

近日，NVIDIA 發(fā)布了 Jetson 生成式 AI 實(shí)驗(yàn)室（Jetson Generative AI Lab），使開(kāi)發(fā)者能夠通過(guò) NVIDIA Jetson 邊緣設(shè)備在現(xiàn)實(shí)世界中探

發(fā)表于 11-07 21:25 ?855次閱讀