0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA AI Enterprise助力九州未來構(gòu)建MaaS平臺

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-01-10 17:24 ? 次閱讀

借助 NVIDIA AI Enterprise

構(gòu)建 MaaS 平臺

本案例中,九州未來的團(tuán)隊(duì)基于NVIDIA AI Enterprise的全棧軟件套件,構(gòu)建其 MaaS 大模型一體化開發(fā)及部署平臺,該平臺同時(shí)支持云端部署和私有化部署,通過九州未來開發(fā)的算力調(diào)度平臺軟件,實(shí)現(xiàn)云端資源與大模型一體機(jī)的算力協(xié)調(diào)和開發(fā)協(xié)同。

兼顧企業(yè)級的

安全性、可靠性和性能

隨著大模型的持續(xù)發(fā)展,特別是垂直領(lǐng)域大模型,對于數(shù)據(jù)安全性及私密性、模型工具鏈及平臺的通用性和可靠性、模型上線部署的易用性及推理性能等諸多方面提出了更多的訴求。面對快速增長的市場及客戶需求,九州未來基于 NVIDIA AI Enterprise 自主開發(fā)了其大模型 MaaS 平臺,不僅支持端到端的垂直領(lǐng)域大模型的開發(fā)全流程,同時(shí)支持線下一體機(jī)部署與云端資源協(xié)調(diào)模式,在最大化保護(hù)企業(yè)數(shù)據(jù)安全性的同時(shí),兼顧靈活的算力調(diào)度與協(xié)調(diào)供給。

九州未來創(chuàng)始人兼 CEO 張淳先生表示,“AIGC 促進(jìn)智能算力爆發(fā)式增長,并正加速邁入全面應(yīng)用時(shí)代,今后一定不是裸算力簡單的資源管理方式,一定需要用軟件定義精算力來多元化地管理并提升 GPU 的附加價(jià)值,助力加速垂直模型和應(yīng)用落地的效率?!?/p>

為構(gòu)建自定義

生成式 AI 應(yīng)用提供支持

NVIDIA AI Enterprise 是一個(gè)為企業(yè)提供生產(chǎn)就緒型全棧的軟件解決方案,提供并保證其可靠的 AI 正常運(yùn)行和不間斷的 AI 卓越表現(xiàn),實(shí)現(xiàn)利用生成式 AI 進(jìn)行創(chuàng)新的企業(yè)加速開發(fā)。

九州未來通過 10 余年云邊自主研發(fā)軟件的技術(shù)積累,結(jié)合近年來賦能智算中心的不斷落地,通過 NVIDIA AI Enterprise 深度的技術(shù)整合,以大模型為基礎(chǔ)、輕量化微調(diào)的 MaaS 服務(wù)作為其核心服務(wù)能力之一,基于基礎(chǔ)模型訓(xùn)練后的行業(yè)大模型,使用相關(guān)行業(yè)數(shù)據(jù)進(jìn)行微調(diào)或知識檢索能力的導(dǎo)入,再通過NVIDIA TensorRT-LLM及NVIDIA Triton推理服務(wù)器的推理優(yōu)化和實(shí)現(xiàn)一鍵部署后,可以為特定行業(yè)提供高質(zhì)量高性能的大模型 AI 應(yīng)用。

上圖的大模型 MaaS 平臺,端到端包含 Animbus PaaS 平臺(集成NVIDIA GPU Operator和Network Operator)、NVIDIA AI Enterprise 軟件套件(包括NeMo Framework– Training Container 和 Inference Container)、MaaS 大模型服務(wù)及應(yīng)用 UI 交互界面,以上所有的軟件以及對應(yīng)的操作系統(tǒng)鏡像會打包到一個(gè) U 盤里面,實(shí)現(xiàn)一個(gè) U 盤即可快速啟動大模型一體機(jī)的服務(wù)。

NVIDIA NeMo Framework

加速行業(yè)大模型開發(fā)

LLM(大型語言模型)的全面解決方案

在 MaaS 平臺的二次開發(fā)和深度整合的過程中,九州未來團(tuán)隊(duì)使用 NVIDIA AI Enterprise 中的 NeMo Framework,一款端到端面向企業(yè)級交付、云原生大模型的框架,可以靈活地構(gòu)建、定制和部署生成式 AI 模型。

該平臺承載了諸多優(yōu)質(zhì)的大模型精選體驗(yàn),結(jié)合特有的行業(yè)知識快速導(dǎo)入能力,用戶能夠很好地訓(xùn)練、微調(diào)、評估、優(yōu)化及部署模型。對于選擇好基礎(chǔ)模型的用戶,提供全流程的向?qū)椒?wù),訓(xùn)練過程中的訓(xùn)練數(shù)據(jù)實(shí)時(shí)可查,用戶可輕松基于數(shù)據(jù)集、使用最好的超參數(shù)完成微調(diào)任務(wù),在模型完成評估后,實(shí)現(xiàn)大模型的一鍵優(yōu)化部署。

主要支持訓(xùn)練及優(yōu)化功能:

基礎(chǔ)大模型倉庫

SFT/PEFT/提示詞工程

推理優(yōu)化及一鍵部署

知識導(dǎo)入及向量數(shù)據(jù)庫服務(wù)

通過 NVIDIA AI Enterprise 整體軟件棧的加速,大模型微調(diào)和推理性能相比開源推理框架有大幅提升。

線形圖代表在不同 Batch 的情況下完成每次推理請求的平均時(shí)延,越低代表越好;

柱狀圖代表在不同 Batch 情況下的每秒鐘生成的 Token 數(shù)量,越高代表越好

準(zhǔn)備好開始了嗎?

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4814

    瀏覽量

    102632
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267646
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2206

    瀏覽量

    2229

原文標(biāo)題:NVIDIA AI Enterprise 助力九州未來構(gòu)建 MaaS 平臺 加速行業(yè)大模型開發(fā)與部署

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺NVIDIA AI Enterprise 軟件和 NVIDIA
    的頭像 發(fā)表于 10-10 09:35 ?186次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    NVIDIA AI Enterprise 平臺中的 NIM 微服務(wù)與 NeMo 框架構(gòu)建和運(yùn)行他們的
    發(fā)表于 08-28 10:10 ?172次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 NIM Agent Blueprints,<b class='flag-5'>助力</b>企業(yè)打造屬于自己的 <b class='flag-5'>AI</b>

    日本九州大學(xué)開發(fā)了名為QDyeFinder的人工智能(AI)工具

    在探索大腦這一宇宙中最復(fù)雜結(jié)構(gòu)的征途中,科學(xué)家們不斷突破技術(shù)的邊界,以更精細(xì)、更高效的方式揭示其奧秘。近期,日本九州大學(xué)的研究團(tuán)隊(duì)在《自然·通訊》雜志上發(fā)表了一項(xiàng)革命性的研究成果,他們開發(fā)了一種名為
    的頭像 發(fā)表于 07-03 14:43 ?386次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    NVIDIA Holoscan 的 NVIDIA AI Enterprise-IGX 軟件現(xiàn)已在 NVIDIA IGX
    發(fā)表于 06-03 09:48 ?259次閱讀
      <b class='flag-5'>NVIDIA</b> 通過 Holoscan 為 <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) <b class='flag-5'>AI</b> 應(yīng)用

    NVIDIA AI Enterprise榮獲金獎(jiǎng)

    NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認(rèn)可。
    的頭像 發(fā)表于 05-29 09:27 ?374次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> <b class='flag-5'>Enterprise</b>榮獲金獎(jiǎng)

    研華與英偉達(dá)深化合作,成為NVIDIA AI Enterprise軟件全球分銷商

    近日,研華宣布擴(kuò)大與英偉達(dá)的合作,未來將通過工業(yè)級邊緣計(jì)算和英偉達(dá) AI Enterprise 軟件平臺提升全球企業(yè)的AI生產(chǎn)力。
    的頭像 發(fā)表于 05-10 10:25 ?364次閱讀

    研華與英偉達(dá)深化合作, 成為NVIDIA AI Enterprise軟件全球分銷商

    )的軟件平臺。近日發(fā)布的NVIDIA AI Enterprise 5.0將為用戶提供一系列微服務(wù),其中包括NVIDIA NIM。這是一套用于
    發(fā)表于 05-07 11:21 ?226次閱讀
    研華與英偉達(dá)深化合作, 成為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> <b class='flag-5'>Enterprise</b>軟件全球分銷商

    睿創(chuàng)微納攜多款汽車紅外熱成像產(chǎn)品亮相2024九州汽車生態(tài)博覽會

    3月7日至10日,亞洲規(guī)模最大、品類最全汽車生態(tài)大展——2024九州汽車生態(tài)博覽會(簡稱:九州展)在深圳盛大舉辦,圓滿落幕。
    的頭像 發(fā)表于 03-20 09:16 ?569次閱讀

    2024九州展:睿創(chuàng)微納汽車紅外熱成像解決方案,實(shí)力出圈!

    3月7日至10日,亞洲規(guī)模最大、品類最全汽車生態(tài)大展——2024九州汽車生態(tài)博覽會(簡稱:九州展)在深圳盛大舉辦,圓滿落幕。
    的頭像 發(fā)表于 03-12 14:23 ?818次閱讀

    九州風(fēng)神沖刺北交所IPO

    近日,國產(chǎn)高性能散熱裝置領(lǐng)域的佼佼者九州風(fēng)神在北交所的IPO進(jìn)程中迎來了第二輪審核問詢函的發(fā)布。這標(biāo)志著九州風(fēng)神距離登陸資本市場又近了一步,其發(fā)展前景備受市場關(guān)注。
    的頭像 發(fā)表于 03-11 13:57 ?479次閱讀

    九州風(fēng)神北交所IPO新進(jìn)展

    近日,北京市九州風(fēng)神科技股份有限公司(以下簡稱九州風(fēng)神),這家以高性能散熱裝置研發(fā)、生產(chǎn)和銷售為核心業(yè)務(wù)的高新技術(shù)企業(yè),在北交所的IPO進(jìn)程中,發(fā)布了第二輪審核問詢函。這標(biāo)志著九州風(fēng)神在資本市場上的步伐又向前邁進(jìn)了一步。
    的頭像 發(fā)表于 03-11 13:55 ?560次閱讀

    魔視智能于九州汽車生態(tài)博覽會發(fā)布全新商用車前裝AEB系統(tǒng)

    2024年3月7日-10日,中國深圳,魔視智能MOTOVIS于2024年九州汽車生態(tài)博覽會期間(下文簡稱:九州展)發(fā)布全新商用車前裝AEB系統(tǒng)。
    的頭像 發(fā)表于 03-11 09:11 ?534次閱讀

    熊本縣、熊本大學(xué)及九州大學(xué)簽署半導(dǎo)體領(lǐng)域研究與人才培養(yǎng)協(xié)議

    日本熊本縣、熊本大學(xué)及九州大學(xué)達(dá)成綜合協(xié)議, 著眼于攻克半導(dǎo)體技術(shù)挑戰(zhàn), 加強(qiáng)研發(fā)和培養(yǎng)人才力度。此次聚首旨在滿足熊本地塊吸引的全球代工巨頭——臺積電及其供應(yīng)商產(chǎn)生的技術(shù)人員需求。
    的頭像 發(fā)表于 12-27 10:34 ?532次閱讀

    九州風(fēng)神PX1000G WH電源參數(shù)詳解

    九州風(fēng)神PX1000G WH采用了與很多電源相同的“大風(fēng)車”散熱結(jié)構(gòu),加上它標(biāo)準(zhǔn)的ATX體型,讓它能夠容納一個(gè)135mm的大尺寸散熱風(fēng)扇。風(fēng)扇外部的通風(fēng)網(wǎng)孔比一般的電源更大,單個(gè)方形網(wǎng)孔規(guī)格為1cm×1cm,大方孔可提升進(jìn)風(fēng)效果,不過也可能會降低濾塵能力。
    發(fā)表于 12-14 10:20 ?550次閱讀
    <b class='flag-5'>九州</b>風(fēng)神PX1000G WH電源參數(shù)詳解

    在 Azure 機(jī)器學(xué)習(xí)上充分發(fā)揮 NVIDIA AI Enterprise 的強(qiáng)大功能

    的方式實(shí)現(xiàn)這些技術(shù)的落地。 NVIDIA AI Enterprise 是一款全面的軟件套件,專門用于幫助企業(yè)大規(guī)模實(shí)現(xiàn)企業(yè)就緒的 AI、機(jī)器學(xué)習(xí)(ML)和數(shù)據(jù)分析,并提供安全性、可靠性
    的頭像 發(fā)表于 11-17 21:30 ?505次閱讀
    在 Azure 機(jī)器學(xué)習(xí)上充分發(fā)揮 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> <b class='flag-5'>Enterprise</b> 的強(qiáng)大功能