0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

商湯大裝置加速大模型能力下沉,構建智能計算新生態(tài)

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2024-03-29 15:21 ? 次閱讀

大模型技術持續(xù)突破前沿,如何加速向產業(yè)“下沉”?

3月23~24日,2024全球開發(fā)者先鋒大會(GDC)在上海成功舉辦。期間,商湯科技大裝置執(zhí)行總監(jiān)成功,以及商湯科技大裝置產品總監(jiān)陳希受邀出席大會分論壇活動,圍繞大模型前沿開發(fā)、智能計算創(chuàng)新等話題分享前瞻洞見,共話智能生態(tài)構建

以體系化基礎能力支撐,加速大模型向下演進

去年以來,生成式AI取得了飛躍式的發(fā)展,并不斷從單一模態(tài)向多模態(tài)演進。那么,還有哪些因素是大模型發(fā)展的關鍵?

在GDC 2024大模型前沿論壇上,商湯科技大裝置執(zhí)行總監(jiān)成功認為,大模型在很多場景下已經具備了強大的基礎能力,但在推理和規(guī)劃執(zhí)行能力方面還需要繼續(xù)突破。同時,效率和成本也是大模型發(fā)展的關鍵因素,需要以更低的成本、更快的速度觸達應用并形成閉環(huán)。

其一是多模態(tài)融合的挑戰(zhàn),需要有效地將更多不同模態(tài)進行深度融合,提高模型對多模態(tài)數(shù)據(jù)的理解和處理能力。

其二是模型性能與成本平衡的挑戰(zhàn),需要在模型小型化的同時盡可能保持原有模型性能,特別是滿足個人場景下端側模型、端云協(xié)同的應用需求。

此外,隨著大模型尺度的提升和訓練數(shù)據(jù)的增加,行業(yè)還需要一套高效的大規(guī)?;A設施,以提供包括高質量的數(shù)據(jù)管線、全面的評價體系、完善的工具鏈等體系化的底層支撐。

成功表示,SenseCore 商湯大裝置沉淀了整套大模型基礎設施能力,不僅可服務于眾多企業(yè)和科研院所的開發(fā)者,很快也會向個人開發(fā)者全面開放。

在AI基礎設施之上,SenseCore 商湯大裝置將推出全新升級的大模型服務平臺和開發(fā)者工具,并向社區(qū)免費提供千萬級算力補貼、萬億token大模型調用資源。 商湯希望通過大裝置激發(fā)整個社區(qū)的力量,攜手更多開發(fā)者共同探索大模型能力前沿,拓展技術邊界。

高效率、低成本智算基礎設施

賦能AI生產新范式

大模型時代,計算量、模型參數(shù)和數(shù)據(jù)集規(guī)模都在快速增長從而不斷推升模型的“智能”水平,其背后遵循的就是尺度定律。同時,隨著AI在各行各業(yè)的落地向深水區(qū)挺進,人工智能基礎設施化已成為必然趨勢。

在GDC 2024曙光智能計算開發(fā)者講壇上,商湯科技大裝置產品總監(jiān)陳希分享了依托SenseCore商湯大裝置,商湯科技在智能計算領域的探索和實踐。

第一,加速國產算力布局。通過與眾多國產算力廠商合作,商湯與上下游產業(yè)伙伴共同推動國產生態(tài)建設,完成多款芯片與框架適配,落地1500P國產算力集群,積極推進芯片評價標準和體系的完善,加速整個國產算力商業(yè)化進程。

第二,持續(xù)探索尺度定律邊界。隨著大模型的參數(shù)量朝向萬億以上級別激增,穩(wěn)定、高效的超大規(guī)模算力調度和訓推引擎成為核心基石。 SenseCore 商湯大裝置擁有萬卡規(guī)模異構算力池,可滿足萬億參數(shù)大模型訓推需求,實現(xiàn)分鐘級容錯以達成30天以上大規(guī)模長時間訓練不間斷。 另外在推理側,自研推理引擎在大語言、多模態(tài)模型性能表現(xiàn)提升2倍;通過訓練、微調、推理混部,資源利用率提升40%,為用戶提供極致性價比服務。

第三,建設面向開發(fā)者友好的AI基礎設施。面對愈發(fā)高頻次、高效率的模型迭代需求,SenseCore商湯大裝置擁有領先的AI 原生云算力產品體系,為客戶打造0門檻,一站式的極致開發(fā)體驗,縮短大模型開發(fā)周期。

根據(jù)國際知名調研機構弗若斯特沙利文(Frost & Sullivan)聯(lián)合頭豹研究院發(fā)布的《2023年中國AI開發(fā)平臺市場報告》,商湯大裝置成為AI開發(fā)平臺領軍者,市場綜合競爭表現(xiàn)國內第一,全球位居第二,僅次于亞馬遜云。 以人工智能大模型開發(fā)、生產、應用為核心,商湯致力于通過高效率、低成本、規(guī)?;南乱淮娜斯ぶ悄芑A設施與服務,深化AI算力生態(tài)建設,助力發(fā)展數(shù)字經濟產業(yè)全生態(tài)。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1789

    文章

    46324

    瀏覽量

    236495
  • 商湯科技
    +關注

    關注

    8

    文章

    478

    瀏覽量

    36024
  • 大模型
    +關注

    關注

    2

    文章

    2207

    瀏覽量

    2231
  • 生成式AI
    +關注

    關注

    0

    文章

    472

    瀏覽量

    436

原文標題:GDC 2024 | 商湯大裝置加速大模型能力下沉,構建智能計算新生態(tài)

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中興通訊AI創(chuàng)新生態(tài)論壇成功舉辦

    日前,以“全棧智算,打造高效基座;開放合作,構建繁榮生態(tài)”為主題的2024世界人工智能大會中興通訊AI創(chuàng)新生態(tài)論壇在滬成功舉辦。論壇匯聚頂尖專家學者,GPU廠家、
    的頭像 發(fā)表于 09-05 15:34 ?356次閱讀

    康耐視智能智造解決方案助力施耐德電氣構建智能基地新生態(tài)

    在消費者需求日益多元化、綠色生產政策日益嚴格以及全球工業(yè)競爭日益激烈的背景下,施耐德電氣,作為能源管理與自動化領域的領航者,正積極擁抱物聯(lián)網、大數(shù)據(jù)、云計算及人工智能等新興技術,全力構建智能
    的頭像 發(fā)表于 08-08 11:29 ?529次閱讀

    商湯科技加入中國移動人工智能模型評測聯(lián)盟

    WAIC 2024期間,中國移動發(fā)起成立人工智能模型評測聯(lián)盟(弈衡),商湯科技作為初創(chuàng)成員受邀加入聯(lián)盟。 人工智能實現(xiàn)突破發(fā)展,“AI+”評測正成為關鍵一環(huán)。人工
    的頭像 發(fā)表于 07-12 14:20 ?564次閱讀

    產研聯(lián)合破題,AI大模型下沉行業(yè)應用加速

    商湯科技流式多模態(tài)交互大模型「日日新SenseNova 5.5」驚艷亮相,日日新大模型全面賦能WAIC大會,帶來超燃AI體驗。
    的頭像 發(fā)表于 07-08 15:35 ?445次閱讀

    商湯科技發(fā)布日日新5.5大模型體系

    商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系,標志著人工智能領域又邁出了堅實的一步。該體系以6000億參數(shù)的超大規(guī)模基礎模型——日日新5.5為核心,性能較上一代實現(xiàn)了顯著提升,高
    的頭像 發(fā)表于 07-08 15:05 ?478次閱讀

    商湯科技發(fā)布粵語大模型,推動香港人工智能生態(tài)系統(tǒng)發(fā)展

    商湯科技董事長兼 CEO 徐立表示,此次推出商量粵語版具有重要意義,希望借助日日新大模型 5.0 系列的創(chuàng)新產品和巨大潛力,助力香港人工智能生態(tài)系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 05-31 11:11 ?506次閱讀

    商湯科技即將推出日日新大模型5.0粵語版本

    在盛大的“新質企業(yè)家聯(lián)合會”成立典禮上,商湯科技副總裁、智慧城市與商業(yè)事業(yè)群總裁張果琲宣布了一項重要消息。商湯科技即將推出日日新大模型5.0的粵語版本,這一新版本將基于大裝置和強大的技
    的頭像 發(fā)表于 05-13 10:58 ?517次閱讀

    商湯將發(fā)布日日新大模型5.0粵語版本

    商湯科技即將迎來一項重要更新,他們將發(fā)布日日新大模型5.0的粵語版本。這一版本是基于商湯科技現(xiàn)有的大裝置和日日新大模型5.0的先進
    的頭像 發(fā)表于 05-08 09:33 ?431次閱讀

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo 4月23日,商湯科技董事長兼CEO徐立在2024商湯技術交流日上發(fā)布
    的頭像 發(fā)表于 04-24 16:49 ?1015次閱讀

    商湯科技作亮相2024全球開發(fā)者先鋒大會

    2024全球開發(fā)者先鋒大會(GDC)在上海圓滿落幕。商湯科技作為業(yè)內翹楚,其大裝置執(zhí)行總監(jiān)成功和產品總監(jiān)陳希受邀參加了此次大會的分論壇活動,就大模型前沿開發(fā)、智能
    的頭像 發(fā)表于 03-29 10:24 ?545次閱讀

    商湯與華為昇騰共筑人工智能產業(yè)新生態(tài)

    近日,華為對SenseCore商湯裝置AI云及商湯日日新·商量SenseChat大語言模型進行了全面評測,結果喜人。這兩款產品均成功通過華為Atlas系列服務器的兼容性測試,并榮獲H
    的頭像 發(fā)表于 03-25 09:36 ?1203次閱讀

    商湯科技與庫醇科技達成合作 為垂域大模型構建高質量大規(guī)模的領域微調數(shù)據(jù)

    近日,商湯科技與庫醇科技(StockVins)達成合作,雙方將基于商湯領先的算法能力和庫醇在葡萄酒行業(yè)的深厚積累, 共 同打造智能化葡萄酒管理、倉儲和推薦系統(tǒng) ,革新大眾體驗葡萄酒的方
    的頭像 發(fā)表于 01-10 09:46 ?635次閱讀
    <b class='flag-5'>商湯</b>科技與庫醇科技達成合作 為垂域大<b class='flag-5'>模型</b><b class='flag-5'>構建</b>高質量大規(guī)模的領域微調數(shù)據(jù)

    什么是Ada4528號衛(wèi)星輸出的當前能力下沉能力?

    什么是Ada4528號衛(wèi)星輸出的當前能力下沉能力? 感謝 謝謝
    發(fā)表于 11-24 08:15

    商湯打出“數(shù)字中國”建設大模型組合拳

    提供宏觀尺度的解譯能力,“洞察地球奧秘”。 以 商湯瓊宇SenseSpace高精實景三維重建平臺 提供精細化建模能力,“還原真實世界”。 從 二維到三維的大模型組合拳 ,是
    的頭像 發(fā)表于 11-09 13:35 ?484次閱讀
    <b class='flag-5'>商湯</b>打出“數(shù)字中國”建設大<b class='flag-5'>模型</b>組合拳

    商湯科技(西南)人工智能計算中心“點亮”,AGI基礎設施加速產業(yè)數(shù)字化升級

    —2025年)》 早在2022年初,位于 基于SenseCore商湯裝置AI云服務產品體系,以南岸區(qū)重慶經開區(qū)為起點,商湯科技將充分利用在人工智能領域的深厚技術積累與豐富落地經驗,結
    的頭像 發(fā)表于 10-25 16:25 ?526次閱讀
    <b class='flag-5'>商湯</b>科技(西南)人工<b class='flag-5'>智能</b><b class='flag-5'>計算</b>中心“點亮”,AGI基礎設施<b class='flag-5'>加速</b>產業(yè)數(shù)字化升級