0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ServiceNow、Hugging Face和NVIDIA發(fā)布StarCoder2助力生成式AI構(gòu)建企業(yè)應(yīng)用

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 2024-03-01 10:28 ? 次閱讀

與 BigCode 社區(qū)共同創(chuàng)建的 StarCoder2 是在 600 多種編程語(yǔ)言上訓(xùn)練而成,它將推進(jìn)代碼生成、透明度、治理和創(chuàng)新。

ServiceNow、Hugging Face 和 NVIDIA 于今日發(fā)布 StarCoder2,其為一系列用于代碼生成的開(kāi)放獲取大語(yǔ)言模型(LLM),將為性能、透明度和成本效益樹(shù)立新標(biāo)準(zhǔn)。

StarCoder2 的聯(lián)合開(kāi)發(fā)者 BigCode 社區(qū)是由 ServiceNow 和 Hugging Face 共同管理。前者是一家領(lǐng)先的數(shù)字工作流公司,致力于為每個(gè)人創(chuàng)造更好的工作環(huán)境;后者則是最常用的開(kāi)源平臺(tái),機(jī)器學(xué)習(xí)社區(qū)在該平臺(tái)上就模型、數(shù)據(jù)集和應(yīng)用程序開(kāi)展合作。

在 619 種編程語(yǔ)言上訓(xùn)練而成的 StarCoder2,可接受進(jìn)一步的訓(xùn)練并嵌入到企業(yè)應(yīng)用中,以執(zhí)行應(yīng)用源代碼生成、工作流生成、文本摘要等特定任務(wù)。開(kāi)發(fā)者可以使用它的代碼補(bǔ)全、高級(jí)代碼摘要、代碼片段檢索等功能,加快創(chuàng)新速度及提高工作效率。

StarCoder2 提供三種規(guī)模的模型:由 ServiceNow 訓(xùn)練的 30 億參數(shù)模型、由 Hugging Face 訓(xùn)練的 70 億參數(shù)模型,以及由 NVIDIA 使用 NVIDIA NeMo 構(gòu)建并在 NVIDIA 加速基礎(chǔ)設(shè)施上訓(xùn)練的 150 億參數(shù)模型。規(guī)模較小的模型由于參數(shù)較少,在推理過(guò)程中所需的計(jì)算量較少,可在提供強(qiáng)大性能的同時(shí)節(jié)省計(jì)算成本。實(shí)際上,新的 30 億參數(shù)模型在性能上與原有的 StarCoder 150 億參數(shù)模型不相上下。

ServiceNow 的 StarCoder2 開(kāi)發(fā)團(tuán)隊(duì)負(fù)責(zé)人兼 BigCode 聯(lián)合負(fù)責(zé)人 Harm de Vries 表示:“StarCoder2 證明了將開(kāi)放式科學(xué)協(xié)作和負(fù)責(zé)任的 AI 實(shí)踐與道德數(shù)據(jù)供應(yīng)鏈相結(jié)合所產(chǎn)生的力量。這一極其先進(jìn)的開(kāi)放獲取模型將提高已有生成式 AI 的性能和開(kāi)發(fā)者的生產(chǎn)力,為開(kāi)發(fā)者提供平等的機(jī)會(huì),獲得代碼生成式 AI 的優(yōu)勢(shì)。這使任何規(guī)模的企業(yè)都能更加輕松地激發(fā)其全部業(yè)務(wù)潛力?!?/p>

Hugging Face 機(jī)器學(xué)習(xí)工程師兼 BigCode 聯(lián)合負(fù)責(zé)人 Leandro von Werra 表示:“在 Hugging Face、ServiceNow 和 NVIDIA 的共同努力下,這套功能強(qiáng)大的基礎(chǔ)模型終于問(wèn)世。在數(shù)據(jù)和訓(xùn)練完全透明的情況下,社區(qū)能夠更加高效地構(gòu)建各種應(yīng)用。StarCoder2 證明了開(kāi)源和開(kāi)放式科學(xué)的潛力,我們正在努力實(shí)現(xiàn)負(fù)責(zé)任 AI 的全民化。”

NVIDIA 應(yīng)用研究副總裁 Jonathan Cohen 表示:“由于每個(gè)軟件生態(tài)系統(tǒng)都有專(zhuān)門(mén)的編程語(yǔ)言,代碼 LLM 可以推動(dòng)各行業(yè)效率和創(chuàng)新方面的突破。NVIDIA 與 ServiceNow 和 Hugging Face 的合作帶來(lái)了安全且負(fù)責(zé)任的模型,讓更多人能夠用上負(fù)責(zé)任的生成式 AI,我們相信這將使全球社區(qū)受益?!?/p>

StarCoder2 模型

為自定義應(yīng)用開(kāi)發(fā)增添強(qiáng)大助力

StarCoder2 模型均使用來(lái)自 BigCode 的先進(jìn)架構(gòu)和精心挑選的數(shù)據(jù)源。為了實(shí)現(xiàn)負(fù)責(zé)任的大規(guī)模創(chuàng)新,數(shù)據(jù)源的透明度和開(kāi)放治理被放在第一位。

StarCoder2 提升了未來(lái)由 AI 驅(qū)動(dòng)的編碼應(yīng)用的潛力,包括各種文本-代碼和文本-工作流轉(zhuǎn)換功能。通過(guò)更加廣泛、深入的編程訓(xùn)練,它可以提供資源庫(kù)上下文,從而實(shí)現(xiàn)準(zhǔn)確的上下文感知預(yù)測(cè)。無(wú)論是經(jīng)驗(yàn)豐富的軟件工程師還是業(yè)余開(kāi)發(fā)者等,都能利用這些進(jìn)步提升業(yè)務(wù)價(jià)值和推動(dòng)數(shù)字化轉(zhuǎn)型。

StarCoder2 的基礎(chǔ)是一個(gè)名為 Stack v2 的新代碼數(shù)據(jù)集,該數(shù)據(jù)集規(guī)模比 Stack v1 大 7 倍多。除了先進(jìn)的數(shù)據(jù)集之外,新的訓(xùn)練技術(shù)也有助于模型理解低資源編程語(yǔ)言(如 COBOL 等)、數(shù)學(xué)和程序源代碼討論。

使用特定業(yè)務(wù)數(shù)據(jù)對(duì)先進(jìn)功能進(jìn)行微調(diào)

用戶可以使用 NVIDIA、NeMo 或 Hugging Face TRL 等開(kāi)源工具,利用特定行業(yè)或組織的數(shù)據(jù),對(duì)開(kāi)放獲取的 StarCoder2 模型進(jìn)行微調(diào)??梢詣?chuàng)建高級(jí)聊天機(jī)器人來(lái)處理更復(fù)雜的摘要或分類(lèi)任務(wù)、開(kāi)發(fā)能夠快速且輕松地完成編程任務(wù)的個(gè)性化編碼助手、檢索相關(guān)代碼片段,并實(shí)現(xiàn)文本-工作流轉(zhuǎn)換功能。

為創(chuàng)建適合自身業(yè)務(wù)的特定任務(wù)功能,各企業(yè)已經(jīng)開(kāi)始對(duì) StarCoder 基礎(chǔ)模型進(jìn)行微調(diào)。

ServiceNow 的文本-代碼 Now LLM 就是在 150 億參數(shù) StarCoder LLM 的專(zhuān)用版本上構(gòu)建而成的,并針對(duì)其工作流模式、用例和流程進(jìn)行了微調(diào)和訓(xùn)練。Hugging Face 也使用該模型創(chuàng)建了自己的 StarChat 助手。

BigCode 促進(jìn) AI 領(lǐng)域的開(kāi)放式科學(xué)協(xié)作

BigCode 是一個(gè)由 Hugging Face 和 ServiceNow 領(lǐng)導(dǎo)的開(kāi)放式科學(xué)協(xié)作社區(qū),致力于負(fù)責(zé)任的代碼 LLM 開(kāi)發(fā)。

BigCode 社區(qū)以工作組和特別任務(wù)組的形式積極參與 StarCoder2 項(xiàng)目的技術(shù)工作,分別使用 ServiceNow 的 Fast LLM 框架來(lái)訓(xùn)練 30 億參數(shù)模型、使用 Hugging Face 的 nanotron 框架來(lái)訓(xùn)練 70 億參數(shù)模型,以及 NVIDIA NeMo 云原生框架和 NVIDIA TensorRT-LLM 軟件來(lái)訓(xùn)練和優(yōu)化 150 億參數(shù)模型。

BigCode 的核心宗旨是促進(jìn)負(fù)責(zé)任的創(chuàng)新,其開(kāi)放的治理、透明的供應(yīng)鏈、開(kāi)源軟件的使用,以及讓開(kāi)發(fā)者選擇數(shù)據(jù)不用于訓(xùn)練等做法都體現(xiàn)了這一點(diǎn)。StarCoder2 是在獲得 Inria 托管的 Software Heritage 數(shù)字共享許可下,使用負(fù)責(zé)任的數(shù)據(jù)構(gòu)建而成的。

Software Heritage 總監(jiān) Roberto Di Cosmo 表示:“StarCoder2 是首個(gè)使用 Software Heritage 源代碼存檔開(kāi)發(fā)的代碼生成式 AI 模型,其構(gòu)建方式符合我們負(fù)責(zé)任地開(kāi)發(fā)代碼模型的政策。ServiceNow、Hugging Face 和 NVIDIA 的這一合作體現(xiàn)了對(duì)道德 AI 開(kāi)發(fā)的共同承諾,引領(lǐng)技術(shù)朝著更崇高的利益發(fā)展?!?/p>

StarCoder2 與其前代一樣,將在 BigCode Open RAIL-M 許可下免費(fèi)提供訪問(wèn)和使用。為進(jìn)一步促進(jìn)透明度和協(xié)作,該模型的支持代碼將繼續(xù)保留在 BigCode 項(xiàng)目的 GitHub 頁(yè)面上。

所有 StarCoder2 模型還可以在 Hugging Face 上下載。StarCoder2 150 億參數(shù)模型通過(guò) NVIDIA AI Foundation 模型提供,開(kāi)發(fā)者可以直接在瀏覽器上或通過(guò) API 端點(diǎn)進(jìn)行試用。



審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4822

    瀏覽量

    102655
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132219
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2225

    瀏覽量

    2264
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    472

    瀏覽量

    441

原文標(biāo)題:ServiceNow、Hugging Face和NVIDIA發(fā)布全新開(kāi)放獲取LLM,助力開(kāi)發(fā)者運(yùn)用生成式AI構(gòu)建企業(yè)應(yīng)用

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國(guó)佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會(huì)上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的
    的頭像 發(fā)表于 09-09 09:37 ?335次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?455次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國(guó)現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對(duì),來(lái)
    發(fā)表于 07-24 09:39 ?665次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 模型

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 變革

    關(guān)系進(jìn)一步深化。助力生成 AI企業(yè)級(jí)應(yīng)用與發(fā)展加速駛?cè)肟燔?chē)道。 HPE Private Cloud
    的頭像 發(fā)表于 06-20 17:36 ?643次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù)

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù),以加速新一代數(shù)字人的發(fā)展,并將在平臺(tái)上推出全新的
    的頭像 發(fā)表于 06-04 10:18 ?575次閱讀

    NVIDIA發(fā)布數(shù)字人微服務(wù),為制作生成AI數(shù)字化身鋪平未來(lái)之路

    ? ? COMPUTEX—2024年6月2日— NVIDIA宣布全面推出NVIDIA ACE生成AI
    發(fā)表于 06-03 17:43 ?159次閱讀

    亞馬遜云攜手AI新創(chuàng)企業(yè)Hugging Face,提升AI模型在定制芯片計(jì)算性能

    Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開(kāi)發(fā)者分享Chatbot和相關(guān)軟件的核心平臺(tái),受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。
    的頭像 發(fā)表于 05-23 14:24 ?358次閱讀

    NVIDIA推出微服務(wù),助力企業(yè)邁向生成AI

    NVIDIAAI 平臺(tái)適用于任何高瞻遠(yuǎn)矚的企業(yè)使用,而且比以往任何時(shí)候都更加易于應(yīng)用。
    的頭像 發(fā)表于 03-21 09:39 ?336次閱讀

    ServiceNowHugging FaceNVIDIA 發(fā)布全新開(kāi)放獲取 LLM,助力開(kāi)發(fā)者運(yùn)用生成 AI 構(gòu)建企業(yè)應(yīng)用

    2024 年 2 月 28 日 - ServiceNow(NYSE:NOW)、Hugging FaceNVIDIA 于今日
    發(fā)表于 02-29 11:12 ?225次閱讀
    <b class='flag-5'>ServiceNow</b>、<b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 和 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>發(fā)布</b>全新開(kāi)放獲取 LLM,<b class='flag-5'>助力</b>開(kāi)發(fā)者運(yùn)用<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>構(gòu)建</b><b class='flag-5'>企業(yè)</b>應(yīng)用

    NVIDIA 通過(guò)企業(yè)級(jí)生成 AI 微服務(wù)為聊天機(jī)器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

    微服務(wù),支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。 NVIDIA NeMo Retriever 是 NV
    的頭像 發(fā)表于 11-29 21:05 ?560次閱讀

    NVIDIA 通過(guò)企業(yè)級(jí)生成 AI 微服務(wù) 為聊天機(jī)器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

    。 ? NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個(gè)用于構(gòu)建、自定義和部署生成
    發(fā)表于 11-29 14:37 ?239次閱讀
    <b class='flag-5'>NVIDIA</b> 通過(guò)<b class='flag-5'>企業(yè)</b>級(jí)<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 微服務(wù) 為聊天機(jī)器人、<b class='flag-5'>AI</b> 助手和摘要工具帶來(lái)商業(yè)智能

    利用 NVIDIA AI Foundation Models 構(gòu)建自定義企業(yè)級(jí)生成 AI

    生成 AI 領(lǐng)域,構(gòu)建企業(yè)級(jí)大語(yǔ)言模型(LLM)需要具備采集高質(zhì)量數(shù)據(jù)、設(shè)置加速基礎(chǔ)設(shè)施和優(yōu)化模型方面的專(zhuān)業(yè)知識(shí)。 開(kāi)發(fā)者可以從預(yù)訓(xùn)練模
    的頭像 發(fā)表于 11-17 21:30 ?653次閱讀
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundation Models <b class='flag-5'>構(gòu)建</b>自定義<b class='flag-5'>企業(yè)</b>級(jí)<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成 AI Foundry 服務(wù)

    AI Enterprise 軟件進(jìn)行部署 NVIDIA 于今日推出一項(xiàng) AI foundry 服務(wù),助力企業(yè)和初創(chuàng)公司在 Microsof
    的頭像 發(fā)表于 11-16 21:15 ?464次閱讀

    NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的 生成 AI Foundry 服務(wù)

    Models、NVIDIA NeMo? 框架和工具,以及 NVIDIA DGX? 云 AI 超算服務(wù)三大要素,為企業(yè)提供創(chuàng)建自定義生成
    發(fā)表于 11-16 14:13 ?299次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Microsoft Azure 上推出面向全球<b class='flag-5'>企業(yè)</b>和初創(chuàng)公司的 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> Foundry 服務(wù)

    利用 NVIDIA Jetson 實(shí)現(xiàn)生成 AI

    近日,NVIDIA 發(fā)布了 Jetson 生成 AI 實(shí)驗(yàn)室(Jetson Generative AI
    的頭像 發(fā)表于 11-07 21:25 ?859次閱讀
    利用 <b class='flag-5'>NVIDIA</b> Jetson 實(shí)現(xiàn)<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>