0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 賦能中科深智實(shí)現(xiàn) NPC 與玩家的千人千面多模態(tài)互動(dòng)

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-07-11 23:10 ? 次閱讀

中科深智成立于 2016 年,是一家專注于端到端生成式 AI 虛擬人技術(shù)的公司,從底層自研的大語(yǔ)言模型、動(dòng)作和表情生成算法模型以及 3D 自動(dòng)建模,到 Motionverse 虛擬人業(yè)務(wù)中臺(tái),再到 3D 生成式 AI 產(chǎn)品和應(yīng)用層。中科深智除了為生態(tài)合作伙伴提供 AI 虛擬人 API 外,還開(kāi)發(fā)了一系列 3D 生成式 AI 產(chǎn)品,包括超寫實(shí)虛擬人生成系統(tǒng) Anyhuman、元宇宙電商和虛擬人直播工具百寶箱自動(dòng)播、AI 快速動(dòng)畫生成系統(tǒng)自動(dòng)畫、虛擬人實(shí)時(shí)交互和應(yīng)答系統(tǒng)云小七等。

傳統(tǒng) NPC 人機(jī)交互

生硬且成本高昂

在動(dòng)作和表情方面,傳統(tǒng) NPC 因?yàn)闊o(wú)法獲取用戶的畫面信息和語(yǔ)音信息,也就無(wú)法做出實(shí)時(shí)的反饋,動(dòng)作和語(yǔ)音的呈現(xiàn)皆靠預(yù)設(shè),所謂的人機(jī)交互其實(shí)非常的刻板和生硬。

在文字和語(yǔ)音的對(duì)話能力方面,大語(yǔ)言模型的出現(xiàn)賦予了 NPC 實(shí)時(shí)對(duì)話的能力。但無(wú)論是何種大語(yǔ)言模型的誕生,都經(jīng)歷了數(shù)據(jù)清洗、預(yù)訓(xùn)練、指令微調(diào)、測(cè)試、合規(guī)、部署和應(yīng)用接口開(kāi)發(fā)等環(huán)節(jié),這些環(huán)節(jié)此前是彼此分散的,而并非一體化的,這也意味著每?jī)蓚€(gè)環(huán)節(jié)之間都需要進(jìn)行大量的人工處理和匹配部署,這本質(zhì)上是對(duì)人力成本和時(shí)間成本的浪費(fèi),亟需一種更加省時(shí)和高效的解決方案。

NVIDIA 賦能游戲 NPC

實(shí)現(xiàn)智能化互動(dòng)

中科深智的虛擬人實(shí)時(shí)交互和應(yīng)答系統(tǒng)云小七可以支持智能 NPC 的批量化生產(chǎn),提升游戲開(kāi)發(fā)效率。云小七基于生成式 AI 的設(shè)計(jì),可以通過(guò)將 NPC 賦予如形象、聲音、性格特征、背景等特定的人設(shè)來(lái)與游戲內(nèi)容進(jìn)行有機(jī)融合。此外,云小七還能夠在不需要編寫復(fù)雜腳本的情況下,讓 NPC 與游戲玩家進(jìn)行順暢的文字、語(yǔ)音、動(dòng)作、表情等多模態(tài)的實(shí)時(shí)互動(dòng)。這將為游戲開(kāi)發(fā)商帶來(lái)更有力的支持,同時(shí)也為玩家提供更加生動(dòng)、真實(shí)的游戲體驗(yàn)。云小七的核心能力之一還包括中科深智自研實(shí)現(xiàn)的 CLAP 大模型算法,這種算法可以實(shí)現(xiàn)對(duì)于語(yǔ)音、語(yǔ)義以及外部環(huán)境輸入的實(shí)時(shí)反饋,從而輸出動(dòng)作和表情等,使得 NPC 具有更加生動(dòng)的表現(xiàn)能力。

NVIDIA Omniverse 中的 Audio2Face 可以輔助云小七實(shí)現(xiàn)音頻輸入的面部輸出,通過(guò)預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)、調(diào)整角色網(wǎng)格的 3D 頂點(diǎn)等方式,快速實(shí)現(xiàn)表情切換。通過(guò)利用 NVIDIA Maxine 對(duì)于音頻和視頻通信方面進(jìn)行優(yōu)化,即使用戶使用普通的麥克風(fēng)和攝像頭,NPC 也能監(jiān)測(cè)到他們的行為并且產(chǎn)生反饋,與玩家實(shí)現(xiàn)實(shí)時(shí)互動(dòng)。

此外,云小七底層的文字對(duì)話能力來(lái)自于中科深智今年 5 月推出的自有大語(yǔ)言模型 GenSense 數(shù)智姜尚。數(shù)智姜尚是國(guó)內(nèi)商用大模型在輕量化領(lǐng)域內(nèi)的重要嘗試,是針對(duì)垂直領(lǐng)域和虛擬人端到端應(yīng)用而專門設(shè)計(jì)的大語(yǔ)言模型,可成為虛擬人的“大腦”,為其提供實(shí)時(shí)互動(dòng)的能力支撐。數(shù)智姜尚采用了先進(jìn)的優(yōu)化技術(shù),輕巧便利且占用資源極少,可為用戶提供流暢的使用體驗(yàn)。配合 NVIDIA GPU,數(shù)智姜尚能夠以高性能運(yùn)行并展現(xiàn)出色的表現(xiàn)。其次,數(shù)智姜尚的部署和定制非常簡(jiǎn)便,可以輕松集成到現(xiàn)有的企業(yè)工作流中,為用戶提供個(gè)性化和智能化的解決方案,同時(shí)實(shí)現(xiàn)快速的模型訓(xùn)練和應(yīng)用部署。

NVIDIA NeMo 在數(shù)智姜尚的訓(xùn)練過(guò)程中提供了低門檻、經(jīng)濟(jì)、高效的幫助。

首先,NVIDIA NeMo 幫助解決了訓(xùn)練全流程的問(wèn)題,包括數(shù)據(jù)清洗、預(yù)訓(xùn)練和指令微調(diào),以及測(cè)試、合規(guī)、部署和應(yīng)用接口開(kāi)發(fā)等。在此之前,這需要多個(gè)架構(gòu)才能完成,因此極大的提高了自有模型的開(kāi)發(fā)效率。

同時(shí),NVIDIA NeMo 還提供了大量的、可應(yīng)用于多個(gè)不同場(chǎng)景的預(yù)訓(xùn)練模型。選擇 NVIDIA 已經(jīng)訓(xùn)練好的模型,能夠大幅縮短微調(diào)和再訓(xùn)練的時(shí)間,也幫助擴(kuò)充了中科深智自身大模型數(shù)智姜尚的適應(yīng)性。NeMo 本身的 ASR/TTS 也直接帶來(lái)了自然交互工具,無(wú)需借助第三方,從而加速了數(shù)智姜尚的開(kāi)發(fā)和交付。

此外,通過(guò)使用 NVIDIA 提供的 NeMo Guardrails 工具,中科深智還高效解決了對(duì)話式 AI 合規(guī)性和安全性的風(fēng)險(xiǎn)。通過(guò) NeMo Guardrails 為對(duì)話設(shè)置響應(yīng)的范圍和邊界,使數(shù)智姜尚的回答范圍僅限于適當(dāng)?shù)闹黝}并僅提供必要的信息,能夠限制 AI 只與已確認(rèn)安全的第三方應(yīng)用程序建立聯(lián)系。

NVIDIA 助力中科深智

加速AI 對(duì)話數(shù)字人建設(shè)

中科深智聯(lián)合創(chuàng)始人兼 CTO 宋健說(shuō):“中科深智是 NVIDIA 初創(chuàng)加速計(jì)劃的高級(jí)會(huì)員,通過(guò)該計(jì)劃,一方面中科深智與 NVIDIA 進(jìn)行了深入的技術(shù)合作,另外一方面也鏈接到大量外部企業(yè)資源,可以快速有效的將產(chǎn)品和需求方進(jìn)行對(duì)接。

大模型驅(qū)動(dòng)的對(duì)話式 AI 和數(shù)字人的結(jié)合引發(fā)了新一輪的商業(yè)增量,也是我們的企業(yè)客戶關(guān)注的重點(diǎn)。對(duì)話式數(shù)字人正在不同領(lǐng)域發(fā)揮著越來(lái)越大的作用,幫助企業(yè)用戶解決客戶服務(wù)等難題,提高客戶的體驗(yàn)。然而開(kāi)發(fā)和運(yùn)行可落地的語(yǔ)音人工智能服務(wù)仍然是一項(xiàng)復(fù)雜而艱巨的任務(wù),通常需要面臨實(shí)時(shí)性、可理解性、自然性、低資源、魯棒性等挑戰(zhàn)。在 NVIDIA 初創(chuàng)加速計(jì)劃的支持之下,我們深入了解并且成功應(yīng)用了 NVIDIA 各項(xiàng)最新技術(shù)和工具,包括 NVIDIA Nemo,NVIDIA Omniverse 等等,切實(shí)幫助我們加速了 AI 對(duì)話數(shù)字人的建設(shè)?!?/span>

NVIDIA 初創(chuàng)加速計(jì)劃

中科深智是 NVIDIA 初創(chuàng)加速計(jì)劃 (NVIDIA Inception) 會(huì)員企業(yè)。NVIDIA 初創(chuàng)加速計(jì)劃為免費(fèi)會(huì)員制,旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計(jì)劃聯(lián)合國(guó)內(nèi)外知名的風(fēng)投機(jī)構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場(chǎng)宣傳,融資對(duì)接,業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。

想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫意向申請(qǐng)表單,獲得快速聯(lián)系。

66502e82-1ffc-11ee-962d-dac502259ad0.png


原文標(biāo)題:NVIDIA 賦能中科深智實(shí)現(xiàn) NPC 與玩家的千人千面多模態(tài)互動(dòng)

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3683

    瀏覽量

    90487

原文標(biāo)題:NVIDIA 賦能中科深智實(shí)現(xiàn) NPC 與玩家的千人千面多模態(tài)互動(dòng)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    覺(jué)機(jī)器完成數(shù)千萬(wàn)元天使輪融資

    近日,模態(tài)觸覺(jué)感知傳感器公司覺(jué)機(jī)器(Xense Robotics)成功完成了數(shù)千萬(wàn)元人民幣的天使輪融資。本輪融資由高瓴創(chuàng)投(GL Ventures)領(lǐng)投,交大菡源基金等投資方跟投
    的頭像 發(fā)表于 10-14 16:02 ?175次閱讀

    Meta發(fā)布模態(tài)LLAMA 3.2工智能模型

    Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破,成功推出了模態(tài)LLAMA 3.2工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實(shí)現(xiàn)了對(duì)圖像內(nèi)容的精準(zhǔn)理解,標(biāo)志著Met
    的頭像 發(fā)表于 09-27 11:44 ?308次閱讀

    愛(ài)普生有源晶體振蕩器SG3225EEN應(yīng)用于儲(chǔ)NPC、新能源

    儲(chǔ)NPC通常指的是在儲(chǔ)系統(tǒng)中使用的NPC(Neutral Point Clamped)三電平逆變器。NPC三電平逆變器是一種
    發(fā)表于 09-10 10:47 ?1次下載

    突發(fā)!英特爾或?qū)⒉脝T數(shù)千人,削減成本計(jì)劃曝光!

    面對(duì)競(jìng)爭(zhēng)激烈的市場(chǎng),行業(yè)巨頭也難逃“窘境”。 7月31日,據(jù)美國(guó)彭博社報(bào)道:半導(dǎo)體巨頭英特爾公司或?qū)?dòng)新一輪大規(guī)模裁員行動(dòng)。這場(chǎng)裁員風(fēng)暴預(yù)計(jì)在本周內(nèi)正式拉開(kāi)帷幕,具體人數(shù)尚未明確,可能達(dá)到數(shù)千人
    的頭像 發(fā)表于 08-05 10:57 ?254次閱讀
    突發(fā)!英特爾或?qū)⒉脝T數(shù)<b class='flag-5'>千人</b>,削減成本計(jì)劃曝光!

    英特爾將裁員數(shù)千人 降本增效

    裁員、降本增效似乎總在不經(jīng)意間就來(lái)臨,為節(jié)約成本、應(yīng)對(duì)盈利下滑和市場(chǎng)份額下降;英特爾或?qū)⒉脝T數(shù)千人。 據(jù)彭博社31日?qǐng)?bào)道,英特爾的裁員計(jì)劃最早可能會(huì)在本周宣布。目前英特爾公司大約有11萬(wàn)名員工;裁員
    的頭像 發(fā)表于 07-31 18:10 ?1100次閱讀

    薩科微Slkor參與大佳源第八屆千人峰會(huì) 宋仕強(qiáng)總經(jīng)理出席并發(fā)表主旨演講

    主辦、薩科微Slkor半導(dǎo)體等多家單位協(xié)辦,以“數(shù)字經(jīng)濟(jì)新質(zhì)生產(chǎn)力”為主題的「2024電子產(chǎn)業(yè)鏈第八屆千人峰會(huì)」在深圳寶立方酒店四樓多功能廳隆重舉辦;同時(shí)舉辦的還有
    的頭像 發(fā)表于 05-24 08:12 ?318次閱讀
    薩科微Slkor參與大佳源第八屆<b class='flag-5'>千人</b>峰會(huì)  宋仕強(qiáng)總經(jīng)理出席并發(fā)表主旨演講

    視機(jī)架式編解碼器:引領(lǐng) AV over IP 行業(yè)新風(fēng)向

    “交鑰匙”的簡(jiǎn)化方案?視給出的答案是:在活動(dòng)會(huì)場(chǎng)布置一套機(jī)架式編解碼器-即可實(shí)現(xiàn)一對(duì)/對(duì)一傳輸、多畫面監(jiān)看/互動(dòng)以及跨互聯(lián)網(wǎng)制作/管理
    的頭像 發(fā)表于 03-23 08:07 ?888次閱讀
    <b class='flag-5'>千</b>視機(jī)架式編解碼器:引領(lǐng) AV over IP 行業(yè)新風(fēng)向

    裁員潮仍在繼續(xù) 諾基亞將在印度裁員約250 谷歌將再裁員數(shù)千人

    裁員潮仍在繼續(xù) 諾基亞將在印度裁員約250 谷歌將再裁員數(shù)千人 盡管時(shí)間已經(jīng)進(jìn)入到2024年但是似乎科技巨頭們的大規(guī)模裁員潮仍在繼續(xù)!已經(jīng)看到外媒有報(bào)道諾基亞將在印度裁員約250;此外巨頭谷歌將
    的頭像 發(fā)表于 02-21 11:30 ?1476次閱讀

    思科計(jì)劃裁員5%,達(dá)數(shù)千人

    2月14日,思科(Cisco)宣布最新一季財(cái)報(bào),同時(shí)表示,作為全公司重組的一部分,計(jì)劃裁員5%,達(dá)數(shù)千人。主要原因是客戶仍處「去庫(kù)存」階段,導(dǎo)致思科保守看待營(yíng)運(yùn)展望。
    的頭像 發(fā)表于 02-19 14:43 ?819次閱讀

    拓維信息2024全國(guó)研發(fā)人才千人招聘計(jì)劃正式發(fā)布

    2月7日下午,拓維信息2024全國(guó)研發(fā)人才千人招聘計(jì)劃啟動(dòng)儀式,以現(xiàn)場(chǎng)直播的方式在長(zhǎng)沙盛大舉行。在中國(guó)科技創(chuàng)新由跟隨轉(zhuǎn)向并行、乃至領(lǐng)跑的關(guān)鍵當(dāng)口,拓維信息作為一家長(zhǎng)期深耕IT國(guó)產(chǎn)化的上市科技企業(yè)
    的頭像 發(fā)表于 02-19 14:02 ?306次閱讀
    拓維信息2024全國(guó)研發(fā)人才<b class='flag-5'>千人</b>招聘計(jì)劃正式發(fā)布

    機(jī)器基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型

    ByteDance Research 基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?324次閱讀
    機(jī)器<b class='flag-5'>人</b>基于開(kāi)源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語(yǔ)言視覺(jué)大模型

    鴻蒙帆起】《開(kāi)心消消樂(lè)》完成鴻蒙原生應(yīng)用開(kāi)發(fā),創(chuàng)新多端聯(lián)動(dòng)用戶體驗(yàn)

    技術(shù)還為用戶打造出創(chuàng)新的分布式游戲玩法。通過(guò)與 HarmonyOS 分布式有機(jī)結(jié)合,可實(shí)現(xiàn)設(shè)備協(xié)同的分布式 PK 場(chǎng)景。在此場(chǎng)景下,用戶操作各自的 HarmonyOS 設(shè)備,使用智慧屏實(shí)時(shí)顯示對(duì)戰(zhàn)
    發(fā)表于 01-03 10:22

    大模型+模態(tài)的3種實(shí)現(xiàn)方法

    我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢(shì)是不支持其他模態(tài)(包括圖像、語(yǔ)音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強(qiáng)大、更通用呢?本節(jié)將介紹“大模型+
    的頭像 發(fā)表于 12-13 13:55 ?1530次閱讀
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種<b class='flag-5'>實(shí)現(xiàn)</b>方法

    求助,關(guān)于ADuCM360與AD7903使用官網(wǎng)例程問(wèn)題

    主控:千人360傳感器:ad7903程序?yàn)楣倬W(wǎng)例程 鏈模式波形圖如下所示(其中,黃色為sccx( sckx),藍(lán)色為cnvx , cnvx , cnvx , cnvx , cnvx , cnvx
    發(fā)表于 12-05 07:29

    方科技亮相云棲大會(huì),大模型方云警”重磅升級(jí)

    10月31日至11月2日,2023云棲大會(huì)盛大召開(kāi),方科技受邀出席,并分享了方將大模型應(yīng)用于交通行業(yè)的最新成果。 大模型作為本輪AI浪潮的核心技術(shù),正引發(fā)行百業(yè)新一輪的生產(chǎn)和服務(wù)方式變革。對(duì)于
    的頭像 發(fā)表于 11-01 16:31 ?479次閱讀
    <b class='flag-5'>千</b>方科技亮相云棲大會(huì),大模型<b class='flag-5'>賦</b><b class='flag-5'>能</b>“<b class='flag-5'>千</b>方云警”重磅升級(jí)