0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高性能計(jì)算與深度學(xué)習(xí)技術(shù)下的AIGC如何引領(lǐng)人工智能與全球化的發(fā)展?

GPU視覺(jué)識(shí)別 ? 來(lái)源:GPU視覺(jué)識(shí)別 ? 作者:GPU視覺(jué)識(shí)別 ? 2023-03-31 16:33 ? 次閱讀

人工智能 | 深度學(xué)習(xí) |GPT-4

文心一言 | 機(jī)器學(xué)習(xí) | ChatGPT

隨著科技的不斷發(fā)展,人工智能技術(shù)已經(jīng)成為了當(dāng)今社會(huì)的熱門(mén)話題。人工智能技術(shù)的應(yīng)用范圍越來(lái)越廣泛,不僅在工業(yè)、醫(yī)療、金融等領(lǐng)域得到了廣泛應(yīng)用,而且在人們的日常生活中也越來(lái)越常見(jiàn)。在這個(gè)人工智能時(shí)代,人們對(duì)于人工智能技術(shù)的發(fā)展和應(yīng)用也越來(lái)越關(guān)注。而在這個(gè)時(shí)代,AIGC成為了人工智能時(shí)代的新引擎。

AIGC即AI Generated Content,是指利用人工智能技術(shù)來(lái)生成內(nèi)容,AIGC也被認(rèn)為是繼UGC、PGC之后的新型內(nèi)容生產(chǎn)方式,AI繪畫(huà)、AI寫(xiě)作等都屬于AIGC的分支。AIGC的投資領(lǐng)域主要包括人工智能、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域。這些領(lǐng)域都是人工智能技術(shù)的核心領(lǐng)域,也是未來(lái)人工智能技術(shù)發(fā)展的重要方向。在這些領(lǐng)域,AIGC已經(jīng)投資了多家創(chuàng)新企業(yè),并且取得了不俗的成績(jī)。這些企業(yè)涉及的領(lǐng)域包括智能制造、智能醫(yī)療、智能金融、智能交通等,都是人工智能技術(shù)應(yīng)用的典型案例。

AIGC的投資理念是“投資未來(lái),引領(lǐng)變革”。這個(gè)理念體現(xiàn)了AIGC對(duì)于人工智能技術(shù)的信心和追求。在AIGC看來(lái),人工智能技術(shù)是未來(lái)的引擎,可以推動(dòng)社會(huì)的進(jìn)步和發(fā)展。而AIGC作為人工智能領(lǐng)域的投資機(jī)構(gòu),希望通過(guò)投資和支持創(chuàng)新企業(yè),引領(lǐng)人工智能技術(shù)的變革和發(fā)展。

在人工智能時(shí)代,AIGC成為了人工智能技術(shù)的新引擎。通過(guò)投資和支持創(chuàng)新企業(yè),AIGC推動(dòng)了人工智能技術(shù)的發(fā)展和應(yīng)用,為人工智能時(shí)代的到來(lái)做出了貢獻(xiàn)。未來(lái),AIGC將繼續(xù)堅(jiān)持“投資未來(lái),引領(lǐng)變革”的理念,為人工智能技術(shù)的發(fā)展和應(yīng)用不斷注入新的動(dòng)力。本文將從AIGC的角度,探討人工智能時(shí)代的新引擎。

從上網(wǎng)到上算

網(wǎng)絡(luò)世界至虛擬現(xiàn)實(shí)

隨著服務(wù)器和網(wǎng)絡(luò)的發(fā)展,人人都可以“上網(wǎng)”,而算力和算法的進(jìn)步將開(kāi)啟人人“上算”的時(shí)代。人工智能將以場(chǎng)景、應(yīng)用和內(nèi)容來(lái)創(chuàng)造用戶的新需求,而元宇宙則將包含現(xiàn)實(shí)物理世界,成就真正的虛擬現(xiàn)實(shí)。在這個(gè)背景下,我們建立了一個(gè)研究框架,其中包含四層嵌套關(guān)系。首先,人工智能和虛擬現(xiàn)實(shí)都屬于技術(shù)層面。其次,人形機(jī)器人/腦機(jī)接口和元宇宙分別代表了智能最終實(shí)現(xiàn)的兩種技術(shù)路徑——混合平臺(tái)和重構(gòu)時(shí)空。人形機(jī)器人和腦機(jī)接口是混合平臺(tái)這一路徑上的不同工程方案,以機(jī)器和人為載體去構(gòu)建混合平臺(tái)。第三,相較于人形機(jī)器人和腦機(jī)接口,元宇宙是智能真正實(shí)現(xiàn)的內(nèi)在部分。最后,元宇宙的建設(shè)過(guò)程是上半場(chǎng),而囊括現(xiàn)實(shí)物理世界的過(guò)程則是下半場(chǎng),最終實(shí)現(xiàn)虛擬現(xiàn)實(shí)。

AIGC將成為Web3.0/元宇宙時(shí)代的內(nèi)容供給范式之一。目前ChatGPT、AI繪畫(huà)均為AIGC的應(yīng)用范疇。隨著Web3.0/元宇宙時(shí)代內(nèi)容的快速增長(zhǎng),依靠PGC/UGC的供給有限,低成本高效率的AIGC將成為重要的內(nèi)容供給方式之一。當(dāng)前ChatGPT、AI繪畫(huà)的突出表現(xiàn)打開(kāi)了人們對(duì)于AI生成式內(nèi)容的想象空間,我們推演,AIGC的終極是以內(nèi)核為AI,依場(chǎng)景需求借助一定的硬件形態(tài)呈現(xiàn)出來(lái)的垂類硬件,如特斯拉推出的人形機(jī)器人等。AIGC或?qū)⑾破鹦乱惠啴a(chǎn)業(yè)浪潮,沖擊原有競(jìng)爭(zhēng)格局與商業(yè)模式。

AIGC具有廣泛的應(yīng)用場(chǎng)景,以ChatGPT為代表,其在代碼生成、糾正語(yǔ)法生成文本等方面表現(xiàn)出極強(qiáng)的能力,并憑借“對(duì)話式”搜索的強(qiáng)交互模式對(duì)現(xiàn)有的搜索引擎造成了較強(qiáng)的沖擊,并影響了現(xiàn)有戰(zhàn)略布局。谷歌內(nèi)部拉響了紅色警報(bào),微軟將ChatGPT整合入Bing搜索,擬重塑現(xiàn)有業(yè)務(wù)體系。在此基礎(chǔ)上,ChatGPT試點(diǎn)訂閱制付費(fèi)模式,將打破原有競(jìng)價(jià)搜索廣告的商業(yè)模式,具有巨大的商業(yè)化潛力,同時(shí)也為AI行業(yè)的商業(yè)化路徑做出了更多模式的探索。

生成式 AI 商業(yè)化應(yīng)用新篇章

一、AIGC 成本大幅下降,人工智能商業(yè)化進(jìn)程拐點(diǎn)已現(xiàn)

我們認(rèn)為以 ChatGPT 為代表的 AIGC 興起,在內(nèi)容創(chuàng)作成本、創(chuàng)作效率、模型計(jì)算消耗、用戶流量基礎(chǔ)等維度實(shí)現(xiàn)了重大突破,有望推動(dòng) AI 商業(yè)化進(jìn)程的大幅加速。

1、AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短,相較傳統(tǒng)方式優(yōu)勢(shì)顯著

目前 OpenAI 定價(jià)最高的文字模型達(dá)芬奇(基于 GPT-3)為每 750 詞約 0.02 美元(折合約 0.14 元人民幣),相較傳統(tǒng)方式優(yōu)勢(shì)顯著。在圖像生成領(lǐng)域,Open AI 透露其 DALL-E2 模型的圖片智能編輯及生成服務(wù)的價(jià)格,超過(guò)免費(fèi)額度數(shù)量的圖片收費(fèi)為每 460 張圖片 15 美元,折合每張圖片約 0.22 元人民幣。AIGC 繪畫(huà)創(chuàng)作平均耗時(shí)已達(dá)到分秒級(jí),創(chuàng)作效率較人工優(yōu)勢(shì)明顯。

2、AIGC 模型算力消耗快速下降,落地門(mén)檻降低有望驅(qū)動(dòng)消費(fèi)級(jí)應(yīng)用出現(xiàn)

借助最新的 Colossal-AI 通用深度學(xué)習(xí)系統(tǒng),AIGC 領(lǐng)域的 Stable Diffusion 模型訓(xùn)練過(guò)程中可最高節(jié)省約 5.6 倍的顯存需求(從 64.5GB 大幅降低到 11.6GB),未來(lái)有望采用消費(fèi)級(jí) GTX 3060 顯卡實(shí)現(xiàn)模型運(yùn)算功能,大幅降低 AI 商業(yè)化應(yīng)用的落地門(mén)檻。

3、爆款應(yīng)用快速積累用戶流量,商業(yè)化條件已基本具備

ChatGPT 發(fā)布后日活用戶數(shù)量快速突破千萬(wàn),使用者數(shù)量的爆炸式成長(zhǎng)即反應(yīng)出用戶的嘗試使用意愿強(qiáng)烈,未來(lái)嵌入到微軟的業(yè)務(wù)生態(tài)中也有望提升用戶的工作效率,優(yōu)化使用體驗(yàn),創(chuàng)造更大的商業(yè)價(jià)值。

4、國(guó)內(nèi)外公司持續(xù)探索商業(yè)化路徑,AIGC 生態(tài)有望加速形成

近日,OpenAI 推出 ChatGPT 付費(fèi)訂閱版 ChatGPT Plus,每月收費(fèi) 20 美元,而包含 Synthesia、Jasper、runway 等 AIGC 初創(chuàng)公司相繼推出細(xì)分領(lǐng)域的收費(fèi)服務(wù),未來(lái) AIGC 產(chǎn)業(yè)生態(tài)有望加速構(gòu)建,并形成更加清晰的 AI 商業(yè)化應(yīng)用路徑。

pYYBAGQmmqyAeElpAADrKmPRlqM833.png

Jasper 文本寫(xiě)作功能收費(fèi)模式

二、應(yīng)用場(chǎng)景豐富,AI 商業(yè)化空間前景廣闊,建議關(guān)注三條投資主線

AIGC正在推動(dòng)人工智能商業(yè)化進(jìn)程的加速,這有望打開(kāi)千億市場(chǎng)。根據(jù)德勤的數(shù)據(jù)顯示,到2021年,中國(guó)的人工智能市場(chǎng)規(guī)模已經(jīng)達(dá)到了2058億元,預(yù)計(jì)到2025年,這個(gè)市場(chǎng)規(guī)模將會(huì)達(dá)到5460億元,年復(fù)合增長(zhǎng)率約為27.63%。

poYBAGQmmq2AbJA7AADBv7bhGhE529.png

中國(guó)人工智能市場(chǎng)規(guī)模及增速(單位:億元)

根據(jù)德勤的預(yù)測(cè),全球人工智能產(chǎn)業(yè)規(guī)模預(yù)計(jì)將從2017年的6900億美元增長(zhǎng)至2025年的6.4萬(wàn)億美元,復(fù)合增長(zhǎng)率達(dá)到32.10%。這一預(yù)測(cè)得益于移動(dòng)互聯(lián)網(wǎng)時(shí)代帶來(lái)的海量數(shù)據(jù)、模型和算力的不斷迭代,以及各類應(yīng)用場(chǎng)景中的商業(yè)化嘗試,這些因素為人工智能的商業(yè)化奠定了堅(jiān)實(shí)的基礎(chǔ)。未來(lái),人工智能產(chǎn)業(yè)動(dòng)能有望加速釋放,從而推動(dòng)人工智能產(chǎn)業(yè)的快速發(fā)展。

poYBAGQmmq2AK052AACkODND8WM409.png

全球人工智能產(chǎn)業(yè)規(guī)模發(fā)展趨勢(shì)(單位:億美元)

根據(jù)《20220-2023 中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》,人工智能商業(yè)化進(jìn)程有望加速,未來(lái)隨著自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、AIGC 等細(xì)分技術(shù)的持續(xù)迭代,AI 應(yīng)用將呈現(xiàn)場(chǎng)景應(yīng)用深度和廣度并行發(fā)展態(tài)勢(shì)。特別是以 AIGC 為代表的生成式 AI 將在創(chuàng)作型工作(文本、圖像視頻創(chuàng)作)和預(yù)測(cè)、決策型工作中扮演更加重要角色。

pYYBAGQmmq6ALjY0AAJBvGQ0KuI229.png

人工智能應(yīng)用場(chǎng)景發(fā)展

三、AIGC 應(yīng)用有望從 B 端延伸至 C 端市場(chǎng),空間廣闊規(guī)模超兩千億

根據(jù)Gartner《2021年預(yù)測(cè):人工智能對(duì)人類和社會(huì)的影響》,到2025年AIGC產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。因此,我們對(duì)標(biāo)海外AIGC廠商,如Jasper.AI、Stability.AI等公司的商業(yè)模式,測(cè)算國(guó)內(nèi)2023年、2025年和2030年AIGC市場(chǎng)空間,發(fā)現(xiàn)市場(chǎng)空間超過(guò)兩千億。預(yù)計(jì)到2025年國(guó)內(nèi)AIGC市場(chǎng)空間可達(dá)403.52億元,到2030年市場(chǎng)空間可達(dá)2175.58億元,未來(lái)幾年市場(chǎng)有望迎來(lái)爆發(fā)式成長(zhǎng)。

在AIGC領(lǐng)域,文字、圖片滲透率有望快速提升,但視頻、直播等受限于技術(shù)迭代滲透率較慢。目前AI在文本和圖像生成領(lǐng)域技術(shù)已相對(duì)成熟,同時(shí)微軟、百度等科技大廠有望將AI技術(shù)應(yīng)用到業(yè)務(wù)生態(tài)中,有望推動(dòng)在線辦公、搜索引擎等應(yīng)用場(chǎng)景的滲透率提升。然而,在直播、影視以及音視頻等領(lǐng)域,由于AI生成技術(shù)處于初級(jí)階段,且下游用戶對(duì)內(nèi)容要求較高,我們認(rèn)為短期內(nèi)滲透率提升幅度較低。

poYBAGQmmq6ATlWJAAJwjuzFQKQ819.png

AIGC 國(guó)內(nèi)理論市場(chǎng)空間測(cè)算

四、ChatGPT 面世即成頂流,性能持續(xù)提升商業(yè)化價(jià)值不斷放大

OpenAI 在 2022 年 11 月 30 日發(fā)布了 ChatGPT,這是一款對(duì)話式 AI 新模型,能夠進(jìn)行人機(jī)交互的問(wèn)題回答、文本寫(xiě)作以及代碼編寫(xiě)等功能。該模型使用了 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu),并通過(guò)維基百科以及大量真實(shí)語(yǔ)料庫(kù)的數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)了接近人類的交流水平。ChatGPT 的出現(xiàn)標(biāo)志著生成式 AI 領(lǐng)域的突破性進(jìn)展,也讓 ChatGPT 成為了一個(gè)備受關(guān)注的話題。

pYYBAGQmmq-AXRJFAAH-Gu84wfc483.png

ChatGPT 實(shí)現(xiàn)交互問(wèn)答

ChatGPT是一種具備自我學(xué)習(xí)能力的人工智能模型,自面世以來(lái),其性能不斷得到提升。在2023年1月30日,OpenAI官方宣布,ChatGPT通過(guò)新一輪的更新,其準(zhǔn)確性和真實(shí)性得到了顯著提升,并且已經(jīng)具備了比較基礎(chǔ)的數(shù)學(xué)計(jì)算能力。經(jīng)過(guò)使用者的測(cè)試,目前ChatGPT的數(shù)學(xué)計(jì)算能力接近小學(xué)生水平,雖然相較其代碼和文本寫(xiě)作相比差距甚遠(yuǎn),但進(jìn)步非常明顯。ChatGPT在數(shù)學(xué)領(lǐng)域的計(jì)算能力逐漸形成,反映出模型的自我學(xué)習(xí)能力以及模型遷移能力出色。

poYBAGQmmq-AOKLAAAHuPaiTRpo667.png

ChatGPT 日活用戶數(shù)爆發(fā)式增長(zhǎng)

微軟計(jì)劃推出一系列基于人工智能技術(shù)的應(yīng)用服務(wù),其中ChatGPT有望在實(shí)際應(yīng)用中持續(xù)成長(zhǎng)。據(jù)悉,OpenAI公司于2023年2月2日宣布推出付費(fèi)試點(diǎn)訂閱計(jì)劃ChatGPT Plus,每月定價(jià)為20美元。該付費(fèi)版功能包括高峰時(shí)段免排隊(duì)、快速響應(yīng)以及優(yōu)先獲得新功能和改進(jìn)等。同時(shí),OpenAI方面仍將提供對(duì)ChatGPT的免費(fèi)訪問(wèn)權(quán)限。

此外,微軟還推出了集成ChatGPT的全新Bing搜索服務(wù)和集成AI輔助的Edge瀏覽器。新版Bing帶有一個(gè)擴(kuò)展的聊天框,它現(xiàn)在不僅可以回答事實(shí)問(wèn)題和為用戶提供各種鏈接,還可以在ChatGPT的幫助下為用戶即時(shí)生成各種個(gè)性化的規(guī)劃、建議、分析等,解決更復(fù)雜的搜索問(wèn)題。

pYYBAGQmmrCAatIBAARzFNBu-xI159.png

微軟新版搜索引擎可根據(jù)問(wèn)題內(nèi)容提供完整解答及方案建議

五、ChatGPT 以 GPT+RLHF 模型為核心支撐,為 AIGC 發(fā)展指明方向

ChatGPT結(jié)合海量訓(xùn)練數(shù)據(jù)和Transformer框架,通過(guò)RLHF模型提升交互聊天能力,實(shí)現(xiàn)了對(duì)自然語(yǔ)言的深度建模。Transformer架構(gòu)為自然語(yǔ)言理解領(lǐng)域帶來(lái)顛覆性變革,應(yīng)用到NLP、CV、生物、化學(xué)等多領(lǐng)域。谷歌在2017年提出了完全基于Self-Attention機(jī)制的Transformer架構(gòu),取得了機(jī)器翻譯任務(wù)上的顛覆性進(jìn)步。Transformer由編碼器和解碼器組成,各自由若干個(gè)編碼/解碼模塊堆疊而成,每個(gè)模塊包含Multi-Head Attention層、全連接層等功能不同的工作層。相比于之前的框架,Transformer架構(gòu)除了在計(jì)算的時(shí)間復(fù)雜度更優(yōu)外,還有3大優(yōu)勢(shì):

1、可直接計(jì)算點(diǎn)乘結(jié)果,并行度高:對(duì)于數(shù)據(jù)序列 x1,x2……xn ,self-attention 可 以直接計(jì)算任意兩節(jié)點(diǎn)的點(diǎn)乘結(jié)果,而 RNN 必須按照順序從 x1 計(jì)算到 xn。

2、一步計(jì)算,解決長(zhǎng)時(shí)依賴問(wèn)題:處理序列信息使,通常用要經(jīng)過(guò)的路徑長(zhǎng)度衡量 性能,CNN 需要增加卷積層數(shù)來(lái)擴(kuò)大視野,RNN 只能逐個(gè)進(jìn)行計(jì)算,而 self-attention 只需 要一步矩陣計(jì)算就可以,更好地解決長(zhǎng)時(shí)依賴問(wèn)題。

3、模型更可解釋:self-attention 模型更可解釋,attention 結(jié)果的分布可反映該模型 學(xué)習(xí)到了一些語(yǔ)法和語(yǔ)義信息。

pYYBAGQmmrGAapF0AAKzlEhUbhg668.png

Transformer 核心框架

RHFL模型是一種預(yù)訓(xùn)練語(yǔ)言模型,通過(guò)人類反饋進(jìn)一步微調(diào)以符合人類偏好,從而直接優(yōu)化模型。Open AI采用了RHFL作為ChatGPT的核心訓(xùn)練方式,稱其為“能有效提升通用人工智能系統(tǒng)與人類意圖對(duì)齊的技術(shù)”。RHFL的訓(xùn)練包括三個(gè)核心步驟:首先進(jìn)行預(yù)訓(xùn)練語(yǔ)言模型,然后對(duì)模型根據(jù)提示生成的文本進(jìn)行質(zhì)量標(biāo)注,由人工標(biāo)注者按偏好從最佳到最差進(jìn)行排名,利用標(biāo)注文本訓(xùn)練獎(jiǎng)勵(lì)模型,從而學(xué)習(xí)到了人類對(duì)于模型根據(jù)給定提示生成的文本序列的偏好性。最后,使用強(qiáng)化學(xué)習(xí)進(jìn)行微調(diào),確保模型輸出合理連貫的文本片段,并且基于獎(jiǎng)勵(lì)模型對(duì)模型輸出的評(píng)估分?jǐn)?shù)提升文本的生成質(zhì)量。

pYYBAGQmmrGAUCNSAAM08uejGTA411.png

RHFL 模型核心框架

推理-知識(shí)-學(xué)習(xí)-創(chuàng)造

AIGC重塑人工智能未來(lái)

一、復(fù)盤(pán)三次人工智能浪潮,AI 從科研向細(xì)分產(chǎn)業(yè)生態(tài)加速滲透

人工智能技術(shù)的發(fā)展可以被分為三次浪潮,每次浪潮都有其獨(dú)特的特點(diǎn)和發(fā)展趨勢(shì)。隨著AIGC的崛起,我們有望迎來(lái)第四次人工智能浪潮。

第一次浪潮主要集中在20世紀(jì)50年代至70年代,其核心是推理能力的形成。在這個(gè)時(shí)期,人工智能技術(shù)主要依靠符號(hào)邏輯和規(guī)則系統(tǒng)來(lái)實(shí)現(xiàn)推理和決策。然而,這種方法的局限性在于它需要大量的手動(dòng)編程和規(guī)則制定,難以應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)問(wèn)題。

第二次浪潮主要發(fā)生在20世紀(jì)80年代至90年代,其核心是知識(shí)儲(chǔ)備的建立。在這個(gè)時(shí)期,人工智能技術(shù)開(kāi)始利用專家系統(tǒng)和知識(shí)圖譜等方法來(lái)構(gòu)建知識(shí)庫(kù),以便更好地處理復(fù)雜的問(wèn)題。然而,這種方法的局限性在于它需要大量的人工干預(yù)和知識(shí)輸入,難以應(yīng)對(duì)大規(guī)模的數(shù)據(jù)和變化。

第三次浪潮主要發(fā)生在21世紀(jì)初至今,其核心是自我學(xué)習(xí)能力的提升。在這個(gè)時(shí)期,人工智能技術(shù)開(kāi)始利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法來(lái)實(shí)現(xiàn)自我學(xué)習(xí)和優(yōu)化,以便更好地處理大規(guī)模的數(shù)據(jù)和復(fù)雜的問(wèn)題。然而,這種方法的局限性在于它需要大量的數(shù)據(jù)和計(jì)算資源,難以應(yīng)對(duì)數(shù)據(jù)隱私和安全等問(wèn)題。

未來(lái),我們有望進(jìn)入到自我創(chuàng)造的階段,即第四次人工智能浪潮。在這個(gè)階段,人工智能技術(shù)將能夠自主地生成新的知識(shí)和創(chuàng)造性的解決方案,從而實(shí)現(xiàn)真正的智能化。AIGC作為一家領(lǐng)先的人工智能公司,有望引領(lǐng)這一浪潮的發(fā)展,并為人類帶來(lái)更多的創(chuàng)新和進(jìn)步。

poYBAGQmmrKARCFMAAPLymG4HTg501.png

歷次人工智能浪潮及代表性成就梳理

1、第一次 AI 浪潮,對(duì)人類神經(jīng)元機(jī)制的模擬實(shí)現(xiàn)機(jī)器推理能力

計(jì)算機(jī)的誕生催生了學(xué)術(shù)界對(duì)人工智能的大規(guī)模探索,第一次 AI 浪潮來(lái)襲。1946 年第一代電子計(jì)算機(jī)誕生,這一階段馮·諾依曼結(jié)構(gòu)為現(xiàn)代計(jì)算機(jī)的體系架構(gòu)奠定了基礎(chǔ),而圖靈機(jī)的思想則論證了現(xiàn)代計(jì)算機(jī)的計(jì)算模式和計(jì)算能力,開(kāi)啟了人類在現(xiàn)代人工智能領(lǐng)域不斷探索的旅程。馮·諾依曼模擬了人類大腦記憶存儲(chǔ)與提取的工作機(jī)制,為計(jì)算機(jī)和人工智能奠定了堅(jiān)實(shí)基礎(chǔ)。

上世紀(jì) 40 年代,馮·諾依曼提出了計(jì)算機(jī)的邏輯結(jié)構(gòu),其主要特點(diǎn)包括程序以二進(jìn)制代碼存放在存儲(chǔ)器中、所有指令由操作碼和地址碼組成、指令在存儲(chǔ)過(guò)程中按照?qǐng)?zhí)行順序進(jìn)行存儲(chǔ)等。馮·諾依曼結(jié)構(gòu)將人類的神經(jīng)系統(tǒng)與計(jì)算機(jī)結(jié)合在一起,大幅提升了計(jì)算機(jī)的運(yùn)算效率,為人工智能的發(fā)展提供了保障。

pYYBAGQmmrOAalYVAACCrXQUHcY944.png

馮·諾依曼結(jié)構(gòu)模擬人類記憶存儲(chǔ)的模式

Rosenblatts受生物神經(jīng)網(wǎng)絡(luò)啟發(fā),提出了一種人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這成為了現(xiàn)代神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的重要基礎(chǔ)。感知機(jī)的工作原理可以理解為生物神經(jīng)網(wǎng)絡(luò)中的信號(hào)作用。信號(hào)經(jīng)過(guò)樹(shù)突傳遞到細(xì)胞核的過(guò)程中,信號(hào)會(huì)發(fā)生變化。感知機(jī)模型在模型的“輸入”位置添加神經(jīng)元節(jié)點(diǎn),構(gòu)成“輸入單元”。它會(huì)為每一個(gè)屬性指定一個(gè)權(quán)重w,對(duì)屬性值和權(quán)重的乘積求和,將結(jié)果值與閾值比較,從而判定正負(fù)樣本結(jié)果。然而,由于感知機(jī)模型只能解決線性問(wèn)題,面對(duì)異或問(wèn)題時(shí)無(wú)能為力。這也導(dǎo)致了第一次人工智能研究在上世紀(jì)70年代進(jìn)入低潮期。

poYBAGQmmrOARur7AADTa7jd3p8948.png

Rosenblatt 感知機(jī)模型

2、第二次 AI 浪潮,人工智能擁有知識(shí)儲(chǔ)備,專家系統(tǒng)為代表性產(chǎn)物

在20世紀(jì)80年代,第二次人工智能浪潮到來(lái),其核心發(fā)展為讓計(jì)算機(jī)學(xué)習(xí)大量專業(yè)知識(shí)。研究人員將專家的知識(shí)、言論以及經(jīng)驗(yàn)等數(shù)據(jù)輸入到計(jì)算機(jī),使其成為專家系統(tǒng)。專家系統(tǒng)可以預(yù)測(cè)在一定條件下某種解的概率。由于當(dāng)時(shí)計(jì)算機(jī)已有巨大容量,專家系統(tǒng)有可能從數(shù)據(jù)中得出規(guī)律。

在這一階段,多層感知機(jī)、反向傳播算法、神經(jīng)網(wǎng)絡(luò)的出現(xiàn)極大程度地提升了計(jì)算機(jī)的計(jì)算及邏輯推理能力,為深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)模型奠定了重要基礎(chǔ)。同時(shí),專家系統(tǒng)的出現(xiàn)賦予了人工智能知識(shí)屬性,并進(jìn)行了一系列的商用嘗試。多層感知機(jī)強(qiáng)調(diào)模擬人類腦神經(jīng)的復(fù)雜連接,使人工智能實(shí)現(xiàn)解決非線性問(wèn)題的處理能力。多層感知機(jī)可至少分成輸入層、隱藏層和輸出層這三層,隱藏層可根據(jù)需要建多層且每層都可以有多個(gè)節(jié)點(diǎn),相鄰層的各個(gè)節(jié)點(diǎn)都互相連接。隱藏層和輸出層具備計(jì)算加權(quán)和激活函數(shù)處理的功能,實(shí)現(xiàn)數(shù)據(jù)信息的向前傳遞和分析。

poYBAGQmmrSAVYo-AAF7CifHqyc604.png

多層感知機(jī)(MLP)模型

多層感知機(jī)的突破在于使用激活函數(shù),它可以在隱藏層中使用不同的激活函數(shù)來(lái)對(duì)數(shù)據(jù)進(jìn)行非線性化處理,從而使得計(jì)算機(jī)具備擬合任何連續(xù)函數(shù)的能力,大幅提升了計(jì)算機(jī)的計(jì)算能力。1986年,Geoffrey Hinton等人提出了多層感知機(jī)(MLP)與反向傳播(BP)訓(xùn)練相結(jié)合的理念,將人類基于結(jié)果誤差反饋反哺邏輯推理的思想融入AI。BP算法的基本思想是用誤差的導(dǎo)數(shù)(梯度)調(diào)整,并通過(guò)誤差的梯度做反向傳播,更新模型權(quán)重,以降低學(xué)習(xí)誤差并擬合學(xué)習(xí)目標(biāo)。

pYYBAGQmmrSAXqXjAAGu0eSb3U4121.png

反向傳播(BP)模型

第二次 AI 浪潮中,專家系統(tǒng)模擬人類專家的知識(shí)和經(jīng)驗(yàn)解決特定領(lǐng)域的問(wèn)題,實(shí)現(xiàn) 了人工智能從理論研究走向?qū)嶋H應(yīng)用、從一般推理策略探討轉(zhuǎn)向運(yùn)用專門(mén)知識(shí)的重大突 破。并且機(jī)器學(xué)習(xí)(特別是神經(jīng)網(wǎng)絡(luò))探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法,在大量的實(shí) 際應(yīng)用中也開(kāi)始慢慢復(fù)蘇。

專家系統(tǒng)作為人工智能的重要分支,在這一時(shí)期逐步滲透到細(xì)分行業(yè)的實(shí)際場(chǎng)景解決 特定任務(wù)。第二次 AI 浪潮期間,專家系統(tǒng)應(yīng)用到數(shù)學(xué)、物理、化學(xué)、醫(yī)學(xué)、地質(zhì)等細(xì)分 行業(yè),能夠輔助科研人員解決化學(xué)分子結(jié)構(gòu)、疾病診斷、地質(zhì)分析等特定任務(wù)。這一時(shí)期 專家系統(tǒng)的特點(diǎn)包含:(1)單學(xué)科的專業(yè)性;(2)系統(tǒng)結(jié)構(gòu)完整,移植性好;(3)具有一 定的推理解釋功能,透明性好;(4)采用啟發(fā)式推理和不精確推理;(5)用產(chǎn)生式規(guī)則、 框架和語(yǔ)義網(wǎng)絡(luò)表達(dá)知識(shí);

專家系統(tǒng)商業(yè)價(jià)值顯現(xiàn),在企業(yè)生產(chǎn)決策過(guò)程中發(fā)揮重大作用。1980 年,美國(guó)卡耐基 梅隆大學(xué)與 DEC 公司合作研發(fā)的 XCON 專家系統(tǒng),運(yùn)用計(jì)算機(jī)系統(tǒng)配置的知識(shí),依據(jù)用 戶的定貨,選出最合適的系統(tǒng)部件(如 CPU 型號(hào)、操作系統(tǒng)種類及相應(yīng)型號(hào),存儲(chǔ)器和外 部設(shè)備等),并且能夠給出優(yōu)化意見(jiàn)以構(gòu)成一個(gè)完整的系統(tǒng)。XCON 可以給出一個(gè)系統(tǒng)配 置的清單和這些部件裝配關(guān)系的圖,以便技術(shù)人員進(jìn)行裝配。在這一時(shí)期,除 DEC 公司 外,美國(guó)杜邦、通用汽車(chē)和波音等公司在也在生產(chǎn)決策中借助專家系統(tǒng)的輔助,1986 年美 國(guó) AI 相關(guān)軟硬件銷售額達(dá)到 4.25 億美元,人工智能技術(shù)逐漸走出科研院所,進(jìn)入到企業(yè) 的實(shí)際業(yè)務(wù)場(chǎng)景中。

poYBAGQmmrWAdRKAAATjEDugLbU084.png

XCON 專家系統(tǒng)核心架構(gòu)

在AI模型算法研究領(lǐng)域,對(duì)人類腦神經(jīng)的信號(hào)處理和思考機(jī)制的模擬進(jìn)一步加深,代表性產(chǎn)物包含了CNN、RNN等神經(jīng)網(wǎng)絡(luò)模型。其中,1982年,John Hopfield提出了一種結(jié)合存儲(chǔ)系統(tǒng)和二元系統(tǒng)的神經(jīng)網(wǎng)絡(luò),即Hopfield網(wǎng)絡(luò)。這種模型保證了向局部極小的收斂,由于每個(gè)神經(jīng)元的輸出均連接到其它神經(jīng)元的輸入,模型能夠通過(guò)訓(xùn)練從某一殘缺的信息聯(lián)想到所屬的完整信息。因此,Hopfield模型在模擬人類記憶儲(chǔ)存和聯(lián)想方面做出了重大貢獻(xiàn),同時(shí)也勾勒了未來(lái)RNN模型的雛形。

pYYBAGQmmraAAbM-AADe-T0Xems596.png

Hopfield Network 模型

Yann LeCun提出了CNN模型,并成功驗(yàn)證了其商業(yè)可行性。1989年,LeCun結(jié)合反向傳播算法和權(quán)值共享的卷積神經(jīng)層發(fā)明了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)。CNN通常由輸入層、卷積層、池化(Pooling)層和全連接層組成。卷積層負(fù)責(zé)提取圖像中的局部特征,池化層用來(lái)大幅降低參數(shù)量級(jí),全連接層則類似傳統(tǒng)神經(jīng)網(wǎng)絡(luò)部分輸出想要的結(jié)果。CNN成功應(yīng)用到美國(guó)郵局的手寫(xiě)字符識(shí)別系統(tǒng)中,在此基礎(chǔ)上于1998年誕生了穩(wěn)定可商業(yè)應(yīng)用的CNN模型LeNet-5。

poYBAGQmmraAdWPkAAJWFnPtFJg826.png

卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型

三、第三次 AI 浪潮,數(shù)據(jù)爆炸背景下,AI 進(jìn)入學(xué)習(xí)時(shí)代

隨著人類進(jìn)入互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)量呈現(xiàn)爆炸式成長(zhǎng),同時(shí)大數(shù)據(jù)技術(shù)的成熟為人工智能的發(fā)展注入了新動(dòng)能。PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的到來(lái)推動(dòng)了人類活動(dòng)數(shù)據(jù)量的快速增長(zhǎng),為AI模型的訓(xùn)練提供了有價(jià)值的原料。同時(shí),圍繞大數(shù)據(jù)、云計(jì)算等領(lǐng)域的技術(shù)迭代使得人工智能模型的計(jì)算效率、成本等方面都得到了大幅優(yōu)化,為商業(yè)化應(yīng)用打開(kāi)了空間。

根據(jù)海外學(xué)者論文《Modeling and Simulation Strategies for Performance Evaluation of Cloud Computing Systems》,自2000年以來(lái),全球產(chǎn)生的數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng),到2007年已接近300EB。在針對(duì)大規(guī)模數(shù)據(jù)計(jì)算領(lǐng)域,2003年,Google公布了3篇大數(shù)據(jù)奠基性論文,為大數(shù)據(jù)存儲(chǔ)及分布式處理的核心問(wèn)題提供了思路:非結(jié)構(gòu)化文件分布式存儲(chǔ)(GFS)、分布式計(jì)算(MapReduce)及結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)(BigTable),并奠定了現(xiàn)代大數(shù)據(jù)技術(shù)的理論基礎(chǔ)。

pYYBAGQmmreAMjNBAACSnDmuqRw544.png

1986-2007 年全球數(shù)據(jù)量變化趨勢(shì)(單位:EB)

Geoffrey Hinton等人提出了深度學(xué)習(xí)的概念,這掀起了第三次人工智能熱潮。深度學(xué)習(xí)的本質(zhì)是使用多個(gè)隱藏層網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)大量的向量計(jì)算,學(xué)習(xí)數(shù)據(jù)內(nèi)在信息的高階表示。相較于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)模型具有更優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)得到的特征對(duì)數(shù)據(jù)有更本質(zhì)的刻畫(huà),有利于可視化或分類。其次,深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度可以通過(guò)“逐層初始化”(layer-wise pre-training)來(lái)有效克服,因此模型精調(diào)的效率得以大大提升。

poYBAGQmmriAAIOxAAShqlaGaHw836.png

AlexNet 神經(jīng)網(wǎng)絡(luò)模型

深度學(xué)習(xí)的出現(xiàn)標(biāo)志著計(jì)算機(jī)實(shí)現(xiàn)了基于數(shù)據(jù)的學(xué)習(xí)和挖掘分析能力,AI能夠挖掘復(fù)雜信息中包含的關(guān)聯(lián)關(guān)系。2012年,AlexNet神經(jīng)網(wǎng)絡(luò)獲得ImageNet大賽冠軍,標(biāo)志著AI在圖像識(shí)別領(lǐng)域的突破性成就。在計(jì)算機(jī)視覺(jué)領(lǐng)域的競(jìng)賽ImageNet中,AlexNet以提升10%的錯(cuò)誤率的進(jìn)步力壓第二名以SIFT+FV、LBP+FV、GIST+FV、CSIFT+FV等組合特征的算法。AlexNet基于卷積神經(jīng)網(wǎng)絡(luò)CNN模型,在數(shù)據(jù)、算法及算力層面均有較大改進(jìn),創(chuàng)新地應(yīng)用了Data Augmentation、ReLU、Dropout和LRN等方法,并使用GPU加速網(wǎng)絡(luò)訓(xùn)練。之后圖像識(shí)別領(lǐng)域AI模型均在此基礎(chǔ)上進(jìn)行優(yōu)化,并且識(shí)別準(zhǔn)確度超越了人類水平。

pYYBAGQmmriAKCrrAAEaFWcxh7Y940.png

AlexNet 實(shí)現(xiàn)深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域的重大突破

AlphaGo是一種具備深度學(xué)習(xí)能力的人工智能,它可以結(jié)合人類專家比賽中學(xué)到的棋譜,以及在自我對(duì)弈中進(jìn)行強(qiáng)化學(xué)習(xí)。在2016年,AlphaGo在圍棋競(jìng)技中擊敗了李世石,這標(biāo)志著人工智能具備了自我迭代和學(xué)習(xí)強(qiáng)化的能力。AlphaGo的深度學(xué)習(xí)模型可以分為策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò),分別解決了圍棋中的“下一步最佳策略”和“下一步后的勝率”兩個(gè)問(wèn)題。通過(guò)學(xué)習(xí)人類棋譜和自我對(duì)弈,AlphaGo不斷調(diào)整策略以提升棋力。AlphaGo較好地模擬了人類棋手對(duì)于圍棋落子的直覺(jué)判斷。由于圍棋存在的廣度和深度,計(jì)算機(jī)無(wú)法模擬計(jì)算所有的可能性。AlphaGo通過(guò)策略網(wǎng)絡(luò)減少搜索廣度,即每一步搜索少量節(jié)點(diǎn),而通過(guò)價(jià)值網(wǎng)絡(luò)減少搜索深度,無(wú)需將棋局下到底即可得出當(dāng)前局勢(shì)的判斷。

在AlphaGo的基礎(chǔ)上,谷歌公司推出了迭代版本AlphaGo Zero,增強(qiáng)了人工智能在面對(duì)人類棋譜中未出現(xiàn)過(guò)的局勢(shì)時(shí)的自我推理和學(xué)習(xí)能力,標(biāo)志著人工智能的自我學(xué)習(xí)具備了一定的遷移能力。

pYYBAGQmmrmAVaglAAGNsQj-BsE576.png

AlphaGo 包含價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型

Transformer 架構(gòu)橫空出世,Open AI 發(fā)布的 GPT 模型,AI 進(jìn)入“大模型”時(shí)代。GPT 模型利用更大規(guī)模的文本數(shù)據(jù)以及更深層的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)更豐富的文本語(yǔ)義表示,打破了自然語(yǔ)言處理各個(gè)任務(wù)之間的壁壘,使得搭建一個(gè)面向特定任務(wù)的自然語(yǔ)言模型不再需要非常多的任務(wù)北京,只需要根據(jù)任務(wù)的輸入和輸出形式應(yīng)用預(yù)訓(xùn)練模型便可達(dá)到滿意效果。

NLP 模型的搭建只需要“無(wú)監(jiān)督預(yù)訓(xùn)練+有監(jiān)督的精調(diào)”兩階段:(1)生成式預(yù)訓(xùn)練:在大規(guī)模文本數(shù)據(jù)上訓(xùn)練一個(gè)高容量的語(yǔ)言模型,以學(xué)習(xí)更豐富的上下文信息;(2)判別式任務(wù)精調(diào):將預(yù)訓(xùn)練好的模型適配到下游任務(wù)中,并使用有標(biāo)注數(shù)據(jù)學(xué)習(xí)判別式任務(wù)。

從 GPT 到 GPT-2 和 GPT-3,參數(shù)提升和訓(xùn)練數(shù)據(jù)積累提升模型工作性能。到了 GPT-2 階段,Open AI 將自然語(yǔ)言模型定義為要完成零樣本無(wú)監(jiān)督多任務(wù)學(xué)習(xí)的目標(biāo),即預(yù)訓(xùn)練好的模型可以直接用于下游任務(wù)。GPT-2 模型在學(xué)習(xí)更廣泛的數(shù)據(jù)信息,增加了模型的維度參數(shù)后,不需要針對(duì)特定的任務(wù)修改模型,將任務(wù)也作為提示詞,和文本一起輸入預(yù)訓(xùn)練好的模型。

承接 GPT-2 的核心思想,到了 GPT-3,模型參數(shù)量達(dá)到了 1750 億,在不進(jìn)行微調(diào)的情況下可以在多個(gè) NLP 基準(zhǔn)上達(dá)到最先進(jìn)的性能。GPT 模型的演進(jìn)為國(guó)內(nèi)外 AI 大廠提供了重要的借鑒意義,即通過(guò)優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)輸入和模型復(fù)雜度的增加來(lái)提升模型性能,而未來(lái) AI 以少樣本乃至無(wú)樣本學(xué)習(xí)為核心目標(biāo)。

poYBAGQmmrmAZONVAAIxMDKCnjM068.png

GPT,GPT-2,GPT-3 模型對(duì)比

AI大模型在任務(wù)準(zhǔn)確度和場(chǎng)景泛化性方面有顯著提升?;诖耍梢蕴釤挸鲠槍?duì)不同實(shí)際場(chǎng)景的AI小模型,以完成特定任務(wù),從而降低AI商業(yè)化部署的成本,提高訓(xùn)練速度。其中,Transformer架構(gòu)和GAN模型為現(xiàn)在的語(yǔ)言文本生成和圖像生成奠定了基礎(chǔ)。

GAN模型參考博弈學(xué)習(xí)理論,通過(guò)內(nèi)部?jī)蓚€(gè)模型的互相博弈,實(shí)現(xiàn)圖像視頻的AI自動(dòng)生成。生成式對(duì)抗網(wǎng)絡(luò)(GAN)是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。模型通過(guò)框架中兩個(gè)模塊:生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生輸出。判別模型負(fù)責(zé)判斷一個(gè)實(shí)例是真實(shí)的還是模型生成;而生成模型負(fù)責(zé)生成實(shí)例來(lái)騙過(guò)判別模型。兩個(gè)模型對(duì)抗中最達(dá)到平衡,即生成模型生成的實(shí)例與真實(shí)的沒(méi)有區(qū)別,判別模型無(wú)法區(qū)分輸入數(shù)據(jù)是生成的還是原始真實(shí)的數(shù)據(jù)。

pYYBAGQmmrqAWxXFAAGPlPrZQDo638.png

生成式對(duì)抗網(wǎng)絡(luò)(GAN)模型原理

GAN 模型是一種應(yīng)用廣泛的人工智能底層框架,可用于逼真圖片生成、圖片翻譯、3D 建模等領(lǐng)域。然而,早期的 GAN 模型存在一些問(wèn)題,如收斂不穩(wěn)定、容易受到部分圖片樣本欺騙等,導(dǎo)致初期生成的圖像可能存在失真問(wèn)題,適用范圍相對(duì)局限。盡管如此,隨著技術(shù)的不斷發(fā)展和改進(jìn),GAN 模型已經(jīng)成為了 AIGC 重要的底層框架之一。

四、第四次 AI 浪潮,AIGC 從文本拓展至圖像及音視頻領(lǐng)域,商業(yè)化空間打開(kāi)

AIGC 在圖片、音視頻領(lǐng)域的模型在大模型基礎(chǔ)上持續(xù)優(yōu)化,性能趨向商用化需求,空間有望打開(kāi)。我們認(rèn)為以 ChatGPT 為代表,AI 將進(jìn)入創(chuàng)造(創(chuàng)作)時(shí)代,引領(lǐng)第四次人工智能浪潮。AIGC 以自動(dòng)化生產(chǎn)和高效為兩大特點(diǎn),目前已經(jīng)可以自動(dòng)生成文字、圖片、音頻、視頻,甚至 3D 模型和代碼。未來(lái)大量數(shù)字原生內(nèi)容有望由 AI 協(xié)助完成創(chuàng)作。底層技術(shù)的突破使 AIGC 商業(yè)落地成為可能,模型迭代推動(dòng) AI 生成文字和圖片質(zhì)量實(shí)現(xiàn)質(zhì)的提升。在圖像生成領(lǐng)域,AIGC 的模型已經(jīng)實(shí)現(xiàn)了質(zhì)的飛躍,為AI生成高質(zhì)量圖像提供了更多可能性。

poYBAGQmmruATc_wAAKaOR4zKaE702.png

AI 圖像生成模型發(fā)展梳理

Diffusion模型參考了熱力學(xué)原理,大幅提高了生成圖像的穩(wěn)定性、準(zhǔn)確性以及計(jì)算效率。該模型的靈感來(lái)自于非平衡熱力學(xué),訓(xùn)練過(guò)程中緩慢地將隨機(jī)噪聲添加到數(shù)據(jù)中,然后通過(guò)反轉(zhuǎn)這個(gè)噪聲過(guò)程來(lái)學(xué)習(xí)恢復(fù)數(shù)據(jù)。與GAN模型不同,擴(kuò)散模型不依賴于生成與對(duì)抗兩個(gè)模型的博弈,因此學(xué)習(xí)結(jié)果更加穩(wěn)定,并且模型的并行性和擴(kuò)展性更好。之后推出的Stable Diffusion模型在計(jì)算效率上顯著提升,滿足企業(yè)級(jí)和消費(fèi)級(jí)的使用需求。

CLIP模型打破了傳統(tǒng)分類器的界限,可以在不需要額外訓(xùn)練集的情況下,以良好的性能完成各種計(jì)算機(jī)視覺(jué)任務(wù)。該模型對(duì)問(wèn)題進(jìn)行了重新定義,不再預(yù)測(cè)文本標(biāo)簽,取而代之的是預(yù)測(cè)圖像與文本相匹配的可能性大小。在大規(guī)模數(shù)據(jù)集上完成的訓(xùn)練后,該模型能夠?qū)W習(xí)到圖像的各方面信息。在圖像生成領(lǐng)域,這兩個(gè)模型的結(jié)合可以幫助我們生成更加穩(wěn)定、準(zhǔn)確的圖像。

pYYBAGQmmruAd8QCAAGNsQj-BsE622.png

幾種圖像生成模型特點(diǎn)對(duì)比

Make-A-Video 模型是一種基于文本和圖像智能生成視頻的人工智能技術(shù)。該技術(shù)繼承了圖像生成模型的核心技術(shù),通過(guò)對(duì)文本語(yǔ)義和圖像對(duì)應(yīng)關(guān)系的學(xué)習(xí),結(jié)合視頻幀序列的訓(xùn)練,實(shí)現(xiàn)了連貫運(yùn)動(dòng)且高分辨率的高質(zhì)量視頻生成。然而,由于模型訓(xùn)練量要求過(guò)大,目前該技術(shù)只能實(shí)現(xiàn)幾秒鐘的短視頻生成。未來(lái),隨著模型的迭代和優(yōu)化,有望實(shí)現(xiàn)更長(zhǎng)時(shí)間和更高質(zhì)量的視頻生成。

poYBAGQmmryATZCgAAZBCiw7O1Y537.png

Make-A-Video 實(shí)現(xiàn) AI 自動(dòng)生成短視頻

賦能千行百業(yè)

引領(lǐng)數(shù)字化未來(lái)

AIGC產(chǎn)業(yè)鏈已初步形成,其最上層為算力層,為算法層提供算力支持;第二層為算法基礎(chǔ)層,通過(guò)數(shù)據(jù)收集、標(biāo)注、注釋為算法中間層提供原材料;第三層為算法中間層,通過(guò)AI模型開(kāi)發(fā)、訓(xùn)練生成垂直化、場(chǎng)景化、個(gè)性化的模型;最后層級(jí)為應(yīng)用層,利用人工智能生成內(nèi)容,包括文字、圖片、音視頻等服務(wù)內(nèi)容。

預(yù)計(jì)AIGC將朝著標(biāo)準(zhǔn)化SAAS服務(wù)模式發(fā)展,隨著兼具大模型和多模態(tài)的AIGC模型加速生成新的技術(shù)平臺(tái),SAAS有望加速落地,相關(guān)應(yīng)用層可通過(guò)鏈接平臺(tái)相關(guān)算法從而打開(kāi)海量應(yīng)用市場(chǎng)。此外,目前OPEN商業(yè)模式即API接口收費(fèi),公司通過(guò)提供相關(guān)AIGC代碼,提供自動(dòng)圖形模型或語(yǔ)言模型生成等產(chǎn)品,用戶通過(guò)其API接口接入,并支付平臺(tái)費(fèi)用獲取相關(guān)圖像、語(yǔ)言、代碼調(diào)整服務(wù),OpenAI可獲得付費(fèi)訂閱式的SAAS費(fèi)用,該商業(yè)模式用戶粘性極強(qiáng)。

pYYBAGQmmryAQLdkAAE-hKWV3i8782.png

AIGC產(chǎn)業(yè)雛形

一、搜索引擎

Microsoft Bing是由微軟推出的搜索引擎,于2009年5月28日正式上線。截至2013年5月,Bing已成為北美地區(qū)第二大搜索引擎,市場(chǎng)份額達(dá)到29.3%。Bing集成了網(wǎng)頁(yè)、圖片、視頻、詞典、翻譯、資訊、地圖等全球信息搜索服務(wù),并引入了AIGC的搜索引擎,使搜索更便捷、溝通更高效、功能更多元,且AI答案的可靠性得到提升。

最近,Bing推出了一款新版,加入了AI輔助功能。用戶可以通過(guò)點(diǎn)擊搜索欄的“聊天”選項(xiàng),通過(guò)與AI聊天的方式獲得答案或建議,還可以通過(guò)和搜索框?qū)υ拋?lái)調(diào)整答案,從而達(dá)到更精準(zhǔn)的搜索效果。不同于ChatGPT,新版Bing同時(shí)提供引用來(lái)源,提高答案可靠度。此外,新版必應(yīng)不僅具有傳統(tǒng)搜索引擎功能,也可以像智能語(yǔ)音助手一樣根據(jù)用戶需求生成出行計(jì)劃,及完成如寫(xiě)詩(shī)、創(chuàng)作短篇小說(shuō)等ChatGPT的傳統(tǒng)藝能。

新版Microsoft Edge功能于2月8日發(fā)布,將加入AI聊天和相關(guān)寫(xiě)作功能。除聊天功能外,這些寫(xiě)作功能可以有效幫助用戶對(duì)長(zhǎng)文章歸納總結(jié)提煉重點(diǎn)、對(duì)比篩選文章內(nèi)容以及創(chuàng)造新內(nèi)容。此外,新版Bing可以協(xié)助用戶生成內(nèi)容,包括電子郵件、規(guī)劃旅行等。

引入ChatGPT功能的BING主頁(yè)界面 用戶可以和新版BING搜索引擎交流

二、新聞媒體

BuzzFeed是一家致力于從數(shù)百個(gè)新聞博客那里獲取訂閱源,為用戶提供方便瀏覽當(dāng)天網(wǎng)上最熱門(mén)事件的新聞聚合網(wǎng)站。該網(wǎng)站被譽(yù)為媒體行業(yè)的顛覆者。

現(xiàn)在,BuzzFeed計(jì)劃利用AIGC技術(shù)來(lái)有效代替人類對(duì)已有信息進(jìn)行語(yǔ)言整合和文字輸出,與資訊平臺(tái)類的數(shù)字媒體高度適配。據(jù)澎湃新聞報(bào)道,BuzzFeed于1月底宣布將使用OpenAI開(kāi)放的API協(xié)助創(chuàng)作內(nèi)容,并計(jì)劃在2023年將把由AI創(chuàng)造的內(nèi)容從研發(fā)階段轉(zhuǎn)變?yōu)楹诵臉I(yè)務(wù)的一部分。具體來(lái)說(shuō),BuzzFeed將利用人工智能技術(shù)創(chuàng)建面向用戶的個(gè)性測(cè)驗(yàn),并根據(jù)用戶反應(yīng)生成個(gè)性化的文本內(nèi)容。人工智能將協(xié)助創(chuàng)作過(guò)程,加強(qiáng)部分內(nèi)容創(chuàng)作,而人類則扮演提供想法、“文化貨幣”和“靈感提示”的角色。

pYYBAGQmmr2AFf_FAAME0_LIaRk699.png


BuzzFeed頁(yè)面

三、客戶管理

LivePerson是一家網(wǎng)絡(luò)交易業(yè)務(wù)的領(lǐng)先供應(yīng)商,提供一種云技術(shù)平臺(tái),幫助企業(yè)通過(guò)多種渠道(包括網(wǎng)站、社交媒體和移動(dòng)設(shè)備)主動(dòng)與消費(fèi)者聯(lián)系。該平臺(tái)提供交談、語(yǔ)音和內(nèi)容交付等多種聯(lián)系方式,是客戶參與解決方案的全球領(lǐng)導(dǎo)者。公司的交易業(yè)務(wù)通過(guò)各種消費(fèi)者和商業(yè)數(shù)據(jù)(包括歷史、行為、業(yè)務(wù)驅(qū)動(dòng)和第三方數(shù)據(jù))的信息來(lái)源提煉,每一筆交易的背后都有著專業(yè)的分析和對(duì)于消費(fèi)者需求和商業(yè)目標(biāo)之間的實(shí)時(shí)信息支持。

此外,LivePerson在2022年9月與人工智能企業(yè)Afiniti合作,提高服務(wù)質(zhì)量降本增效。根據(jù)美國(guó)商業(yè)資訊,LivePerson在引入AI技術(shù)后,品牌方可以在幾毫秒內(nèi)根據(jù)歷史數(shù)據(jù)模式將個(gè)人與客服人員匹配,考慮因素包括客戶的產(chǎn)品使用情況、使用年限,以及過(guò)去與該公司聯(lián)系的原因。該過(guò)程還考慮了客服人員信息,例如他們?nèi)绾翁幚眍愃频男畔⒒?dòng),以盡可能達(dá)成積極的客戶-客服人員體驗(yàn),獲得有效結(jié)果。

poYBAGQmmr6Ac4ONAAP1luddl5o416.png

LivePerson主頁(yè)截圖

四、數(shù)字人

2020年,百度推出了國(guó)內(nèi)首個(gè)可交互虛擬偶像“度曉曉”,具備視覺(jué)識(shí)別能力和最自然的交流方式,讓搜索過(guò)程和結(jié)果反饋更接近人類真實(shí)的溝通體驗(yàn)。度曉曉可以輕松知道人類已有記錄的所有知識(shí),為用戶提供權(quán)威且精準(zhǔn)的知識(shí)服務(wù)。在與用戶的交互中,度曉曉能夠默默學(xué)習(xí)人類的思維實(shí)現(xiàn)自我進(jìn)化。2021年,百度與榮耀聯(lián)合打造了國(guó)內(nèi)首個(gè)虛擬偶像AIGC單曲《每分 每秒 每天》,由度曉曉與龔俊數(shù)字人聯(lián)合演唱。數(shù)字人在電商直播、新聞播報(bào)、接待指引和展覽展示等領(lǐng)域均有已落地的應(yīng)用,越來(lái)越多的企業(yè)使用和打造AI虛擬數(shù)字人,市場(chǎng)前景十分廣闊。

五、游戲

AIGC(Artificial Intelligence Game Character)是一種基于人工智能技術(shù)的游戲角色,它可以在游戲中自主地行動(dòng)、思考和決策,從而提高游戲的趣味性和挑戰(zhàn)性。以下是AIGC在游戲領(lǐng)域的應(yīng)用:

1、智能對(duì)戰(zhàn)

AIGC可以作為游戲中的對(duì)手,通過(guò)學(xué)習(xí)和適應(yīng)玩家的行為,提高游戲的難度和挑戰(zhàn)性。

2、智能伙伴

AIGC可以作為游戲中的隊(duì)友或伙伴,與玩家合作完成任務(wù),提供更加真實(shí)的游戲體驗(yàn)。

3、智能敵人

AIGC可以作為游戲中的敵人,通過(guò)學(xué)習(xí)和適應(yīng)玩家的行為,提高游戲的難度和挑戰(zhàn)性。

4、智能NPC

AIGC可以作為游戲中的非玩家角色,與玩家進(jìn)行互動(dòng),提供更加真實(shí)的游戲體驗(yàn)。

5、智能劇情

AIGC可以通過(guò)學(xué)習(xí)和適應(yīng)玩家的行為,自主地生成游戲劇情,提高游戲的趣味性和可玩性。

AIGC:助力廠商實(shí)現(xiàn)

數(shù)字化轉(zhuǎn)型的利器

我們認(rèn)為AIGC的出世將會(huì)產(chǎn)生革命性的影響,并有望賦能千行百業(yè)。為此,我們梳理了三條路徑圖,積極地推薦以下三條投資主線:

第一條主線是具備算力基礎(chǔ)的廠商,受益標(biāo)的為寒武紀(jì)、商湯、海光信息、浪潮信息、中科曙光、景嘉微、藍(lán)海大腦等。這些公司都具備強(qiáng)大的算力基礎(chǔ),能夠?yàn)锳IGC的發(fā)展提供有力的支撐。

第二條主線是具備AI算法商業(yè)落地的廠商,重點(diǎn)推薦科大訊飛、拓爾思等。此外,漢王科技、海天瑞聲、云從科技等公司也將受益于AIGC的發(fā)展。

第三條主線是AIGC相關(guān)技術(shù)儲(chǔ)備的應(yīng)用廠商,受益標(biāo)的為百度、同花順、三六零、金山辦公等。這些公司都擁有豐富的AIGC技術(shù)儲(chǔ)備,能夠在應(yīng)用領(lǐng)域中發(fā)揮重要作用。

一、科大訊飛:自然語(yǔ)言處理的全球龍頭廠商

科大訊飛于2022年初發(fā)布了“訊飛超腦 2030 計(jì)劃”,旨在成為“全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者”。該計(jì)劃是公司的核心戰(zhàn)略,旨在構(gòu)建基于認(rèn)知的人機(jī)協(xié)作、自我進(jìn)化的復(fù)雜系統(tǒng),讓機(jī)器人感官超越人類,具備自主進(jìn)化的能力,打造可持續(xù)自主進(jìn)化的復(fù)雜智能系統(tǒng),助力機(jī)器人走進(jìn)千家萬(wàn)戶。

該計(jì)劃分為三個(gè)階段性里程碑:第一階段(2022-2023)推出可養(yǎng)成的寵物玩具、仿生動(dòng)物等軟硬件一體機(jī)器人,同期推出專業(yè)數(shù)字虛擬人家族,擔(dān)當(dāng)老師、醫(yī)生等角色;第二階段(2023-2025)推出自適應(yīng)行走的外骨骼機(jī)器人和陪伴數(shù)字虛擬人家族,老人通過(guò)外骨骼機(jī)器人能夠?qū)崿F(xiàn)正常行走和運(yùn)動(dòng),同期推出面向青少年的抑郁癥篩查平臺(tái);第三階段(2025-2030)最終推出懂知識(shí)、會(huì)學(xué)習(xí)的陪伴機(jī)器人和自主學(xué)習(xí)虛擬人家族,全面進(jìn)入家庭。

“訊飛超腦”計(jì)劃和里程表

二、漢王科技:人工智能領(lǐng)域領(lǐng)先者

漢王科技是一家成立于1998年的人工智能領(lǐng)域領(lǐng)先者,專注于人臉識(shí)別、大數(shù)據(jù)、智能交互技術(shù)、產(chǎn)品及服務(wù)的提供。公司以核心技術(shù)為基礎(chǔ),面向市場(chǎng)需求,已形成了以識(shí)別技術(shù)為核心的、針對(duì)不同細(xì)分市場(chǎng)的軟硬件產(chǎn)品系列,既有通用產(chǎn)品,如e典筆、漢王電紙書(shū)、漢王筆、文本王、名片通、繪圖板等。公司主營(yíng)業(yè)務(wù)分為四類:

筆智能交互業(yè)務(wù)、文本大數(shù)據(jù)業(yè)務(wù)、人臉及生物試別與相關(guān)AI終端。其中,筆智能交互業(yè)務(wù)是公司的核心業(yè)務(wù)之一,公司在該領(lǐng)域的技術(shù)主要分為電磁觸控及電容觸控兩大類,是全球僅有的兩家擁有無(wú)線無(wú)源電磁觸控自主知識(shí)產(chǎn)權(quán)的企業(yè)之一。此項(xiàng)業(yè)務(wù)包括數(shù)字繪畫(huà)、電容筆、無(wú)紙化簽章等。

文本大數(shù)據(jù)業(yè)務(wù)則依托 AI 文本圖像識(shí)別技術(shù)、NLP 技術(shù)、RPA技術(shù)平臺(tái),在各行業(yè)賽道中尋找數(shù)字化、智能化的落地場(chǎng)景,包括智慧司法、智慧檔案、智慧人文、智慧教育、智慧金融等。

人臉及生物試別與相關(guān)AI終端則是公司的另一重要業(yè)務(wù),涉及人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別等技術(shù),為各行業(yè)提供安全、便捷的身份認(rèn)證解決方案。

漢王科技相關(guān)大數(shù)據(jù)產(chǎn)品及解決方案

三、拓爾思: 全文檢索技術(shù)的始創(chuàng)者

拓爾思成立于1993年,是一家領(lǐng)先的大數(shù)據(jù)、人工智能和數(shù)據(jù)安全產(chǎn)品及服務(wù)提供商。公司主要核心業(yè)務(wù)包括軟件平臺(tái)產(chǎn)品研發(fā)、行業(yè)應(yīng)用系統(tǒng)解決方案和大數(shù)據(jù)SaaS/DaaS云服務(wù)三大板塊,涵蓋大數(shù)據(jù)、人工智能、互聯(lián)網(wǎng)內(nèi)容管理、網(wǎng)絡(luò)信息安全和互聯(lián)網(wǎng)營(yíng)銷等領(lǐng)域方向。

公司技術(shù)實(shí)力雄厚,人工智能領(lǐng)域方面,公司是國(guó)內(nèi)最早從事自然語(yǔ)言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識(shí)圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域都具備自主可控的底層技術(shù)。在大數(shù)據(jù)方面,數(shù)據(jù)采集、挖掘、分析等底層技術(shù)均實(shí)現(xiàn)技術(shù)可控。

公司行業(yè)領(lǐng)域覆蓋廣,由于公司人工智能和大數(shù)據(jù)核心技術(shù)具有跨行業(yè)/領(lǐng)域的通用普適性,因此公司技術(shù)產(chǎn)品和服務(wù)所支持的業(yè)務(wù)應(yīng)用落地場(chǎng)景眾多,涵蓋多個(gè)行業(yè)/領(lǐng)域,大型或頭部企業(yè)級(jí)客戶超過(guò)8000家,廣泛覆蓋于金融、制造、能源、互聯(lián)網(wǎng)、傳媒、政府、公共安全等領(lǐng)域。

pYYBAGQmmsCAUX6pAADhUPFaiBY464.png

拓爾思數(shù)據(jù)應(yīng)用相關(guān)產(chǎn)品

四、云從科技: 人機(jī)協(xié)同生態(tài)體系賦能商

云從科技是一家專注于提高人機(jī)操作系統(tǒng)和行業(yè)解決方案的人工智能企業(yè)。公司致力于推進(jìn)人工智能產(chǎn)業(yè)化進(jìn)程和各行業(yè)的轉(zhuǎn)型升級(jí)。為此,公司通過(guò)業(yè)務(wù)、硬件設(shè)備、軟件應(yīng)用,為客戶提供數(shù)字化、智能化的人工智能服務(wù)。同時(shí),公司基于人機(jī)協(xié)同操作系統(tǒng),賦能金融、出行、商業(yè)等場(chǎng)景。為了實(shí)現(xiàn)這一目標(biāo),公司自主研發(fā)了融合人工智能技術(shù)的人機(jī)協(xié)同操作系統(tǒng)和部分AIoT設(shè)備。

公司的人機(jī)操作系統(tǒng)是一款自主研發(fā)的人工智能應(yīng)用操作系統(tǒng),包含AIoT設(shè)備、人工智能算法和引擎、AI模型和訓(xùn)練等核心模塊。該系統(tǒng)實(shí)現(xiàn)了AI能力的自動(dòng)部署、監(jiān)控和邊端感知。通過(guò)底層AI業(yè)務(wù)流程引擎和決策支持系統(tǒng),該系統(tǒng)優(yōu)化了人機(jī)交互體驗(yàn),提升了業(yè)務(wù)流程執(zhí)行效率,讓人機(jī)具有決策功能。該系統(tǒng)包含人機(jī)協(xié)同和整體操作系統(tǒng)、“輕舟平臺(tái)”的服務(wù)平臺(tái)及配套AI應(yīng)用的SaaS服務(wù)。

2、人工智能解決方案

云從科技提供面向智慧金融、智慧治理、智慧出行、智慧商業(yè)四個(gè)領(lǐng)域的綜合解決方案,基于自主研發(fā)的人機(jī)操作系統(tǒng)及其應(yīng)用產(chǎn)品和AIoT硬件設(shè)備。同時(shí),我們還提供該領(lǐng)域的定制化軟件開(kāi)發(fā)服務(wù),以滿足客戶的個(gè)性化需求。我們致力于為客戶提供高效、智能、安全的解決方案,幫助客戶實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和業(yè)務(wù)升級(jí)。

poYBAGQmmsGAf1OJAAKUG-SM7PA053.png

云從科技產(chǎn)品服務(wù)體系

五、海天瑞聲: AI訓(xùn)練數(shù)據(jù)服務(wù)領(lǐng)軍者

海天瑞聲是中國(guó)領(lǐng)先的訓(xùn)練數(shù)據(jù)專業(yè)提供商,專注于為人工智能產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開(kāi)發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。公司的訓(xùn)練數(shù)據(jù)涵蓋智能語(yǔ)音、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言等多個(gè)核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能駕駛、智慧城市等多種創(chuàng)新應(yīng)用場(chǎng)景。

公司的產(chǎn)品和服務(wù)已獲得阿里巴巴、騰訊、百度、科大訊飛、??低?/u>、微軟、亞馬遜、三星等國(guó)內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個(gè)人助手、智能音箱、語(yǔ)音導(dǎo)航、搜索服務(wù)、智能駕駛、機(jī)器翻譯等多種人工智能產(chǎn)品相關(guān)算法模型的訓(xùn)練過(guò)程中。

公司具備多重技術(shù)領(lǐng)先性,包括算法與數(shù)據(jù)處理技術(shù)并用、工具和平臺(tái)共建、在語(yǔ)音語(yǔ)言學(xué)基礎(chǔ)研究方面有深厚積累等,公司可提供數(shù)據(jù)的一站式解決方案,廣泛支持復(fù)雜的算法數(shù)據(jù)標(biāo)注需求。

pYYBAGQmmsGAIn48AAR3fIPGUQk452.png

云從科技產(chǎn)品服務(wù)體系

AIGC未來(lái)發(fā)展方向

一、AI 發(fā)展帶動(dòng)基礎(chǔ)數(shù)據(jù)市場(chǎng)成長(zhǎng),高質(zhì)量標(biāo)注數(shù)據(jù)決定模型訓(xùn)練效果

隨著AI模型的發(fā)展,訓(xùn)練數(shù)據(jù)的需求不斷增加,而數(shù)據(jù)標(biāo)注和結(jié)構(gòu)化處理則成為將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價(jià)值的關(guān)鍵步驟。隨著AI與各個(gè)產(chǎn)業(yè)的結(jié)合越來(lái)越緊密,AI商業(yè)化程度進(jìn)入新階段,企業(yè)對(duì)AI在商業(yè)化落地中的表現(xiàn)要求越來(lái)越高。為了保證AI算法的識(shí)別精度,數(shù)據(jù)標(biāo)注的質(zhì)量也變得至關(guān)重要。

AIGC向圖像、語(yǔ)音、文字等多維數(shù)據(jù)延伸,AI基礎(chǔ)數(shù)據(jù)服務(wù)與治理賽道有望受益加速成長(zhǎng)。數(shù)據(jù)服務(wù)利用數(shù)據(jù)采集與標(biāo)注工具處理非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)治理則使用數(shù)據(jù)治理的各模塊管理多源異構(gòu)數(shù)據(jù),提高數(shù)據(jù)質(zhì)量并形成數(shù)據(jù)資產(chǎn)。高質(zhì)量的數(shù)據(jù)可供各行業(yè)AI廠商訓(xùn)練模型,并支撐各場(chǎng)景商業(yè)化產(chǎn)品的落地。

目前,數(shù)據(jù)標(biāo)注仍以人工為主,但行業(yè)正向智能化和去人工化方向發(fā)展,標(biāo)注數(shù)據(jù)生產(chǎn)效率與AI模型進(jìn)步協(xié)同共振。不同于計(jì)算機(jī)視覺(jué)領(lǐng)域AI模型訓(xùn)練所用的圖像數(shù)據(jù),NLP模型訓(xùn)練的數(shù)據(jù)往往來(lái)自于半結(jié)構(gòu)化或非結(jié)構(gòu)化的信息,目前無(wú)法實(shí)現(xiàn)AI算法模型的自動(dòng)化標(biāo)注。目前主流的實(shí)現(xiàn)路徑是人工標(biāo)注與智能標(biāo)注協(xié)同方案,即人工完成一小部分的數(shù)據(jù)標(biāo)注,再借助算法模型對(duì)剩余數(shù)據(jù)進(jìn)行標(biāo)注,通過(guò)人工對(duì)部分難例數(shù)據(jù)樣本的二次標(biāo)注后,最終形成高質(zhì)量的標(biāo)注數(shù)據(jù)。

poYBAGQmmsKAMB-CAAFaZfXB3Kc722.png

AI 訓(xùn)練數(shù)據(jù)智能標(biāo)注服務(wù)實(shí)現(xiàn)路徑

二、場(chǎng)景模型持續(xù)簡(jiǎn)化以提升訓(xùn)練速度,控制成本滿足商業(yè)化應(yīng)用需求

大型模型的微調(diào)和維護(hù)成本過(guò)高,這是目前大型模型廠商在面對(duì)用戶需求時(shí)所面臨的問(wèn)題。如果僅提供推理服務(wù),成本可以大幅降低,但是模型精度會(huì)受到較大的犧牲,從而降低大型模型的競(jìng)爭(zhēng)力。此外,AI項(xiàng)目通常需要將模型部署到終端,對(duì)算力的要求非常高,因此國(guó)內(nèi)外大廠及研究院所均致力于對(duì)預(yù)訓(xùn)練模型進(jìn)行“瘦身”。

模型蒸餾和遷移學(xué)習(xí)成為AI領(lǐng)域的研究新方向,可以大幅優(yōu)化終端模型計(jì)算的時(shí)效性并節(jié)約算力成本。知識(shí)蒸餾是一種新的概念,類似于學(xué)校中的教學(xué)行為,可以有效地壓縮預(yù)訓(xùn)練模型的大小。知識(shí)蒸餾包含已訓(xùn)練的Teacher Model和待訓(xùn)練的Student Model,通過(guò)知識(shí)蒸餾和遷移學(xué)習(xí),學(xué)生網(wǎng)絡(luò)可以擁有與教師網(wǎng)絡(luò)相似和相近的計(jì)算性能。知識(shí)蒸餾可以在基于高度復(fù)雜的大型模型訓(xùn)練基礎(chǔ)上,提升細(xì)分任務(wù)小模型的計(jì)算精度,同時(shí)也可以有效降低模型延遲,并且壓縮網(wǎng)絡(luò)參數(shù)。

基于知識(shí)蒸餾思想改進(jìn)BERT預(yù)訓(xùn)練模型,實(shí)現(xiàn)模型的簡(jiǎn)化和速度的提升。Distilled BERT模型直接將BERT的部分參數(shù)作為初始化,模型參數(shù)只有BERT的約40%,但速度快提升60%,同時(shí)保留了97%的語(yǔ)言理解能力。我們認(rèn)為,在人工智能通往商業(yè)化應(yīng)用的道路上,早期專注于增加數(shù)據(jù)量、計(jì)算能力或者訓(xùn)練過(guò)程的優(yōu)化方式可能不再適用,未來(lái)各大廠商需要計(jì)算與預(yù)測(cè)性能之間做出權(quán)衡,探索如何利用更少的數(shù)據(jù)與計(jì)算資源,幫助模型實(shí)現(xiàn)性能提升。

三、AI 應(yīng)用落地拉動(dòng)算力需求,AI 基礎(chǔ)設(shè)施市場(chǎng)規(guī)模有望加速成長(zhǎng)

高算力支持是訓(xùn)練AI大規(guī)模商業(yè)化的基礎(chǔ),AI基礎(chǔ)設(shè)施市場(chǎng)有望迎來(lái)爆發(fā)。微軟入資OpenAI后雙方達(dá)成多年的合作協(xié)議,OpenAI接入微軟的Azure云平臺(tái)開(kāi)發(fā)AI技術(shù)。高算力的底層基礎(chǔ)設(shè)施是完成對(duì)海量數(shù)據(jù)處理、訓(xùn)練的基礎(chǔ)。我們認(rèn)為AI技術(shù)發(fā)展逐漸成熟,數(shù)字化基礎(chǔ)設(shè)施不斷建設(shè)完善,將拉升AI芯片、AI服務(wù)器的市場(chǎng)需求。AI商業(yè)化應(yīng)用的加速落地,將推動(dòng)我國(guó)AI基礎(chǔ)設(shè)施市場(chǎng)規(guī)模的加速成長(zhǎng)。

pYYBAGQmmsKAbnjEAADNdL8I9ZY204.png

我國(guó) AI 芯片市場(chǎng)規(guī)模趨勢(shì)

根據(jù)《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》,全球AI服務(wù)器市場(chǎng)規(guī)模預(yù)計(jì)將在2026年達(dá)到347.1億美元,五年復(fù)合增長(zhǎng)率為17.3%。這一市場(chǎng)規(guī)模的加速成長(zhǎng),將有望為國(guó)內(nèi)細(xì)分賽道的龍頭廠商帶來(lái)更多的機(jī)遇和收益。中商產(chǎn)業(yè)研究院的數(shù)據(jù)預(yù)計(jì),到2023年,我國(guó)的AI芯片市場(chǎng)規(guī)模將達(dá)到1206億元,云計(jì)算市場(chǎng)規(guī)模將達(dá)到6975億元,同比分別增長(zhǎng)41.9%和47.0%。AI基礎(chǔ)設(shè)施市場(chǎng)規(guī)模也將快速成長(zhǎng)。

poYBAGQmmsOAGz7WAAC5E00T-7c933.png

我國(guó)云計(jì)算市場(chǎng)規(guī)模趨勢(shì)

總結(jié)

隨著人工智能技術(shù)的不斷發(fā)展,智能化時(shí)代已經(jīng)到來(lái)。在這個(gè)時(shí)代,人工智能技術(shù)已經(jīng)成為了各行各業(yè)的重要工具,為企業(yè)和個(gè)人帶來(lái)了許多新的機(jī)遇。其中,AIGC(Artificial Intelligence and Global Citizenship)作為一種新型的人工智能技術(shù),更是為智能化時(shí)代的發(fā)展帶來(lái)了新的機(jī)遇。

AIGC是一種基于人工智能技術(shù)的全球公民意識(shí),它通過(guò)智能化的方式來(lái)推動(dòng)全球公民意識(shí)的發(fā)展。在AIGC的幫助下,人們可以更好地理解全球公民意識(shí)的重要性,并且更好地參與到全球公民意識(shí)的建設(shè)中來(lái)。同時(shí),AIGC也可以通過(guò)智能化的方式來(lái)幫助企業(yè)和個(gè)人更好地適應(yīng)智能化時(shí)代的發(fā)展。

在智能化時(shí)代,AIGC為企業(yè)和個(gè)人帶來(lái)了許多新的機(jī)遇。首先,AIGC可以幫助企業(yè)更好地適應(yīng)智能化時(shí)代的發(fā)展。通過(guò)AIGC的幫助,企業(yè)可以更好地了解全球公民意識(shí)的重要性,并且更好地參與到全球公民意識(shí)的建設(shè)中來(lái)。這樣,企業(yè)就可以更好地適應(yīng)智能化時(shí)代的發(fā)展,并且更好地滿足消費(fèi)者的需求。

其次,AIGC也為個(gè)人帶來(lái)了許多新的機(jī)遇。在智能化時(shí)代,個(gè)人需要具備更多的技能和知識(shí),才能更好地適應(yīng)智能化時(shí)代的發(fā)展。通過(guò)AIGC的幫助,個(gè)人可以更好地了解全球公民意識(shí)的重要性,并且更好地參與到全球公民意識(shí)的建設(shè)中來(lái)。這樣,個(gè)人就可以更好地適應(yīng)智能化時(shí)代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢(mèng)想。

除此之外,AIGC還可以為智能化時(shí)代的發(fā)展帶來(lái)許多新的機(jī)遇。首先,AIGC可以幫助人們更好地了解全球公民意識(shí)的重要性,并且更好地參與到全球公民意識(shí)的建設(shè)中來(lái)。這樣,人們就可以更好地理解全球公民意識(shí)的重要性,并且更好地推動(dòng)全球公民意識(shí)的發(fā)展。其次,AIGC還可以通過(guò)智能化的方式來(lái)幫助人們更好地適應(yīng)智能化時(shí)代的發(fā)展。這樣,人們就可以更好地適應(yīng)智能化時(shí)代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢(mèng)想。

總之,AIGC與人工智能技術(shù)一起,為智能化時(shí)代的發(fā)展帶來(lái)了許多新的機(jī)遇。通過(guò)AIGC的幫助,企業(yè)和個(gè)人可以更好地適應(yīng)智能化時(shí)代的發(fā)展,并且更好地實(shí)現(xiàn)自己的夢(mèng)想。同時(shí),AIGC也可以通過(guò)智能化的方式來(lái)推動(dòng)全球公民意識(shí)的發(fā)展,為全球公民意識(shí)的建設(shè)帶來(lái)新的機(jī)遇。因此,我們應(yīng)該更加重視AIGC與人工智能技術(shù)的發(fā)展,為智能化時(shí)代的發(fā)展做出更大的貢獻(xiàn)。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46368

    瀏覽量

    236546
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5439

    瀏覽量

    120794
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1526

    瀏覽量

    7259
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    338

    瀏覽量

    1449
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過(guò)技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來(lái)的可持續(xù)發(fā)展提供了強(qiáng)大的支持。 首先,書(shū)中通過(guò)深入淺出的語(yǔ)言,介紹了人工智能在能源領(lǐng)域的基本概念和
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    閱讀這一章后,我深感人工智能與生命科學(xué)的結(jié)合正引領(lǐng)著一場(chǎng)前所未有的科學(xué)革命,以下是我個(gè)人的讀后感: 1. 技術(shù)革新與生命科學(xué)進(jìn)步 這一章詳細(xì)闡述了人工智能如何通過(guò)其強(qiáng)大的數(shù)據(jù)處理和分析
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過(guò)機(jī)器學(xué)習(xí)深度學(xué)習(xí)等先進(jìn)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    人工智能推薦系統(tǒng)中強(qiáng)大的圖形處理器(GPU)一爭(zhēng)高下。其獨(dú)特的設(shè)計(jì)使得該處理器在功耗受限的條件仍能實(shí)現(xiàn)高性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開(kāi)發(fā)的分層學(xué)習(xí)處理
    發(fā)表于 09-28 11:00

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元這一主題,凸顯了動(dòng)態(tài)海外住宅IP技術(shù)全球化網(wǎng)絡(luò)環(huán)境中的重要作用。
    的頭像 發(fā)表于 09-27 08:30 ?205次閱讀

    RISC-V在中國(guó)的發(fā)展機(jī)遇有哪些場(chǎng)景?

    : 1. 物聯(lián)網(wǎng)(IoT) 市場(chǎng)需求:隨著物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,對(duì)低功耗、高性能、低成本的處理器需求日益增長(zhǎng)。RISC-V因其指令集精簡(jiǎn)、易于擴(kuò)展的特點(diǎn),非常適合物聯(lián)網(wǎng)設(shè)備的需求。 中國(guó)優(yōu)勢(shì):中國(guó)是
    發(fā)表于 07-29 17:14

    FPGA在人工智能中的應(yīng)用有哪些?

    定制的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還
    發(fā)表于 07-29 17:05

    人工智能深度學(xué)習(xí)的五大模型及其應(yīng)用領(lǐng)域

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)特別是深度學(xué)習(xí)在各個(gè)領(lǐng)域展現(xiàn)出了強(qiáng)大的潛力和廣泛的應(yīng)用價(jià)值。深度
    的頭像 發(fā)表于 07-03 18:20 ?3016次閱讀

    基于 Serverless 技術(shù)AIGC 應(yīng)用探究

    隨著人工智能與圖形計(jì)算的融合,AIGC(Artificial Intelligence and Graphics Computing)技術(shù)發(fā)展
    的頭像 發(fā)表于 05-10 00:29 ?1089次閱讀
    基于 Serverless <b class='flag-5'>技術(shù)</b>的 <b class='flag-5'>AIGC</b> 應(yīng)用探究

    嵌入式人工智能的就業(yè)方向有哪些?

    于工業(yè)、農(nóng)業(yè)、醫(yī)療、城市建設(shè)、金融、航天軍工等多個(gè)領(lǐng)域。在新時(shí)代發(fā)展背景,嵌入式人工智能已是大勢(shì)所趨,成為當(dāng)前最熱門(mén)的AI商業(yè)途徑之一。
    發(fā)表于 02-26 10:17

    aigc是什么意思和人工智能有什么區(qū)別

    AIGC人工智能通用計(jì)算平臺(tái)(Artificial Intelligence General Computing)的縮寫(xiě),它是一種集成了人工智能技術(shù)與通用
    的頭像 發(fā)表于 01-11 09:49 ?9594次閱讀

    焊縫跟蹤未來(lái):人工智能與機(jī)器學(xué)習(xí)的影響

    隨著科技的不斷進(jìn)步,焊接行業(yè)也在迎來(lái)一場(chǎng)革命性的變革。焊縫跟蹤技術(shù),作為焊接領(lǐng)域的關(guān)鍵創(chuàng)新之一,正在經(jīng)歷著人工智能和機(jī)器學(xué)習(xí)引領(lǐng)迎來(lái)更加
    的頭像 發(fā)表于 12-12 11:51 ?416次閱讀

    人工智能服務(wù)器高性能計(jì)算需求

    人工智能(AI)服務(wù)器是一種專門(mén)為了運(yùn)行人工智能應(yīng)用和提供大數(shù)據(jù)處理能力而設(shè)計(jì)的高性能計(jì)算機(jī)。它既可以支持本地應(yīng)用程序和網(wǎng)頁(yè),也可以為云和本地服務(wù)器提供復(fù)雜的AI模型和服務(wù)。
    的頭像 發(fā)表于 12-08 09:44 ?448次閱讀

    深度學(xué)習(xí)人工智能中的 8 種常見(jiàn)應(yīng)用

    深度學(xué)習(xí)簡(jiǎn)介深度學(xué)習(xí)人工智能(AI)的一個(gè)分支,它教神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推理。近年來(lái),它解決復(fù)雜問(wèn)題
    的頭像 發(fā)表于 12-01 08:27 ?3109次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在<b class='flag-5'>人工智能</b>中的 8 種常見(jiàn)應(yīng)用