0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中國AI長卷(三):算法生根

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-08-06 09:27 ? 次閱讀
wKgaomawyy6AC9h6AAmra8nyJe8492.jpg

“中美AI差距究竟有幾年?”這個問題困擾了不少人,也有很多聲音嘗試將中美AI實力進行比較。其中,算法,一定是評判的首要標準。

中美AI算法究竟是什么水平?我們可以用“第七個燒餅”來理解。

ChatGPT就是AI的“第七個燒餅”。深度學習算法的熱潮持續(xù)了十多年,終于在LLM(大語言模型)智能涌現(xiàn)之后,看到了實現(xiàn)通用人工智能的曙光。就像一個饑餓的人,連續(xù)吃了六個燒餅都沒吃飽,直到吃完了第七個燒餅,終于覺得飽了。

OpenAI為代表的美國企業(yè),在底層研發(fā)和核心算法上占據(jù)領(lǐng)先地位,率先吃到了LLM的“第七個燒餅”。隨后,中國也極速跟進了這個領(lǐng)域,很快推出了對標ChatGPT、GPT-4水平的算法模型。

對此,有人欣慰:咱們雖然晚了一步,但也吃到了“第七塊燒餅”(中國沒有錯過大模型的機會)。

有人憤怒:這一次技術(shù)突破又是美國公司主導,它們肚子里可比我們多好幾塊燒餅呢(美國領(lǐng)先我們至少十年)。

有人迷惑:早知道吃第七個燒餅就能飽,前面六個都不應該買(大模型之前的智能化探索全都白干了)。

還有人質(zhì)疑:中國根本沒有能力做燒餅,能吃上是因為別的攤主公開了做燒餅配方(谷歌Transformer、OpenAI GPT-1/GPT-2都是開源的)。

以上不同的情緒,有各自的道理,源于對算法的認知不同。

《終極算法》一書的作者寫道:在農(nóng)業(yè)中,人類進行播種,確保種子有足夠的水分和營養(yǎng),然后收割成熟的作物,而這也是機器學習的承諾。算法是種子,數(shù)據(jù)是土壤,程序是成熟的作物。

算法,就是將大規(guī)模數(shù)據(jù)轉(zhuǎn)換成更合理、更智能決策的復雜程序,模型是它的軟件形態(tài)。算法模型,是AI產(chǎn)學界最重要的“收成”。

從這個角度看,簡單對比中美誰先拿下ChatGPT,其實并沒有太大意義。大眾真正關(guān)心的,是中國有沒有讓算法這顆“種子”播種、生根、成長、結(jié)果的能力,能不能確保中國接下來吃到新算法的第八塊、第九塊……乃至第N塊 “燒餅”,持續(xù)滿足各行各業(yè)享用AI的需求?

要搞清楚這個問題,我們得回到第三次AI浪潮的肇始,回到深度學習算法這顆“種子”剛剛萌芽的時候,看它是如何在中國落地生根的。

wKgZomawyzOARiCjAAJVJOAtPA4732.jpg

今天我們已經(jīng)知道,深度學習是聯(lián)結(jié)學派的主算法,主導了第三次AI浪潮。

可問題是,深度學習并不是在2011年才橫空出世的概念。早在20世紀40-60年代,深度學習的雛形就出現(xiàn)在控制論中。訓練多層神經(jīng)網(wǎng)絡(luò)的關(guān)鍵技術(shù)反向傳播算法,是1986年提出的。聯(lián)結(jié)學派,在2006年開始復興。

那為什么,深度學習在2011年左右,才正式掀起了AI的新高潮呢?

背后有三個要素,構(gòu)成了深度學習“種子萌芽”的土壤:

  1. 越來越多的數(shù)據(jù)量。深度學習算法的中心思想,就是將大量計算單元連接在一起來實現(xiàn)智能行為,這個多層神經(jīng)網(wǎng)絡(luò)就類似于大腦的神經(jīng)元,依靠大數(shù)據(jù)進行學習和訓練,而互聯(lián)網(wǎng)、智能手機提供了較好的數(shù)據(jù)基礎(chǔ),2011年谷歌大腦成功識別了一只貓,2012年蘋果推出了Siri,成為深度學習算法的先行者。

2.越來越低的錯誤率,或者說越來越好的模型效果。2012年,多層神經(jīng)網(wǎng)絡(luò)Alex Net在ImageNet 大型視覺識別挑戰(zhàn)(ILSVRC)中獲得冠軍,并大幅超越了使用傳統(tǒng)機器學習算法的第二名,此后,深度學習每年都贏,證明了該算法的有效性。

3.越來越多的成功應用,深度學習這逐步成為主導算法,被工業(yè)界用來解決很多實際問題,與上一代智能產(chǎn)品和應用相結(jié)合,讓一度停滯不前的語音識別、圖像識別、NLP等任務都得到了提高。

大數(shù)據(jù)、技術(shù)能力、智能產(chǎn)品,當時在中國,具備讓深度學習萌芽的條件嗎?有兩股力量可以。一是以BAT為代表的互聯(lián)網(wǎng)公司,一是科大訊飛為代表的早期AI公司。

BAT為代表的中國互聯(lián)網(wǎng)公司,擁有海量數(shù)據(jù)以及國際化視野與人才團隊,同時有搜索、語音、電商等數(shù)字化業(yè)務與應用,擁抱深度學習這一新算法是必然。

2010年,百度成立自然語言處理部,由現(xiàn)任CTO王海峰帶領(lǐng),開始在語言與知識技術(shù)上布局,提出了“自然語言立足中國、面向世界一流水平”的定位。2012年,百度積極關(guān)注并接觸深度學習領(lǐng)域的領(lǐng)軍人物Geoffrey Hinton,并于2013年建立了IDL深度學習研究院,2014年又成立了大數(shù)據(jù)實驗室BDL、硅谷人工智能實驗室SVAIL。除此之外,騰訊也在2012年成立了優(yōu)圖實驗室,阿里巴巴成立了iDST(數(shù)據(jù)科學與技術(shù)研究院)。

另一支探索路線,則是科大訊飛為代表的早期AI公司。

這些公司大多是中國在智能領(lǐng)域的早期探索者,比如科大訊飛成立于1999年,創(chuàng)始人團隊主要來自中科大電子工程系人機語音通信實驗室。

在2011年之前,科大訊飛就以智能語音技術(shù)為核心,進行了一系列技術(shù)、產(chǎn)品探索,比如科大訊飛聯(lián)合高校開發(fā)的復雜語音合成、語音識別引擎,就打破了海外廠商的壟斷,其語音軟件在教育、電信、金融、學習機等領(lǐng)域都有商用。隨著深度學習算法在國際上嶄露鋒芒,科大訊飛有意愿、有能力、有場景,將深度學習與原有的智能語音業(yè)務相融合。在2011年上線了中文語音識別DNN系統(tǒng),2014年啟動了“訊飛超腦計劃”,探索讓“計算機能理解會思考”的感知智能和認知智能。

2023年,面對“中國何時能有類ChatGPT”“中美AI技術(shù)代差十年、三十年”的焦慮情緒, BAT、科大訊飛等企業(yè)作為中國大模型的第一梯隊,很快帶來了文心、混元、通義、星火等基礎(chǔ)大模型。當然不是靠摘開源的“果子”,而是深度學習算法的“種子”,萌芽之初,就扎根在中國AI的土地上,并持續(xù)生長。

wKgaomawyzWAf-a5AAHnw2pWsJw467.jpg

深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像識別和其他視覺任務中的突出表現(xiàn),拉開了AI 1.0階段的帷幕。

具體來說,此前傳統(tǒng)的機器學習算法,雖然識別的精度和準確率也在提升,但始終無法同時保證準確率和識別效率,難以達到應用規(guī)模。而卷積神經(jīng)網(wǎng)絡(luò)CNN由于參數(shù)共享和稀疏連接,非常適合處理圖像數(shù)據(jù),在大規(guī)模圖像數(shù)據(jù)上訓練得到的深度卷積神經(jīng)網(wǎng)絡(luò)模型,可以不斷從底層特征中提取更高層的特征(機器看得懂),最終更好地進行下游任務的處理(機器看得到)。

CNN為核心技術(shù),在圖像識別、目標檢測、圖像分割、圖像生成等算法方面,帶來了極大的進步。2014年,香港中文大學團隊讓機器在人臉識別任務上的表現(xiàn)第一次超越了人類,被認為AI 1.0階段的里程碑事件。

疊加智慧城市、智能安防等概念的興趣,CV計算機視覺飛速發(fā)展,成為深度學習最成功的應用領(lǐng)域。

這一階段,沐浴在新算法春風中茁壯成長的,自然就是CV企業(yè)。

2014-2017三年間,曠視科技、商湯科技、依圖科技、云從科技相繼成立,依托于領(lǐng)先的計算機視覺技術(shù),成為行業(yè)領(lǐng)導者和資本市場的寵兒,估值迅速上升,成為大家熟知的“CV四小龍”。它們的算法模型,被廣泛應用在城市、安防、醫(yī)療影像、工業(yè)質(zhì)檢等領(lǐng)域。

當然,除CV之外,我們也不能忽略深度學習算法在NLP、語音、自動駕駛等多個領(lǐng)域中的進展,給許多行業(yè)帶來了發(fā)展動力。

比如長短期記憶網(wǎng)絡(luò)LSTM大幅提高了語音識別的準確性,智能助手在這一時期內(nèi)得到了顯著的性能提升,海外的蘋果Siri、谷歌Google Assistant、亞馬遜Alexa、微軟Cortana等,國內(nèi)的百度小度、阿里天貓精靈等,被集成到多種智能終端軟硬件當中,并開啟了以語音交互為核心的智能家居元年。

自然語言處理方面,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和LSTM被應用于語言模型、情感分析、機器翻譯等NLP任務。比如,這一階段的機器翻譯,就從統(tǒng)計機器翻譯(SMT)進入到NWT神經(jīng)機器翻譯時代,可以說是翻天覆地,中國的BAT(百度、阿里、騰訊)、科大訊飛、搜狗等公司,都在各自的產(chǎn)品中部署了NWT,大幅提升了在線翻譯的連貫性、準確性和語感。

同時,深度學習還可以在感知和決策方面,為自動駕駛汽車提供支持,吸引了很多投資基金的興趣,進入了快速發(fā)展的黃金時期。百度在2013年啟動了自動駕駛汽車項目,2017年推出了Apollo平臺,并出現(xiàn)了小馬智行等一批面向L4自動駕駛技術(shù)的初創(chuàng)公司。

總的來看,AI 1.0階段,深度學習算法取代了傳統(tǒng)機器學習算法,成為這一階段的主算法,為很多領(lǐng)域的AI任務帶來了跨越式發(fā)展。

但這一階段的算法模型開發(fā),仍是“手工作坊模式”,坊間戲稱“有多少人工就有多少智能”。依靠對大量數(shù)據(jù)的依賴,需要組建龐大的標注團隊,模型泛化性不足,專為某個特定任務而設(shè)計,需要投入開發(fā)人員進行大量重復開發(fā)和手工迭代優(yōu)化等。

從“手工業(yè)作坊”到“工業(yè)化AI工廠”,算法仍需一場嬗變。

wKgaomawyzeAFLvYAAJA_NdQgeg964.jpg

凱文凱利說過,技術(shù)帶來的問題,只能靠技術(shù)進步來解決,算法也不例外。

從AI開發(fā),從過去的手工作坊式向工業(yè)化升級,預訓練模型就是一條可以規(guī)?;a(chǎn)高性能AI模型的“工業(yè)生產(chǎn)線”。

2017年,谷歌在論文《Attenlion is All You Needs》提出了Transformer架構(gòu)。沒有使用上一階段流行的卷積神經(jīng)網(wǎng)絡(luò)CNN、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN、長短期記憶網(wǎng)絡(luò)LSTM、GRU等結(jié)構(gòu),僅使用了自注意(Self-attention)特性,引入了注意力機制和預訓練模型(PTM)。在機器翻譯、機器閱讀、自動問答、情緒分析、自動摘要、語言建模等場景,顯現(xiàn)出了前所未有的能力。2018年,基于Transformer架構(gòu)的預訓練語言模型BERT,刷新了11項 NLP任務的最優(yōu)性能紀錄。同年,OpenAI推出了GPT-1。

基于Transformer架構(gòu)的預訓練模型,可以通過模型的預先訓練,帶來效果更好、質(zhì)量更高的算法模型,下游只需要任務微調(diào)就能應用。這種“預制菜”一樣的“工業(yè)化模式”,一改小模型定制的積弊,讓大規(guī)模、可復制的AI應用成為可能,成為AI去往下一個時代的必經(jīng)之路。

邁向預訓練模型的這條路上,中國幾乎與世界一流水平同步,得益于一個關(guān)鍵變化:云智合流。

打造預訓練模型,最困難的一項,就是專用算力不足,有的學校甚至買不起GPU卡,沒有AI算力用。同時,這一階段很多政企用戶加速上云,也希望智能化升級,以更便捷的方式獲取算法能力。

幸好,在這個算法更迭的關(guān)鍵窗口期,云+AI的融合基礎(chǔ)設(shè)施,已經(jīng)在建設(shè)中。

2017年,將AI技術(shù)作為核心能力的華為云誕生。2018年,百度云更名為百度智能云,阿里云升級為阿里云智能。將AI引入公有云的能力版圖,成為主流。

云智合流,讓AI開發(fā)從“手工業(yè)”邁入到“工業(yè)化”,將原本散落在算法全生命周期中的各類需求,進行了“融合”:

1.算力融合。預訓練模型不僅需要龐大規(guī)模的異構(gòu)算力,而且需要高度的靈活性,從訓練到推理的每個步驟,所需要的算力是差異巨大的。通過云廠商的基礎(chǔ)設(shè)施,企業(yè)可以彈性、靈活、按需取用地接入多樣、充沛的AI算力。獲取算力的方式變得簡單、高效、低門檻了,這就讓更多人參與到AI算法模型的開發(fā)中來,進入大規(guī)模生產(chǎn)階段。

2.流程融合。借助云廠商提供完整、全棧的AI能力和開發(fā)工具,包括預制數(shù)據(jù)集、模型庫、算子庫等,讓企業(yè)和開發(fā)者可以在云上完成從訓練-開發(fā)-推理-部署的全部環(huán)節(jié)。比如百度智能云的EasyDLBML平臺、華為云的AI開發(fā)生產(chǎn)線ModelArts等。

3.產(chǎn)品融合。時間來到2018年,智慧城市、智慧園區(qū)等都開始追求整體智能,希望構(gòu)建一體化、解決方案式的“AI大腦”,整合算法、芯片、云端算力、框架、網(wǎng)絡(luò)、IoT等軟硬件,實現(xiàn)智慧決策能力的質(zhì)變。這種情況下,云廠商和AI企業(yè)都要把自己變成一個“AI超市”,集成并供應豐富的AI技術(shù)能力與應用,讓行業(yè)用戶和開發(fā)者可以體系化、輕松地,獲取到所需要的AI能力。

比如百度智能云率先在業(yè)界提出了“云智一體,深入產(chǎn)業(yè)”的主張,發(fā)布了200多款產(chǎn)品和數(shù)十個解決方案,將百度AI技術(shù)釋放到金融、物流、工業(yè)、農(nóng)業(yè)等多個行業(yè)。華為云在2021年啟動盤古大模型,并在2022年聚焦行業(yè)應用落地,基于盤古大模型的通用能力,打造了盤古氣象大模型、盤古礦山大模型、盤古電力大模型、盤古藥物分子大模型等。

可以說,云智合流,為中國AI跟上ChatGPT的大模型路線,奠定了基礎(chǔ)。

2023年以來,在海外算力形勢愈發(fā)嚴峻的背景下,國產(chǎn)預訓練大模型依然實現(xiàn)了“井噴”,在文本處理、圖像生成、音視頻生成、多模態(tài)等各個任務中,都完成了占位。放眼全球,唯有中美這兩棵繁茂的AI“榕樹”。

讓深度學習算法的這顆“種子”,在中國扎根、生長、成熟,這本身就是一種能力的自證。

回顧深度學習的十多年歷程,或許某一種具體的算法會被更新更好的算法所取代,但這個雨打風吹、反復更替的過程,也讓中國AI在時光中變得愈發(fā)堅韌,積蓄了經(jīng)驗、匯聚了人才、釋放了信心。

只要根深蒂固,任爾東西南北風,中國AI都能在每一次技術(shù)趨勢中,生長出新的枝丫,結(jié)出產(chǎn)業(yè)期待的果實。

wKgaomawyzmAYmRdAAGOyJ70RGc054.jpg
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4573

    瀏覽量

    92333
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29347

    瀏覽量

    267630
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    586

    瀏覽量

    13464
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1009

    瀏覽量

    6343
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1523

    瀏覽量

    7247
收藏 人收藏

    評論

    相關(guān)推薦

    AI降噪算法的USB麥克風降噪模組

    AI
    深圳德宇科技有限公司
    發(fā)布于 :2024年09月26日 11:34:09

    中國AI長卷(二):框架立基

    AI框架可以看到,更強的產(chǎn)業(yè)化能力,就是中國AI的底色
    的頭像 發(fā)表于 07-24 12:27 ?2495次閱讀
    <b class='flag-5'>中國</b><b class='flag-5'>AI</b><b class='flag-5'>長卷</b>(二):框架立基

    中國AI長卷(一):大國重算

    AI為沃土,智算是長城
    的頭像 發(fā)表于 07-23 10:51 ?1198次閱讀
    <b class='flag-5'>中國</b><b class='flag-5'>AI</b><b class='flag-5'>長卷</b>(一):大國重算

    旗晟機器人智慧AI算法#人工智能

    AI算法
    jf_57022734
    發(fā)布于 :2024年07月18日 17:44:48

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    成了一把雙刃劍,其銳利的一面正逐漸指向我們的核心價值。面對這些挑戰(zhàn),制定一套有效的AI治理框架和隱私保護機制變得迫在眉睫。 確保AI決策的透明度是解決這些問題的關(guān)鍵一步。透明度不僅要求公開算法的運作
    發(fā)表于 07-16 15:07

    ai大模型和算法有什么區(qū)別

    AI大模型和算法是人工智能領(lǐng)域的兩個重要概念,它們在很多方面有著密切的聯(lián)系,但同時也存在一些明顯的區(qū)別。 定義和概念 AI大模型通常是指具有大量參數(shù)和復雜結(jié)構(gòu)的人工智能模型,它們能夠處理和解決各種
    的頭像 發(fā)表于 07-16 10:09 ?1185次閱讀

    AI 大模型,中國如何贏,Haivivi嘗試給出答案

    這道題,國家、企業(yè)和個人必須回答。 在中美兩國均把AI作為國家重要戰(zhàn)略方向之一的背景下,未來一段時間內(nèi),中美之間將展開AI主導權(quán)的爭奪。 從現(xiàn)狀來看,中美AI建設(shè)各有優(yōu)勢。 美國的主要優(yōu)勢在于核心
    的頭像 發(fā)表于 07-02 09:42 ?243次閱讀

    主流邊緣AI算法,在安防、零售、交通等領(lǐng)域的應用

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)邊緣AI,是在邊緣設(shè)備部署AI算法,其計算發(fā)生在靠近用戶和數(shù)據(jù)的網(wǎng)絡(luò)邊緣,而不是集中在云計算設(shè)施或私人數(shù)據(jù)中心。邊緣AI離不開邊緣算力和
    的頭像 發(fā)表于 05-13 01:56 ?2755次閱讀

    risc-v多核芯片在AI方面的應用

    RISC-V多核芯片在AI方面的應用主要體現(xiàn)在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設(shè)計實現(xiàn),其內(nèi)核面積更小,功耗更低,使得它能
    發(fā)表于 04-28 09:20

    炬芯科技趙新中:無線音頻SoC的AI算法未來和應用

    的平臺。 炬芯科技算法研發(fā)中心高級總監(jiān)趙新中受邀出席,于電聲元器件及芯片專題論壇發(fā)表以《無線音頻SoC的AI算法未來和應用》為主題的演講,分享了炬芯科技的音頻AI
    的頭像 發(fā)表于 04-10 11:13 ?409次閱讀
    炬芯科技趙新中:無線音頻SoC的<b class='flag-5'>AI</b><b class='flag-5'>算法</b>未來和應用

    NanoEdge AI的技術(shù)原理、應用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在將人工智能算法應用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響

    數(shù)據(jù)語料庫、算法框架和算力芯片的確是影響AI大模型發(fā)展的大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?842次閱讀

    面對Sora,中國AI可以不急不躁不焦慮

    AISora
    腦極體
    發(fā)布于 :2024年02月23日 00:51:52

    AI算法在燃氣站的工作原理,安全帽、抽煙、打電話檢測的具體應用,如何利用AI提升安全水平

    AI算法在燃氣站安全管理中的應用,包括煙火檢測、安全帽識別、抽煙、打電話檢測等方面的工作原理。AI算法助力燃氣站安全管理,煙火檢測更精準!
    的頭像 發(fā)表于 12-26 21:25 ?541次閱讀

    什么是邊緣計算盒子(AI算法盒子)?

    邊緣計算盒子是一種基于邊緣計算和人工智能技術(shù)的智能設(shè)備,它內(nèi)置了靈活可配的多樣化AI算法庫,所以也被稱為AI算法盒子或智能邊緣分析一體機,可以將數(shù)據(jù)處理和分析的能力推至離數(shù)據(jù)源最近的邊
    的頭像 發(fā)表于 10-31 14:29 ?2428次閱讀
    什么是邊緣計算盒子(<b class='flag-5'>AI</b><b class='flag-5'>算法</b>盒子)?