0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯來(lái)科技正式發(fā)布首款專(zhuān)用處理器產(chǎn)品線Nuclei Intelligence系列

芯來(lái)科技 ? 來(lái)源:芯來(lái)科技 ? 2024-02-26 10:15 ? 次閱讀

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來(lái)科技正式發(fā)布首款針對(duì)人工智能應(yīng)用的專(zhuān)用處理器產(chǎn)品線Nuclei Intelligence(NI)系列,以及NI系列的第一款AI專(zhuān)用RISC-V處理器CPU IP——NI900系列內(nèi)核。

隨著Chatgpt的橫空出世,全球掀起一股AI的浪潮,從云端數(shù)據(jù)中心到邊緣側(cè)對(duì)AI的需求進(jìn)一步提升。AI應(yīng)用主要分布在訓(xùn)練和推理,需要大量的并行計(jì)算和NPU來(lái)完成,更離不開(kāi)高性能CPU的算力加持。CPU有著廣泛的普及性、兼容性、可擴(kuò)展性和可靠性,并通過(guò)多核多節(jié)點(diǎn)進(jìn)行串行計(jì)算、混合計(jì)算和安全防護(hù)等復(fù)雜任務(wù);除此之外,CPU的通用矢量(Vector)指令集也可以提供強(qiáng)大且通用的并行計(jì)算能力,在AI領(lǐng)域進(jìn)行高效的并行計(jì)算、前處理、后處理、激活函數(shù)等工作,更加靈活地處理GPU和NPU相對(duì)難以處理的復(fù)雜計(jì)算任務(wù)。

近期OpenAI發(fā)布的Sora模型將AI能夠理解和生成的內(nèi)容模態(tài)從文字和圖片拓展到視頻,進(jìn)一步證明基礎(chǔ)模型能力上限不斷被突破,想象空間被打開(kāi),對(duì)算力基礎(chǔ)設(shè)施的需求也遠(yuǎn)沒(méi)有停止。芯來(lái)科技此次推出的NI900重點(diǎn)布局AI應(yīng)用場(chǎng)景,助力本土芯片設(shè)計(jì)公司快速完成AI產(chǎn)品的設(shè)計(jì)。

NI900基于900系列處理器,針對(duì)“AI應(yīng)用”進(jìn)行了多項(xiàng)特性?xún)?yōu)化

基礎(chǔ)標(biāo)量處理器:

可以配置為900系列的RV32或RV64的任何一款N900、U900、NX900、UX900。

RVV1.0 VPU: 可配置基于RISC-V V Extension(RVV1.0 Vector指令集)的VPU單元,VPU的VLEN可配置為512-bit或者1024-bit。在INT8數(shù)據(jù)類(lèi)型下對(duì)性能帶來(lái)的提升達(dá)數(shù)百倍;在INT32與FP32數(shù)據(jù)類(lèi)型下對(duì)性能帶來(lái)的提升達(dá)數(shù)十倍。 NPU加速器:

可通過(guò)NI900的IOCP(IO Coherent Port)與處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性。

用戶(hù)自定義指令擴(kuò)展接口: 用戶(hù)可以使用Nuclei的NICE硬件擴(kuò)展接口,增加自己自定義的指令,包括Scalar或Vector指令。

100a9910-d445-11ee-a297-92fbcf53809c.png

NI900支持RISC-VVector1.0標(biāo)準(zhǔn)

矢量擴(kuò)展被稱(chēng)之為RV指令集標(biāo)準(zhǔn)最重要的一組擴(kuò)展,2015年發(fā)起,2021年正式生成標(biāo)準(zhǔn)。

RVV 1.0支持的數(shù)據(jù)類(lèi)型廣泛,運(yùn)算類(lèi)型豐富且可動(dòng)態(tài)擴(kuò)展,同一套指令可無(wú)修改適配各種微架構(gòu)實(shí)現(xiàn)。

RISC-V GCC從10.2版本已經(jīng)支持RVV1.0指令,目前GCC13對(duì)應(yīng)的intrinsic API接口已經(jīng)升級(jí)到最新v0.12版本,且已部分支持自動(dòng)向量化;預(yù)計(jì)GCC14正式發(fā)布,GCC的自動(dòng)向量化會(huì)更加完備。RISC-V CLANG17版本也已支持最新v0.12版本intrinsic APl, 支持自動(dòng)向量化。

RISC-V Linux 5.18 版本開(kāi)始支持RVV,其它各種計(jì)算庫(kù)及應(yīng)用中間件都快速支持了RVV1.0。

有了RVV1.0標(biāo)準(zhǔn)和軟件生態(tài)的完備,為應(yīng)對(duì)AI算力的需求,需要RISC-V CPU 在微架構(gòu)設(shè)計(jì)上做更多有針對(duì)性的設(shè)計(jì)。

NI900擁有強(qiáng)大的并行計(jì)算能力

RVV參數(shù)描述:

VLEN:一個(gè)向量寄存器的總bit數(shù)(寬度)

DLEN:內(nèi)部運(yùn)算單元能夠并行處理的一個(gè)向量元素的最大bit數(shù)

ELEN:并行處理的數(shù)據(jù)類(lèi)型的最大寬度,如果ELEN=32,則最大的處理數(shù)據(jù)類(lèi)型是INT32和FP32

可配選項(xiàng) 參數(shù)值
VLEN_512 VLEN=512,DLEN=512,ELEN=32/64
VLEN_1024 VLEN=1024,DLEN=1024,ELEN=32/64

VPU支持的數(shù)據(jù)類(lèi)型和計(jì)算能力:

1024-bit的VPU支持多種數(shù)據(jù)類(lèi)型的計(jì)算,包括:INT8 / 16 / 32 / 64, BFP16 / FP16 / FP32 / FP64。

1024-bit的VPU支持每個(gè)時(shí)鐘完成128x8-bit / 64x16-bit / 32x32-bit / 16x64-bit的數(shù)據(jù)計(jì)算

NI900擁有強(qiáng)大的Memory讀寫(xiě)能力

10487c08-d445-11ee-a297-92fbcf53809c.png ?

VPU和CoreLSU共享MMU資源

VPU并非獨(dú)立的協(xié)處理器,而是與主Core的內(nèi)存空間實(shí)現(xiàn)完全的Coherent

Vector指令與普通Scalar一樣,支持虛擬地址訪問(wèn),使得NI900的Vector指令可以無(wú)縫運(yùn)行于大型操作系統(tǒng)之上

VPU和CoreLSU共享Memory資源與通道

VPU擁有最高512-bit位寬直接訪問(wèn)DCache

VPU擁有最高1024-bit位寬直接訪問(wèn)DLM

DLM具備1024-bit的SlavePort供SoC訪問(wèn)

可單獨(dú)配置VLMport以進(jìn)一步增加性能

VLMport可以直接連接到外部加速器或者內(nèi)存

VLMport位寬=VLEN(目前支持最多1024-bit)

ScalarCore也可以通過(guò)LoadStore訪問(wèn)到VLM區(qū)間

NI900的VPU帶來(lái)極大的性能提升

通過(guò)強(qiáng)大的運(yùn)算能力與強(qiáng)勁的Memory讀寫(xiě)通道,NI900能帶來(lái)極大的并行計(jì)算性能提升。

如圖所示,VLEN=1024-bit的VPU在INT8數(shù)據(jù)類(lèi)型下對(duì)性能帶來(lái)的提升達(dá)數(shù)百倍

105ec1b6-d445-11ee-a297-92fbcf53809c.png

106eb986-d445-11ee-a297-92fbcf53809c.png ? 107f51a6-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=1024-bit的VPU在INT32數(shù)據(jù)類(lèi)型下對(duì)性能帶來(lái)的提升達(dá)數(shù)十倍

1091366e-d445-11ee-a297-92fbcf53809c.png

10a53948-d445-11ee-a297-92fbcf53809c.png

10b91e40-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=512-bit的VPU在FP32數(shù)據(jù)類(lèi)型下對(duì)性能帶來(lái)的提升達(dá)數(shù)十倍

10d03b0c-d445-11ee-a297-92fbcf53809c.png

10db1720-d445-11ee-a297-92fbcf53809c.png

10e18da8-d445-11ee-a297-92fbcf53809c.png

10f8bf14-d445-11ee-a297-92fbcf53809c.png

NI900支持NPU等AI加速器與處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性

NI900支持整合外部AI加速器、NPU、PCIe、DMA,通過(guò)900系列的IOCP(IO Coherent Port)與900系列處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性。

110b0d86-d445-11ee-a297-92fbcf53809c.png

NI900的Scalar/VectorNICE自定義指令接口提供更多特定場(chǎng)景的優(yōu)化可能性 NICE(Nuclei Instruction Co-unit Extension)是芯來(lái)CPU IP的一種用戶(hù)可擴(kuò)展指令接口機(jī)制,允許用戶(hù)基于芯片的標(biāo)準(zhǔn)通用CPU內(nèi)核定義自己的擴(kuò)展指令集。

NI900提供用于Scalar指令擴(kuò)展的NICE接口,可支持單周期,多周期,流水線等不同指令類(lèi)型

NI900提供用于Vector指令擴(kuò)展的NICE接口,可支持單周期,多周期,流水線等不同指令類(lèi)型

NI900的NICE擴(kuò)展單元不僅可以進(jìn)行運(yùn)算型的自定義指令擴(kuò)展,還可以通過(guò)專(zhuān)用總線訪問(wèn)Core的存儲(chǔ)資源(DCache等)實(shí)現(xiàn)與主Core的內(nèi)存一致性,總線位寬可以達(dá)到VLEN(最高1024-bit)

用戶(hù)可以結(jié)合自己的應(yīng)用擴(kuò)展自定義指令,將NI900處理器內(nèi)核擴(kuò)展成為面向AI領(lǐng)域進(jìn)一步強(qiáng)化的專(zhuān)用處理器。

RISC-V生態(tài)日益成熟,芯來(lái)NI900賦能AI時(shí)代

CPU是算力結(jié)構(gòu)中必不可少的一個(gè)環(huán)節(jié),在已經(jīng)到來(lái)的人工智能算力時(shí)代,通用和專(zhuān)用芯片結(jié)合而成的異構(gòu)計(jì)算是未來(lái)AI算力基礎(chǔ)設(shè)施的主流。芯來(lái)致力于提供標(biāo)量、矢量、以及自定義指令結(jié)合的計(jì)算架構(gòu),以滿(mǎn)足端側(cè)云側(cè)數(shù)據(jù)中心的多元化的算力需求。

目前NI900已經(jīng)獲得多家下游客戶(hù)的認(rèn)可并投入產(chǎn)品設(shè)計(jì)中,未來(lái)芯來(lái)將推出更多NI系列處理器內(nèi)核IP,賦能AI時(shí)代的算力基礎(chǔ)設(shè)施建設(shè)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19028

    瀏覽量

    228441
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46300

    瀏覽量

    236463
  • RISC-V
    +關(guān)注

    關(guān)注

    44

    文章

    2178

    瀏覽量

    45887
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    67

    瀏覽量

    8618
  • 芯來(lái)科技
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    2952

原文標(biāo)題:芯來(lái)科技發(fā)布最新NI系列內(nèi)核,NI900矢量寬度可達(dá)512/1024位

文章出處:【微信號(hào):nucleisys,微信公眾號(hào):芯來(lái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    極海電機(jī)產(chǎn)品線再添新品,APM32M3514系列電機(jī)控制專(zhuān)用SoC正式發(fā)布!

    極海高集成、高性?xún)r(jià)比、高能效的電機(jī)控制專(zhuān)用SoC——APM32M3514系列,現(xiàn)已正式推出,為客戶(hù)電機(jī)系統(tǒng)應(yīng)用設(shè)計(jì)提供高性?xún)r(jià)比的系統(tǒng)集成,更豐富的
    發(fā)表于 10-09 11:09 ?878次閱讀
    極海電機(jī)<b class='flag-5'>產(chǎn)品線</b>再添新品,APM32M3514<b class='flag-5'>系列</b>電機(jī)控制<b class='flag-5'>專(zhuān)用</b>SoC正式<b class='flag-5'>發(fā)布</b>!

    OMAP5912應(yīng)用處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《OMAP5912應(yīng)用處理器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-07 09:16 ?0次下載
    OMAP5912應(yīng)<b class='flag-5'>用處理器</b>數(shù)據(jù)表

    格見(jiàn)發(fā)布基于來(lái)N300系列處理器內(nèi)核的通用型實(shí)時(shí)工業(yè)控制DSP產(chǎn)品

    。GS32F003X系列內(nèi)置的RISC-V內(nèi)核基于來(lái)科技N300系列RISC-V處理器內(nèi)核深度定制,支持500+條RV32基礎(chǔ)/擴(kuò)展指令和
    的頭像 發(fā)表于 08-06 15:56 ?685次閱讀
    格見(jiàn)<b class='flag-5'>發(fā)布</b>基于<b class='flag-5'>芯</b><b class='flag-5'>來(lái)</b>N300<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>內(nèi)核的通用型實(shí)時(shí)工業(yè)控制DSP<b class='flag-5'>產(chǎn)品</b>

    6nm異構(gòu)多核!國(guó)內(nèi)Arm架構(gòu)AI PC處理器P1發(fā)布

    計(jì)算平臺(tái)因此得到了廣泛的關(guān)注?,F(xiàn)在,國(guó)內(nèi)公司也完成了Arm架構(gòu)AI PC處理器“破冰”,開(kāi)始揚(yáng)帆啟航。 ? 7月30日,在以“從此出發(fā)”為主題的此科技AI PC戰(zhàn)略暨
    的頭像 發(fā)表于 08-01 01:21 ?3807次閱讀
    6nm異構(gòu)多核!國(guó)內(nèi)<b class='flag-5'>首</b><b class='flag-5'>款</b>Arm架構(gòu)AI PC<b class='flag-5'>處理器</b>此<b class='flag-5'>芯</b>P1<b class='flag-5'>發(fā)布</b>

    來(lái)集成開(kāi)發(fā)環(huán)境Nuclei Studio 2024.06版本發(fā)布

    為了優(yōu)化Nuclei Studio的在性能調(diào)優(yōu)方面的體驗(yàn),以及引入商業(yè)工具鏈的支持,以及豐富基于Nuclei CPU/SoC IP的軟件生態(tài),讓客戶(hù)和開(kāi)發(fā)者能夠圍繞Nuclei IP做出更完善的RISC-V軟硬件一體化解決方案,
    的頭像 發(fā)表于 07-15 16:15 ?509次閱讀

    來(lái)科技推出1000系列,進(jìn)一步開(kāi)啟了亂序高性能CPU的篇章

    本土RISC-V CPU IP領(lǐng)軍企業(yè)——來(lái)技正發(fā)布基于RISC-V指令集的高性能商業(yè)處理器CPU IP——UX1000
    的頭像 發(fā)表于 03-18 10:02 ?896次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來(lái)</b>科技推出1000<b class='flag-5'>系列</b>,進(jìn)一步開(kāi)啟了亂序高性能CPU的篇章

    來(lái)技正發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案

    本土RISC-V CPU IP領(lǐng)軍企業(yè)——來(lái)技正發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案,提供專(zhuān)業(yè)有效的信息安全保護(hù)以及加解密
    的頭像 發(fā)表于 03-11 11:01 ?1164次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來(lái)</b>科<b class='flag-5'>技正</b>式<b class='flag-5'>發(fā)布</b>基于RISC-V<b class='flag-5'>處理器</b>的HSM子系統(tǒng)解決方案

    來(lái)科技發(fā)布超低功耗嵌入式RISC-V處理器CPU IP—NS100系列內(nèi)核

    本土RISC-V CPU IP領(lǐng)軍企業(yè)——來(lái)技正發(fā)布針對(duì)信息安全的超低功耗嵌入式RISC-V處理器CPU IP——NS100
    的頭像 發(fā)表于 03-04 11:19 ?1090次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來(lái)</b>科技<b class='flag-5'>發(fā)布</b>超低功耗嵌入式RISC-V<b class='flag-5'>處理器</b>CPU IP—NS100<b class='flag-5'>系列</b>內(nèi)核

    5G網(wǎng)絡(luò)優(yōu)化處理器和AI PC搶鏡 英特爾攜三大重磅產(chǎn)品線亮相MWC24

    此次在MWC24上,英特爾帶來(lái)三大旗艦產(chǎn)品線:一、用于網(wǎng)絡(luò)工作負(fù)載的未來(lái)Granite Rapids-D和Sierra Forest處理器;二、幫助運(yùn)營(yíng)商變現(xiàn)其邊緣部署的英特爾邊緣平臺(tái);三、用于商用AI PC的英特爾酷睿Ultra處理器
    的頭像 發(fā)表于 02-29 15:16 ?4212次閱讀
    5G網(wǎng)絡(luò)優(yōu)化<b class='flag-5'>處理器</b>和AI PC搶鏡 英特爾攜三大重磅<b class='flag-5'>產(chǎn)品線</b>亮相MWC24

    來(lái)科技發(fā)布AI專(zhuān)用RISC-V處理器內(nèi)核NI900系列

    在AI技術(shù)迅速發(fā)展的當(dāng)下,RISC-V CPU IP領(lǐng)域的領(lǐng)軍企業(yè)來(lái)科技,正式發(fā)布了針對(duì)人工智能應(yīng)用的專(zhuān)用處理器產(chǎn)品線——
    的頭像 發(fā)表于 02-26 09:36 ?626次閱讀

    邦科技:多項(xiàng)技術(shù)優(yōu)勢(shì)加持,多系列產(chǎn)品線助推芯片國(guó)產(chǎn)化替代

    邦科技在模塊化數(shù)?;旌蟬oc 技術(shù)擁有多項(xiàng)專(zhuān)利和豐富的技術(shù)經(jīng)驗(yàn),至今已自主研發(fā)了基于CISC、RISC-V等指令集架構(gòu)的多款專(zhuān)用處理器。不僅如此,在模擬設(shè)計(jì)方面,針對(duì)強(qiáng)電、電磁波、高低溫、高濕度等復(fù)雜環(huán)境干擾,邦科技自主研發(fā)
    的頭像 發(fā)表于 01-24 17:04 ?821次閱讀

    藍(lán)技正發(fā)布全球「純」3D視覺(jué)移動(dòng)機(jī)器人VMR產(chǎn)品

    基于領(lǐng)先的核心技術(shù)LX-MRDVS?(藍(lán)-移動(dòng)機(jī)器人深度視覺(jué)系統(tǒng)),圍繞SMT貼片自動(dòng)化生產(chǎn),藍(lán)技正發(fā)布全球
    的頭像 發(fā)表于 12-18 11:29 ?751次閱讀

    龍芯中科發(fā)布新一代通用處理器龍芯3A6000

    11月28日,2023龍芯產(chǎn)品發(fā)布暨用戶(hù)大會(huì)在國(guó)家會(huì)議中心如約啟幕。大會(huì)以“到中流擊水”為主題,現(xiàn)場(chǎng)發(fā)布新一代通用處理器龍芯3A6000、打印機(jī)主控芯片龍芯2P0500重磅成果,并對(duì)外
    的頭像 發(fā)表于 11-28 16:08 ?1207次閱讀

    全球!蘋(píng)果發(fā)布3納米制程處理器M3系列

    來(lái)源:滿(mǎn)天 編輯:感知視界 系列芯片,為全球首發(fā)以3納米生產(chǎn)的計(jì)算機(jī)中央處理器(CPU),業(yè)界分析由臺(tái)積電獨(dú)家代工,看好蘋(píng)果新品有望掀起換機(jī)潮,推升臺(tái)積電先進(jìn)制程訂單動(dòng)能持續(xù)強(qiáng)勁。
    的頭像 發(fā)表于 11-02 09:32 ?570次閱讀

    Codasip發(fā)布適用于定制計(jì)算的新一代RISC-V處理器系列產(chǎn)品

    ,以實(shí)現(xiàn)無(wú)限創(chuàng)新。該系列被命名為“700系列”,包括多款應(yīng)用處理器和嵌入式處理器內(nèi)核。700系列通過(guò)引入一個(gè)不同的、可滿(mǎn)足更高性能需求的出發(fā)
    發(fā)表于 10-24 17:25 ?499次閱讀
    Codasip<b class='flag-5'>發(fā)布</b>適用于定制計(jì)算的新一代RISC-V<b class='flag-5'>處理器</b><b class='flag-5'>系列產(chǎn)品</b>