0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm公司正式發(fā)布了該公司的新一代Armv9架構(gòu)的首個(gè)細(xì)節(jié)

旺材芯片 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2021-04-13 14:45 ? 次閱讀

Arm在2011年10月首次發(fā)布Armv8架構(gòu)以來,已經(jīng)過去了近十年的時(shí)間。這對Arm來說是一個(gè)相當(dāng)可觀的十年,因?yàn)樵谶@段時(shí)間內(nèi),他們的指令集架構(gòu)受到移動(dòng)市場和服務(wù)器市場的高度關(guān)注,并鉚足勁在包括筆記本電腦和臺(tái)式機(jī)設(shè)備市場發(fā)力。過去多年里,Arm對ISA進(jìn)行了改進(jìn),也對體系結(jié)構(gòu)進(jìn)行了各種更新和擴(kuò)展。當(dāng)中一些可能很重要,有些可能也是一瞥而過。

d179c9fa-9536-11eb-8b86-12bb97331649.png

今天,作為Arm的Vision Day活動(dòng)的一部分,該公司正式發(fā)布了該公司的新一代Armv9架構(gòu)的首個(gè)細(xì)節(jié),為Arm未來十年內(nèi)成為下一個(gè)3000億芯片的計(jì)算平臺(tái)奠定了基礎(chǔ)。

d18db73a-9536-11eb-8b86-12bb97331649.png

讀者可能會(huì)問的一個(gè)大問題是,Armv9與Armv8究竟有何不同,能讓架構(gòu)獲得如此大的提升。確實(shí),從純粹的ISA角度來看,v9可能不像v8相比v7那樣實(shí)現(xiàn)根本性的跳躍,后者引入了AArch64,一個(gè)完全不同的執(zhí)行模式和指令集,該指令集與AArch32相比具有更大的微體系結(jié)構(gòu)分支,例如擴(kuò)展寄存器,64位虛擬地址空間和更多改進(jìn)。

Armv9繼續(xù)使用AArch64作為基準(zhǔn)指令集,但是在其功能上增加了一些非常重要的擴(kuò)展,以保證architecture numbering的增加,并且允許Arm不僅可以獲得對AArch64進(jìn)行某種軟件重新基準(zhǔn)化v9的新功能,還能保持我們多年來在v8上獲得的擴(kuò)展。

Arm認(rèn)為新架構(gòu)Armv9有三個(gè)主要支柱,即安全性、AI以及改進(jìn)的矢量和DSP功能。對于v9,安全性是一個(gè)非常重要的主題,我們將深入探討新擴(kuò)展和功能的新細(xì)節(jié),但是首先談到的DSP和AI功能應(yīng)該很簡單。

d1acd28c-9536-11eb-8b86-12bb97331649.png

新的Armv9兼容CPU所承諾的最大的新功能可能是開發(fā)人員和用戶可以立即看到的——SVE2作為NEON的后繼產(chǎn)品。

可伸縮矢量擴(kuò)展(SVE)的于2016年首次亮相,并首次在富士通的A64FX CPU內(nèi)核中實(shí)現(xiàn),該芯片已為日本排名第一的超級計(jì)算機(jī)Fukagu提供支持。SVE的問題在于,新的可變矢量長度SIMD指令集的第一次迭代的范圍相當(dāng)有限,并且更多地針對HPC工作負(fù)載,缺少了許多仍由NEON涵蓋的更通用的指令。

SVE2于2019年4月發(fā)布,旨在通過用所需指令補(bǔ)充新的可擴(kuò)展SIMD指令集來解決此問題,以服務(wù)于類似DSP等目前仍在使用NEON的工作負(fù)載。

除了增加的各種現(xiàn)代SIMD功能外,SVE和SVE2的優(yōu)勢還在于其可變的向量大小,范圍覆蓋了128b到2048b,讓其無論在什么硬件運(yùn)行,都允許向量的可變粒度為128b。如果純粹從向量處理和編程的角度來看,這意味著軟件開發(fā)人員將只需要編譯一次其代碼,并且如果將來某個(gè)CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個(gè)寬度。同樣,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的保守設(shè)計(jì)上運(yùn)行,這對于Arm設(shè)計(jì)從物聯(lián)網(wǎng)、移動(dòng)到數(shù)據(jù)中心的CPU而言至關(guān)重要。在保留Arm體系結(jié)構(gòu)的32b編碼空間的同時(shí),它還可以完成所有這些工作。然而類似X86這樣的架構(gòu)則需要根據(jù)矢量尺寸增加新的指令和擴(kuò)展。

d2108520-9536-11eb-8b86-12bb97331649.png

機(jī)器學(xué)習(xí)也被視為Armv9的重要組成部分,因?yàn)锳rm認(rèn)為在未來幾年中,越來越多的ML工作負(fù)載將變得司空見慣,當(dāng)中包括了對性能或電源效率有至關(guān)重要要求的場景中。那就讓在專用加速器上運(yùn)行ML工作負(fù)載變成長久的需要,與此同時(shí),我們還會(huì)繼續(xù)在CPU上運(yùn)行較小范圍的ML工作負(fù)載。

矩陣乘法指令(Matrix multiplication instructions )是此處的關(guān)鍵,它將代表生態(tài)系統(tǒng)中將更大范圍采用v9 CPU作為基本功能所邁出的重要一步。

通常,我認(rèn)為SVE2可能是保證升級到v9的最重要因素,因?yàn)樗歉_定的ISA功能,可以在日常使用中與v8 CPU區(qū)別開來,并且可以保證軟件生態(tài)系統(tǒng)能夠正常運(yùn)行,這與現(xiàn)有的v8堆棧有所不同。對于服務(wù)器領(lǐng)域的Arm來說,這實(shí)際上已經(jīng)成為一個(gè)相當(dāng)大的問題,因?yàn)檐浖鷳B(tài)系統(tǒng)仍在基于v8.0的軟件包基礎(chǔ)上,不幸的是,該軟件包缺少了最重要的v8.1大型系統(tǒng)擴(kuò)展。

使整個(gè)軟件生態(tài)系統(tǒng)向前發(fā)展,并假設(shè)新的v9硬件具有新的體系結(jié)構(gòu)擴(kuò)展功能,這將有助于推動(dòng)事情發(fā)展,并可能解決某些當(dāng)前情況。

但是,v9不僅涉及SVE2和新指令,它還非常注重安全性,在安全性方面我們將看到一些更根本的變化。

介紹機(jī)密的計(jì)算架構(gòu)

在過去的幾年中,安全性和硬件安全性漏洞已成為芯片行業(yè)的頭等大事,Spectre,Meltdown等漏洞的出現(xiàn)及其所有同級邊信道攻擊都表明,重新思考如何保證安全成為了一個(gè)基本需求。Arm希望用來解決這一總體問題的方法是通過引入Arm機(jī)密計(jì)算體系結(jié)構(gòu)(Arm Confidential Compute Architecture:CAA)來重新設(shè)計(jì)安全應(yīng)用程序的工作方式。 在繼續(xù)之前,我想提箱一下,今天的披露僅僅是對新CCA運(yùn)作方式的高層次解釋,Arm說,有關(guān)新安全機(jī)制的確切工作原理的更多細(xì)節(jié)將在今年夏天的晚些時(shí)候公布。

d22c60ec-9536-11eb-8b86-12bb97331649.png

d2609ab0-9536-11eb-8b86-12bb97331649.png

CCA的目標(biāo)是從當(dāng)前的軟件堆棧情況中獲得更大的收益,在當(dāng)前的軟件堆棧情況下,在設(shè)備上運(yùn)行的應(yīng)用程序必須固有地信任它們所運(yùn)行的操作系統(tǒng)和虛擬機(jī)管理程序。傳統(tǒng)的安全模型是基于以下事實(shí)建立的:更高特權(quán)的軟件層被允許查看較低層的執(zhí)行,然而當(dāng)操作系統(tǒng)或系統(tǒng)管理程序被以任何方式損害時(shí),這就可能成為了一個(gè)問題。 CCA引入了動(dòng)態(tài)創(chuàng)建““realms”的新概念,可以將其視為對OS或虛擬機(jī)管理程序完全不透明的安全容器化執(zhí)行環(huán)境。系統(tǒng)管理程序?qū)⑷匀淮嬖?,但僅負(fù)責(zé)調(diào)度和資源分配。而“realm”將由稱為“ealm manager”的新實(shí)體管理,其被認(rèn)為是一段新的代碼,大致大小約為hypervisor的1/10。 realm內(nèi)的應(yīng)用程序?qū)⒛軌颉白C明”領(lǐng)域管理器以確定其是否可信任,這對于傳統(tǒng)的虛擬機(jī)管理程序而言是不可能的。 Arm并沒有深入探討究竟是什么造成了realm與操作系統(tǒng)和虛擬機(jī)管理程序的非安全世界之間的這種隔離,但聽起來確實(shí)像硬件支持的地址空間,但它們無法相互交互。

d428b4f4-9536-11eb-8b86-12bb97331649.png

d438b642-9536-11eb-8b86-12bb97331649.png

使用realms的優(yōu)勢在于,它極大地減少了設(shè)備上運(yùn)行的給定應(yīng)用程序的信任鏈,并且OS對安全性問題變得越來越透明。與當(dāng)今需要企業(yè)或企業(yè)使用帶有授權(quán)軟件堆棧的專用設(shè)備的情況相反,需要監(jiān)督控制的關(guān)鍵任務(wù)應(yīng)用程序?qū)⒛軌蛟谌魏卧O(shè)備上運(yùn)行。

d47151dc-9536-11eb-8b86-12bb97331649.png

d4e243ce-9536-11eb-8b86-12bb97331649.png

MTE(memory tagging extensions)并不是v9的新功能,而是隨v8.5一起引入的,MTE或內(nèi)存標(biāo)記擴(kuò)展旨在幫助解決世界軟件中兩個(gè)最持久的安全問題。緩沖區(qū)溢出(Buffers overflows)和無用后使用(use-after-free)是持續(xù)的軟件設(shè)計(jì)問題,在過去的50年中,這些問題一直是軟件設(shè)計(jì)的一部分,并且可能需要花費(fèi)數(shù)年的時(shí)間才能對其進(jìn)行識(shí)別或解決。MTE旨在通過在分配時(shí)標(biāo)記指針并在使用時(shí)進(jìn)行檢查來幫助識(shí)別此類問題。

未來的Arm CPU路線圖

這與v9沒有直接關(guān)系,但是與即將到來的v9設(shè)計(jì)的技術(shù)路線圖緊密相關(guān),Arm還談到了有關(guān)他們在未來2年中對v9設(shè)計(jì)的預(yù)期性能的一些觀點(diǎn)。

d5129fba-9536-11eb-8b86-12bb97331649.png

Arm談到了移動(dòng)市場在今年如何將帶有X1的設(shè)備性能提升了2.4倍(此處我們僅指ISO流程設(shè)計(jì)的IPC),該性能是幾年前推出的Cortex-A73的兩倍。 有趣的是,Arm還談到了Neoverse V1設(shè)計(jì)及其如何達(dá)到A72類似設(shè)計(jì)性能的2.4倍,并透露他們期待著他今年晚些時(shí)候發(fā)布的首批V1設(shè)備。 對于代號(hào)為“ Matterhorn”和“ Makalu”的下一代移動(dòng)IP內(nèi)核,該公司公開了這兩代產(chǎn)品的合計(jì)預(yù)期IPC增益為30%,其中不包括SoC設(shè)計(jì)人員可以獲得的頻率或任何其他其他性能增益。這實(shí)際上代表著這兩種新設(shè)計(jì)的世代增加了14%,并且如幻燈片中的性能曲線所示,這表明相對于自A76以來Arm在過去幾年所管理的工作而言,改進(jìn)的步伐正在放緩。不過,該公司指出,進(jìn)步速度仍然遠(yuǎn)遠(yuǎn)超過行業(yè)平均水平。但潭門也坦言,這被一些行業(yè)參與者拖累了。

d543fed4-9536-11eb-8b86-12bb97331649.png

Arm還提供了一張很有意思的幻燈片,該幻燈片旨在關(guān)注系統(tǒng)側(cè)對性能的影響,而不僅僅是CPU IP性能。從這里提供的一些數(shù)據(jù)可以看到,例如每5ns的內(nèi)存延遲中有1%的性能,這是我們現(xiàn)在已經(jīng)廣泛討論了幾代的數(shù)字,但是Arm在這里還指出,排除了是否通過改善內(nèi)存路徑,增加緩存或優(yōu)化頻率功能來改善實(shí)現(xiàn)的其他各個(gè)方面,他們可以使用整整一代的CPU性能提升,我認(rèn)為這是對SoC供應(yīng)商當(dāng)前保守方法的一種評價(jià),這些方法沒有充分利用X1內(nèi)核的預(yù)期性能余量,并且隨后也未達(dá)到新內(nèi)核的預(yù)期性能預(yù)測。

d5a225e0-9536-11eb-8b86-12bb97331649.png

Arm繼續(xù)將CPU視為未來最通用的計(jì)算模塊。盡管專用的加速器或GPU將會(huì)占有一席之地,但它們很難解決一些重要問題,例如可編程性,保護(hù)性,普遍性(本質(zhì)上是在任何設(shè)備上運(yùn)行它們的能力)以及經(jīng)過驗(yàn)證的正常工作的能力。當(dāng)前,計(jì)算生態(tài)系統(tǒng)在運(yùn)行方式上極為分散,不僅設(shè)備類型不同,而且設(shè)備供應(yīng)商和操作系統(tǒng)也不同。 SVE2和Matrix乘法可以極大地簡化軟件生態(tài)系統(tǒng),并允許計(jì)算工作負(fù)載以更統(tǒng)一的方法向前邁進(jìn),該方法將來將可以在任何設(shè)備上運(yùn)行。

d5b91c5a-9536-11eb-8b86-12bb97331649.png

最后,Arm還分享了有關(guān)Mali GPU未來的新信息,并透露該公司正在開發(fā)VRS等新技術(shù),尤其是Ray Tracing。這一點(diǎn)令人非常令人驚訝,也表明AMD和Nvidia引入RT推動(dòng)的臺(tái)式機(jī)和控制臺(tái)生態(tài)系統(tǒng)也有望將移動(dòng)GPU生態(tài)系統(tǒng)推向RT。

Armv9設(shè)計(jì)即將在2022年初面世

今天的公告以一種非常高級的形式出現(xiàn),我們希望Arm在接下來的幾個(gè)月中,在公司通常的年度技術(shù)披露中,更多地談?wù)揂rmv9的各種細(xì)節(jié)和新功能,例如CCA。 總的來說,Armv9似乎是更基本的ISA轉(zhuǎn)變(可以看作SVE2)與軟件生態(tài)系統(tǒng)的總體重新基準(zhǔn)的結(jié)合,以匯總v8擴(kuò)展的最后十年,并為下一個(gè)十年奠定基礎(chǔ)Arm體系結(jié)構(gòu)。 Arm于去年下半年已經(jīng)談?wù)撨^Neoverse V1和N2,我確實(shí)希望N2至少最終是基于v9而設(shè)計(jì)發(fā)布的。Arm進(jìn)一步透露,更多基于Armv9的 CPU設(shè)計(jì)(可能是移動(dòng)端Cortex-A78和X1的后續(xù)產(chǎn)品)將于今年推出,而新的CPU可能已經(jīng)被通常的SoC供應(yīng)商所采用,并且有望成為在2022年初在商用設(shè)備中出現(xiàn)。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    49938

    瀏覽量

    419595
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9006

    瀏覽量

    366021
  • 指令集
    +關(guān)注

    關(guān)注

    0

    文章

    221

    瀏覽量

    23323
收藏 人收藏

    評論

    相關(guān)推薦

    Armv9 CPU中SVE2的實(shí)際用例

    隨著每新產(chǎn)品的推出,Arm CPU 都會(huì)實(shí)現(xiàn)代際性能提升,并引入架構(gòu)改進(jìn),以滿足不斷演進(jìn)的計(jì)算工作負(fù)載的需求。本文將重點(diǎn)介紹三個(gè)用例,以展示 A
    的頭像 發(fā)表于 10-21 09:54 ?88次閱讀
    <b class='flag-5'>Armv9</b> CPU中SVE2的實(shí)際用例

    什么是ARM架構(gòu)?什么是X86架構(gòu)?兩者的區(qū)別是什么?

    、什么是ARM架構(gòu)? ()起源與發(fā)展 ARM 架構(gòu)由英國劍橋的 Acorn 計(jì)算機(jī)
    的頭像 發(fā)表于 09-06 10:40 ?429次閱讀

    Armv9架構(gòu)中SME和SME2的關(guān)鍵用例

    Arm 為在各類技術(shù)領(lǐng)域運(yùn)行無處不在的人工智能 (AI) 奠定堅(jiān)實(shí)的技術(shù)基礎(chǔ)。這得益于我們行業(yè)領(lǐng)先的架構(gòu)可在全球數(shù)十億臺(tái)多樣化設(shè)備上支持各種計(jì)算工作負(fù)載。
    的頭像 發(fā)表于 09-03 11:36 ?1189次閱讀

    X86架構(gòu)處理器有哪些優(yōu)點(diǎn)和缺點(diǎn)

    X86架構(gòu)處理器作為計(jì)算機(jī)領(lǐng)域的重要組成部分,具有多個(gè)顯著的優(yōu)點(diǎn)和定的缺點(diǎn)。以下是對X86架構(gòu)處理器優(yōu)缺點(diǎn)的詳細(xì)分析。
    的頭像 發(fā)表于 08-22 11:25 ?930次閱讀

    X86架構(gòu)ARM架構(gòu)有什么區(qū)別

    X86架構(gòu)ARM架構(gòu)是兩種主流的CPU架構(gòu),它們在多個(gè)方面存在顯著的差異。以下是對這兩種架構(gòu)的詳細(xì)比較,涵蓋了追求目標(biāo)、應(yīng)用領(lǐng)域、技術(shù)特點(diǎn)
    的頭像 發(fā)表于 08-22 11:21 ?5408次閱讀

    探索RISC-V二進(jìn)制翻譯,openKylin成功在SG2042平臺(tái)運(yùn)行X86架構(gòu)軟件!

    眾所周知,在新的指令集架構(gòu)發(fā)展初期,往往采用兼容其他架構(gòu)軟件的方法來拓展自身生態(tài)體系,如蘋果公司的Rosetta2和微軟的Arm64EC,都是將X86
    的頭像 發(fā)表于 07-24 08:34 ?364次閱讀
    探索RISC-V二進(jìn)制翻譯,openKylin成功在SG2042平臺(tái)運(yùn)行X86<b class='flag-5'>架構(gòu)</b>軟件!

    Arm發(fā)布針對旗艦智能手機(jī)的新一代CPU和GPU IP

    全球領(lǐng)先的芯片設(shè)計(jì)公司Arm宣布針對旗艦智能手機(jī)市場的全新CPU和GPU IP設(shè)計(jì)方案——Cortex-X925 CPU和Immortalis G925 GPU。這兩款產(chǎn)品均基于Armv9
    的頭像 發(fā)表于 05-31 09:44 ?498次閱讀

    Arm推出AI優(yōu)化的Arm終端CSS以及新的Arm Kleidi軟件

    Arm 終端計(jì)算子系統(tǒng) (CSS) 作為新的計(jì)算解決方案,結(jié)合 Armv9 架構(gòu)的優(yōu)勢,以及基于三納米工藝節(jié)點(diǎn),經(jīng)過驗(yàn)證和證實(shí)為生產(chǎn)就緒的新 Ar
    的頭像 發(fā)表于 05-30 11:33 ?535次閱讀
    <b class='flag-5'>Arm</b>推出AI優(yōu)化的<b class='flag-5'>Arm</b>終端CSS以及新的<b class='flag-5'>Arm</b> Kleidi軟件

    Arm發(fā)布Arm v9架構(gòu)CPU、GPU IP及設(shè)計(jì)軟件,助力AI計(jì)算

    長期以來,全球智能手機(jī)處理器均采用Arm架構(gòu),包括蘋果、高通、聯(lián)發(fā)科在內(nèi)的眾多廠商均依賴Arm提供的IP,且該應(yīng)用范圍已逐漸擴(kuò)展至個(gè)人電腦與數(shù)據(jù)中心領(lǐng)域。
    的頭像 發(fā)表于 05-30 09:17 ?576次閱讀

    移動(dòng)端芯片性能提升,Armv9架構(gòu)新升級引發(fā)關(guān)注

    “數(shù)碼博主”5月17日的最新爆料指出,聯(lián)發(fā)科積極推進(jìn)Armv9新一代IP BLACKHAWK“黑鷹”的架構(gòu)設(shè)計(jì),預(yù)計(jì)天璣9400芯片將采用這一架構(gòu),有望以“全大核”設(shè)計(jì)再度領(lǐng)跑移動(dòng)So
    的頭像 發(fā)表于 05-17 16:51 ?877次閱讀

    聯(lián)發(fā)科參與設(shè)計(jì)Armv9新旗艦架構(gòu)BlackHawk黑鷹,天璣9400拉滿頂級天賦預(yù)定芯皇

    最近,有關(guān)聯(lián)發(fā)科下一代旗艦芯片的消息頻傳,天璣9400已成為數(shù)碼圈的討論焦點(diǎn)。前不久,知名大V數(shù)碼閑聊站爆料,為了確保天璣9400性能和能效都穩(wěn)贏對手,聯(lián)發(fā)科深度參與設(shè)計(jì)Armv9新一代
    的頭像 發(fā)表于 05-17 12:46 ?354次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國產(chǎn)CPU市場

    Arm發(fā)布新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?665次閱讀

    arm架構(gòu)和x86架構(gòu)區(qū)別 linux是x86還是arm

    、ARM架構(gòu)和x86架構(gòu)的概述 1.1 ARM架構(gòu) ARM(Advanced RISC Mach
    的頭像 發(fā)表于 01-30 13:46 ?1.6w次閱讀

    Debian宣布停止i386架構(gòu)支持

    近日,在英國劍橋市舉行的小規(guī)模DebConf活動(dòng)中,Debian GNU/Linux的發(fā)布團(tuán)隊(duì)召開春季會(huì)議,探討了未來發(fā)展方向,其中包括停止對i386架構(gòu)的支持。
    的頭像 發(fā)表于 12-19 10:16 ?738次閱讀

    Arm架構(gòu)學(xué)習(xí)—開啟Armv9時(shí)

    在上篇文章“從A76到A78——在變化中學(xué)習(xí)Arm架構(gòu)”中,我們了解了Arm處理器微架構(gòu)的基本組成,介紹
    的頭像 發(fā)表于 11-27 16:46 ?1053次閱讀
    <b class='flag-5'>Arm</b>微<b class='flag-5'>架構(gòu)</b>學(xué)習(xí)—開啟<b class='flag-5'>Armv9</b>時(shí)<b class='flag-5'>代</b>