0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kinara發(fā)布Ara-2邊緣AI處理器,實(shí)現(xiàn)高效、經(jīng)濟(jì)、節(jié)能的推理性能

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2023-12-19 11:05 ? 次閱讀

Kinar于近期發(fā)布了Ara-2邊緣AI處理器,這是一款專為邊緣服務(wù)器及筆記本電腦打造的高性能、高效能且節(jié)能推理解決方案,尤其適用于視頻分析、大規(guī)模語(yǔ)言模型(LLM)在內(nèi)的各類AI應(yīng)用。值得注意的是,Ara-2也能夠良好適應(yīng)傳統(tǒng)AI模型和基于Transformer架構(gòu)的尖端AI模型,其所具備的體驗(yàn)式增強(qiáng)功能集使得Ara-2的性能較初代的Ara-1處理器有顯著提升,可達(dá)成超過(guò)5至8倍的增長(zhǎng),將實(shí)時(shí)響應(yīng)能力與大吞吐量相結(jié)合,從而達(dá)致高度精煉的延遲優(yōu)化設(shè)計(jì)和均衡性能。

生成式AI現(xiàn)已成為主流,然而大多數(shù)此類應(yīng)用卻在數(shù)據(jù)中心GPU上運(yùn)行,由此引發(fā)的延遲、高成本以及隱私問(wèn)題亟待解決。Ara-2順應(yīng)時(shí)代變化,貼心支持生成式AI模型所需引導(dǎo)的數(shù)十億個(gè)參數(shù),為跨境轉(zhuǎn)移提供便利。同時(shí),為了更順暢地完成從GPU至各個(gè)AI模型的過(guò)度,其內(nèi)建的計(jì)算引擎以及軟件開發(fā)套件(SDK)均為此進(jìn)行定制搭建。

“Ara-2的誕生使得我們有能力根據(jù)客戶需求提供更高性能和成本選擇。如Ara-1,其專為智能相機(jī)及具有2至8路視頻流的邊緣AI設(shè)備而生;而Ara-2則特別擅長(zhǎng)處理針對(duì)16至32路甚至更多視頻流的底層邊緣服務(wù)器或筆記本電腦,且與高端相機(jī)完美兼容?!?Kinara首席執(zhí)行官Ravi Annavajjhala對(duì)此表示?!敖柚冗M(jìn)的計(jì)算引擎,Ara-2能夠快速處理高清圖像,有效提升精度,實(shí)現(xiàn)更高水平的對(duì)象檢視、識(shí)別及追蹤。例如,針對(duì)生成式AI模型,Stable Diffusion每10秒即可生成一幅圖片,LLaMA-7B則可達(dá)到每秒幾十個(gè)token的處理速率?!?/p>

據(jù)悉,Ampere將在10月份容忍Kinar加入其人工智能平臺(tái)聯(lián)盟,共同致力于降低系統(tǒng)復(fù)雜度,推動(dòng)人工智能進(jìn)一步提升協(xié)同工作能力和開放性,目標(biāo)在于提供比GPU更優(yōu)的總體性能,同時(shí)兼顧吞吐量、功率和成本效益。該團(tuán)隊(duì)的首席布道師Sean Varley認(rèn)為:“ ARA-2展現(xiàn)的性能和功能集讓我堅(jiān)定朝這個(gè)方向發(fā)展,助力行業(yè)推出性能更優(yōu)且與現(xiàn)有GPU技術(shù)相匹敵的AI替代方案。”

除此之外,Ara-2還秉持著安全啟動(dòng)、加密內(nèi)存訪問(wèn)以及安全主控接口等特性,確保企業(yè)AI部署擁有更高的安全性。Kinar亦為之提供全套的SDK支持,囊括模型編譯器、計(jì)算單元調(diào)度程序、靈活的量化選項(xiàng)(含內(nèi)置的Kinar量化器)以及對(duì)PyTorch和TFLite預(yù)量化模型的支持、多芯片負(fù)荷均衡器系統(tǒng)與動(dòng)態(tài)調(diào)節(jié)主控運(yùn)行等諸多要素。

Ara-2提供獨(dú)立設(shè)備、USB模塊、M.2模塊以及多個(gè)Ara-2組成的PCIe卡等豐富形式供消費(fèi)者選擇。 Kinara計(jì)劃在CES上現(xiàn)場(chǎng)展示這款備受矚目的Ara-2產(chǎn)品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4632

    瀏覽量

    128448
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4577

    瀏覽量

    71806
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    472

    瀏覽量

    436
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾?至強(qiáng)?可擴(kuò)展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    醫(yī)療機(jī)構(gòu)實(shí)現(xiàn)數(shù)據(jù)的收集、分析和輔助決策,從而提升醫(yī)療服務(wù)質(zhì)量與效率。 ? 這一處理器內(nèi)置的AI加速顯著提升了AI
    發(fā)表于 09-29 11:13 ?5982次閱讀
    英特爾?至強(qiáng)?可擴(kuò)展<b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    開箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)系統(tǒng)性能測(cè)試規(guī)范》(征求意見稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器AI
    的頭像 發(fā)表于 09-06 15:33 ?225次閱讀
    開箱即用,AISBench測(cè)試展示英特爾至強(qiáng)<b class='flag-5'>處理器</b>的卓越<b class='flag-5'>推理性能</b>

    基于瑞薩RZ/V2H AI處理器的解決方案:高性能視覺(jué)AI系統(tǒng)

    RZ/V2H嵌入式AI處理器,采用瑞薩最新的DRP-AI3技術(shù),可提供高達(dá)8TOPS(Dense模型)/80TOPS(sparse模型)的AI
    發(fā)表于 07-02 18:36 ?375次閱讀
    基于瑞薩RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>處理器</b>的解決方案:高<b class='flag-5'>性能</b>視覺(jué)<b class='flag-5'>AI</b>系統(tǒng)

    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

    “基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù),可以在滿足大量AI推理場(chǎng)景在吞吐量、時(shí)延、容量、并發(fā)能力等方面的需求,而且與專用的GPU服務(wù)
    的頭像 發(fā)表于 05-27 11:46 ?715次閱讀
    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)<b class='flag-5'>器</b>采用第五代英特爾至強(qiáng)可擴(kuò)展<b class='flag-5'>處理器</b>

    臺(tái)積電:AI服務(wù)處理器預(yù)計(jì)翻番,拉動(dòng)收入增長(zhǎng)?

    臺(tái)積電將 AI 服務(wù)處理器嚴(yán)格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI 加速
    的頭像 發(fā)表于 04-19 15:04 ?295次閱讀

    自然語(yǔ)言處理應(yīng)用LLM推理優(yōu)化綜述

    當(dāng)前,業(yè)界在將傳統(tǒng)優(yōu)化技術(shù)引入 LLM 推理的同時(shí),同時(shí)也在探索從大模型自回歸解碼特點(diǎn)出發(fā),通過(guò)調(diào)整推理過(guò)程和引入新的模型結(jié)構(gòu)來(lái)進(jìn)一步提升推理性能
    發(fā)表于 04-10 11:48 ?506次閱讀
    自然語(yǔ)言<b class='flag-5'>處理</b>應(yīng)用LLM<b class='flag-5'>推理</b>優(yōu)化綜述

    UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試,基于Stable Diffusion

    UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測(cè)試,以計(jì)算機(jī)視覺(jué)工作負(fù)載評(píng)估AI推理性能。新推出的圖像生成測(cè)試將提供統(tǒng)一、精
    的頭像 發(fā)表于 03-25 16:16 ?788次閱讀

    AMD EPYC處理器AI推理能力究竟有多強(qiáng)?

    如今,AMD EPYC處理器已經(jīng)成為最常被選擇用于AI推理的服務(wù)平臺(tái),尤其是第四代Genoa EPYC 9004系列,執(zhí)行AI
    發(fā)表于 03-15 09:47 ?384次閱讀

    瑞薩電子宣布推出一款面向高性能機(jī)器人應(yīng)用的新產(chǎn)品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速無(wú)需冷卻風(fēng)扇即可提供高達(dá)80TOPS的AI推理性能
    的頭像 發(fā)表于 03-01 10:41 ?733次閱讀
    瑞薩電子宣布推出一款面向高<b class='flag-5'>性能</b>機(jī)器人應(yīng)用的新產(chǎn)品—RZ/V<b class='flag-5'>2</b>H

    英特爾專家為您揭秘第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器如何為AI加速

    % 1 ,AI 推理性能提升42% 2 。 這一系列性能提升的背后,存在著怎樣的創(chuàng)新與突破?第五代英特爾 至強(qiáng) 可擴(kuò)展處理器為什么要強(qiáng)調(diào)為
    的頭像 發(fā)表于 12-23 12:20 ?672次閱讀

    英特爾發(fā)布第五代至強(qiáng)可擴(kuò)展處理器性能和能效大幅提升,AI 加速

    此外,至強(qiáng)可擴(kuò)展處理器被譽(yù)為行業(yè)首屈一指的內(nèi)置AI加速數(shù)據(jù)中心處理器,全新第五代產(chǎn)品更能優(yōu)化參數(shù)量高達(dá)200億的大型語(yǔ)言模型,使其推理性能
    的頭像 發(fā)表于 12-15 11:02 ?755次閱讀

    Kinara推出Ara-2邊緣AI處理器,為邊緣服務(wù)和筆記本電腦提供高性

    雖然生成式AI應(yīng)用日趨盛行,但大部分應(yīng)用仍依賴GPU在數(shù)據(jù)中心運(yùn)行,存在著延遲高、成本大、隱私泄漏等諸多風(fēng)險(xiǎn)。為了解決此類問(wèn)題,Ara-2處理器支持生成式AI模型所需要的大量參數(shù),有效
    的頭像 發(fā)表于 12-14 10:12 ?1008次閱讀
    <b class='flag-5'>Kinara</b>推出<b class='flag-5'>Ara-2</b><b class='flag-5'>邊緣</b><b class='flag-5'>AI</b><b class='flag-5'>處理器</b>,為<b class='flag-5'>邊緣</b>服務(wù)<b class='flag-5'>器</b>和筆記本電腦提供高性

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來(lái),英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第一個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai加速和
    的頭像 發(fā)表于 12-11 11:26 ?876次閱讀

    用上這個(gè)工具包,大模型推理性能加速達(dá)40倍

    作者: 英特爾公司 沈海豪、羅嶼、孟恒宇、董波、林俊 編者按: 只需不到9行代碼, 就能在CPU上實(shí)現(xiàn)出色的LLM推理性能。 英特爾 ?Extension for Transformer 創(chuàng)新
    的頭像 發(fā)表于 12-01 20:40 ?1048次閱讀
    用上這個(gè)工具包,大模型<b class='flag-5'>推理性能</b>加速達(dá)40倍

    利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

    交互速率運(yùn)行的 Llama-2-70B 模型。 圖 1. 領(lǐng)先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速測(cè)試最新的模型和應(yīng)用,請(qǐng)使用 Jetson 生成式
    的頭像 發(fā)表于 11-07 21:25 ?845次閱讀
    利用 NVIDIA Jetson <b class='flag-5'>實(shí)現(xiàn)</b>生成式 <b class='flag-5'>AI</b>