欧美综合网免费体检区试看,国产影视一区二区三区

Kinar于近期發(fā)布了Ara-2邊緣AI 處理器，這是一款專為邊緣服務(wù)器及筆記本電腦打造的高性能、高效能且節(jié)能推理解決方案，尤其適用于視頻分析、大規(guī)模語(yǔ)言模型（LLM）在內(nèi)的各類AI應(yīng)用。值得注意的是，Ara-2也能夠良好適應(yīng)傳統(tǒng)AI模型和基于Transformer架構(gòu)的尖端AI模型，其所具備的體驗(yàn)式增強(qiáng)功能集使得Ara-2的性能較初代的Ara-1處理器有顯著提升，可達(dá)成超過(guò)5至8倍的增長(zhǎng)，將實(shí)時(shí)響應(yīng)能力與大吞吐量相結(jié)合，從而達(dá)致高度精煉的延遲優(yōu)化設(shè)計(jì)和均衡性能。

生成式AI現(xiàn)已成為主流，然而大多數(shù)此類應(yīng)用卻在數(shù)據(jù)中心的GPU上運(yùn)行，由此引發(fā)的延遲、高成本以及隱私問(wèn)題亟待解決。Ara-2順應(yīng)時(shí)代變化，貼心支持生成式AI模型所需引導(dǎo)的數(shù)十億個(gè)參數(shù)，為跨境轉(zhuǎn)移提供便利。同時(shí)，為了更順暢地完成從GPU至各個(gè)AI模型的過(guò)度，其內(nèi)建的計(jì)算引擎以及軟件開發(fā)套件（SDK）均為此進(jìn)行定制搭建。

“Ara-2的誕生使得我們有能力根據(jù)客戶需求提供更高性能和成本選擇。如Ara-1，其專為智能相機(jī)及具有2至8路視頻流的邊緣AI設(shè)備而生；而Ara-2則特別擅長(zhǎng)處理針對(duì)16至32路甚至更多視頻流的底層邊緣服務(wù)器或筆記本電腦，且與高端相機(jī)完美兼容?！?Kinara首席執(zhí)行官Ravi Annavajjhala對(duì)此表示?！敖柚冗M(jìn)的計(jì)算引擎，Ara-2能夠快速處理高清圖像，有效提升精度，實(shí)現(xiàn)更高水平的對(duì)象檢視、識(shí)別及追蹤。例如，針對(duì)生成式AI模型，Stable Diffusion每10秒即可生成一幅圖片，LLaMA-7B則可達(dá)到每秒幾十個(gè)token的處理速率?！?/p>

據(jù)悉，Ampere將在10月份容忍Kinar加入其人工智能平臺(tái)聯(lián)盟，共同致力于降低系統(tǒng)復(fù)雜度，推動(dòng)人工智能進(jìn)一步提升協(xié)同工作能力和開放性，目標(biāo)在于提供比GPU更優(yōu)的總體性能，同時(shí)兼顧吞吐量、功率和成本效益。該團(tuán)隊(duì)的首席布道師Sean Varley認(rèn)為：“ ARA-2展現(xiàn)的性能和功能集讓我堅(jiān)定朝這個(gè)方向發(fā)展，助力行業(yè)推出性能更優(yōu)且與現(xiàn)有GPU技術(shù)相匹敵的AI替代方案。”

除此之外，Ara-2還秉持著安全啟動(dòng)、加密內(nèi)存訪問(wèn)以及安全主控接口等特性，確保企業(yè)AI部署擁有更高的安全性。Kinar亦為之提供全套的SDK支持，囊括模型編譯器、計(jì)算單元調(diào)度程序、靈活的量化選項(xiàng)（含內(nèi)置的Kinar量化器）以及對(duì)PyTorch和TFLite預(yù)量化模型的支持、多芯片負(fù)荷均衡器系統(tǒng)與動(dòng)態(tài)調(diào)節(jié)主控運(yùn)行等諸多要素。

Ara-2提供獨(dú)立設(shè)備、USB模塊、M.2模塊以及多個(gè)Ara-2組成的PCIe卡等豐富形式供消費(fèi)者選擇。 Kinara計(jì)劃在CES上現(xiàn)場(chǎng)展示這款備受矚目的Ara-2產(chǎn)品。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
27

文章
4632

瀏覽量
128448
數(shù)據(jù)中心

數(shù)據(jù)中心

+關(guān)注

關(guān)注
16

文章
4577

瀏覽量
71806
生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
472

瀏覽量
436

評(píng)論

相關(guān)推薦

英特爾?至強(qiáng)?可擴(kuò)展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

醫(yī)療機(jī)構(gòu)實(shí)現(xiàn)數(shù)據(jù)的收集、分析和輔助決策，從而提升醫(yī)療服務(wù)質(zhì)量與效率。 ? 這一處理器內(nèi)置的AI加速器顯著提升了AI

發(fā)表于 09-29 11:13 ?5982次閱讀

英特爾?至強(qiáng)?可擴(kuò)展<b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

開箱即用，AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

。中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》（征求意見稿）相關(guān)要求，使用AISBench?2.0測(cè)試工具，完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的AI

發(fā)表于 09-06 15:33 ?225次閱讀

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺(jué)AI系統(tǒng)

RZ/V2H嵌入式AI微處理器，采用瑞薩最新的DRP-AI3技術(shù)，可提供高達(dá)8TOPS（Dense模型）/80TOPS（sparse模型）的AI

發(fā)表于 07-02 18:36 ?375次閱讀

寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

“基于第五代英特爾至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器，可以在滿足大量AI推理場(chǎng)景在吞吐量、時(shí)延、容量、并發(fā)能力等方面的需求，而且與專用的GPU服務(wù)

發(fā)表于 05-27 11:46 ?715次閱讀

臺(tái)積電：AI服務(wù)器處理器預(yù)計(jì)翻番，拉動(dòng)收入增長(zhǎng)?

臺(tái)積電將 AI 服務(wù)器處理器嚴(yán)格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI 加速

發(fā)表于 04-19 15:04 ?295次閱讀

自然語(yǔ)言處理應(yīng)用LLM推理優(yōu)化綜述

當(dāng)前，業(yè)界在將傳統(tǒng)優(yōu)化技術(shù)引入 LLM 推理的同時(shí)，同時(shí)也在探索從大模型自回歸解碼特點(diǎn)出發(fā)，通過(guò)調(diào)整推理過(guò)程和引入新的模型結(jié)構(gòu)來(lái)進(jìn)一步提升推理性能。

發(fā)表于 04-10 11:48 ?506次閱讀

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試，基于Stable Diffusion

UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測(cè)試，以計(jì)算機(jī)視覺(jué)工作負(fù)載評(píng)估AI推理性能。新推出的圖像生成測(cè)試將提供統(tǒng)一、精

發(fā)表于 03-25 16:16 ?788次閱讀

AMD EPYC處理器：AI推理能力究竟有多強(qiáng)？

如今，AMD EPYC處理器已經(jīng)成為最常被選擇用于AI推理的服務(wù)器平臺(tái)，尤其是第四代Genoa EPYC 9004系列，執(zhí)行AI

發(fā)表于 03-15 09:47 ?384次閱讀

瑞薩電子宣布推出一款面向高性能機(jī)器人應(yīng)用的新產(chǎn)品—RZ/V2H

具有10TOPS/W能效的新一代AI加速器無(wú)需冷卻風(fēng)扇即可提供高達(dá)80TOPS的AI推理性能

發(fā)表于 03-01 10:41 ?733次閱讀

英特爾專家為您揭秘第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器如何為AI加速

% 1 ，AI 推理性能提升42% 2 。這一系列性能提升的背后，存在著怎樣的創(chuàng)新與突破？第五代英特爾至強(qiáng) 可擴(kuò)展處理器為什么要強(qiáng)調(diào)為

發(fā)表于 12-23 12:20 ?672次閱讀

英特爾發(fā)布第五代至強(qiáng)可擴(kuò)展處理器：性能和能效大幅提升，AI 加速

此外，至強(qiáng)可擴(kuò)展處理器被譽(yù)為行業(yè)首屈一指的內(nèi)置AI加速器數(shù)據(jù)中心處理器，全新第五代產(chǎn)品更能優(yōu)化參數(shù)量高達(dá)200億的大型語(yǔ)言模型，使其推理性能

發(fā)表于 12-15 11:02 ?755次閱讀

Kinara推出Ara-2邊緣AI處理器，為邊緣服務(wù)器和筆記本電腦提供高性

雖然生成式AI應(yīng)用日趨盛行，但大部分應(yīng)用仍依賴GPU在數(shù)據(jù)中心運(yùn)行，存在著延遲高、成本大、隱私泄漏等諸多風(fēng)險(xiǎn)。為了解決此類問(wèn)題，Ara-2處理器支持生成式AI模型所需要的大量參數(shù)，有效

發(fā)表于 12-14 10:12 ?1008次閱讀

英特爾新處理器，掀AI PC戰(zhàn)火

隨著ai時(shí)代的到來(lái)，英特爾正在構(gòu)想新的酷睿Ultra處理器（代號(hào)Meteor Lake），這是英特爾的第一個(gè)基于npu的處理器，旨在在pc上應(yīng)用ai加速和

發(fā)表于 12-11 11:26 ?876次閱讀

用上這個(gè)工具包，大模型推理性能加速達(dá)40倍

作者：英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實(shí)現(xiàn)出色的LLM推理性能。英特爾 ?Extension for Transformer 創(chuàng)新

發(fā)表于 12-01 20:40 ?1048次閱讀

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

交互速率運(yùn)行的 Llama-2-70B 模型。圖 1. 領(lǐng)先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速測(cè)試最新的模型和應(yīng)用，請(qǐng)使用 Jetson 生成式

發(fā)表于 11-07 21:25 ?845次閱讀