国产JJIZZ女人多水喷水,欧美大香线蕉线伊人久久

在舊金山的一個(gè) AI 會(huì)議上， NVIDIA 發(fā)布了 Jetson TX2 和 Jetpack3 。 0AI SDK 。 Jetson 是世界領(lǐng)先的低功耗嵌入式平臺(tái)，為所有邊緣設(shè)備提供服務(wù)器級(jí) AI 計(jì)算性能。 Jetson TX2 具有集成的 256 核 NVIDIA Pascal GPU 、十六進(jìn)制內(nèi)核 ARMv8 64 位 CPU 復(fù)合體和 8GB LPDDR4 內(nèi)存和 128 位接口。 CPU 復(fù)合物結(jié)合了雙核心的丹佛 2 號(hào)和四核臂 Cortex-A57 。圖 1 所示的 Jetson TX2 模塊適合于 50 x 87 毫米、 85 克和 7 。 5 瓦的小尺寸、重量和功率（交換）占用空間。

物聯(lián)網(wǎng)（ IoT ）設(shè)備通常充當(dāng)簡(jiǎn)單的中繼數(shù)據(jù)網(wǎng)關(guān)。他們依靠云連接來(lái)完成繁重的工作和數(shù)字運(yùn)算。邊緣計(jì)算是一種新興的范式，它使用本地計(jì)算來(lái)實(shí)現(xiàn)數(shù)據(jù)源的分析。 TX2 具有超過(guò) TFLOP / s 的性能，非常適合將高級(jí)人工智能部署到互聯(lián)網(wǎng)連接較差或昂貴的遠(yuǎn)程現(xiàn)場(chǎng)。 Jetson TX2 還為需要任務(wù)關(guān)鍵型自治的智能機(jī)器提供近實(shí)時(shí)響應(yīng)和最小延遲密鑰。

Jetson TX2 基于 16nm NVIDIA Tegra “ Parker ”系統(tǒng)片上系統(tǒng)（ SoC ）（圖 2 顯示了一個(gè)框圖）。 Jetson TX2 在深度學(xué)習(xí)推理方面的能效是其前代產(chǎn)品 Jetson TX1 的兩倍，并提供比 Intel Xeon 服務(wù)器 CPU 更高的性能。效率的提高重新定義了將先進(jìn)的人工智能從云端擴(kuò)展到邊緣的可能性。

圖 2 ： NVIDIA Jetson TX2 Tegra “ Parker ” SoC 框圖，具有集成的 NVIDIA Pascal GPU 、 NVIDIA Denver 2 + Arm Cortex-A57 CPU 集群和多媒體加速引擎（點(diǎn)擊圖片獲取完整分辨率）。

Jetson TX2 有多個(gè)多媒體流引擎，通過(guò)減輕傳感器采集和分發(fā)的負(fù)擔(dān)，使其 Pascal GPU 能夠獲得數(shù)據(jù)。這些多媒體引擎包括六個(gè)專用的 MIPI CSI-2 攝像頭端口，每通道提供高達(dá) 2 。 5gb / s 的帶寬和 1 。 4gb / s 的雙圖像服務(wù)處理器（ ISP ）處理，以及支持 H 。 265 、每秒 4k60 幀的視頻編解碼器。

Jetson TX2 使用 NVIDIA cuDNN 和 TensorRT 庫(kù)加速尖端深度神經(jīng)網(wǎng)絡(luò)（ DNN ）架構(gòu)，并支持遞歸神經(jīng)網(wǎng)絡(luò) 、長(zhǎng)短期記憶網(wǎng)絡(luò) 和在線強(qiáng)化學(xué)習(xí) 。它的雙 CAN 總線控制器使自動(dòng)駕駛儀集成到控制機(jī)器人和無(wú)人機(jī)，這些機(jī)器人和無(wú)人機(jī)使用 DNN 感知周圍的世界，并在動(dòng)態(tài)環(huán)境中安全運(yùn)行。 Jetson TX2 的軟件通過(guò) NVIDIA 的噴氣背包 3 。 0 和 Linux for Tegra （ L4T ） Board Support Package （ BSP ）提供。

表 1 比較了 Jetson TX2 與上一代 Jetson TX1 的特性。

兩倍的性能，兩倍的效率

在我的在 JetPack 2 。 3 上發(fā)布中，我演示了 NVIDIA TensorRT 如何提高 Jetson TX1 深度學(xué)習(xí)推理性能，效率比桌面類 CPU 高 18 倍。 TensorRT 通過(guò)使用 graph 優(yōu)化、內(nèi)核融合、半精度浮點(diǎn)計(jì)算（ FP16 ）和架構(gòu)自動(dòng)調(diào)整來(lái)優(yōu)化生產(chǎn)網(wǎng)絡(luò)以顯著提高性能。除了利用 Jetson TX2 對(duì) FP16 的硬件支持之外， NVIDIA TensorRT 還能夠批量同時(shí)處理多個(gè)圖像，從而獲得更高的性能。

Jetson TX2 和 JetPack 3 。 0 將 Jetson 平臺(tái)的性能和效率提升到一個(gè)全新的水平，為用戶提供了在 AI 應(yīng)用中獲得兩倍或最多兩倍于 Jetson TX1 性能的選項(xiàng)。這種獨(dú)特的功能使 Jetson TX2 成為邊緣需要高效人工智能的產(chǎn)品和邊緣附近需要高性能的產(chǎn)品的理想選擇。 Jetson TX2 還與 Jetson TX1 兼容，為使用 Jetson TX1 設(shè)計(jì)的產(chǎn)品提供了一個(gè)簡(jiǎn)單的升級(jí)機(jī)會(huì)。

為了測(cè)試 Jetson TX2 和 JetPack 3 。 0 的性能，我們將其與服務(wù)器類 CPU 、 Intel Xeon E5-2690 v4 進(jìn)行比較，并使用 GoogLeNet 深度圖像識(shí)別網(wǎng)絡(luò)測(cè)量深度學(xué)習(xí)推理吞吐量（每秒圖像數(shù)）。如圖 3 所示， Jetson TX2 在低于 15W 的功率下運(yùn)行的性能優(yōu)于在接近 200W 的情況下運(yùn)行的 CPU ，從而使數(shù)據(jù)中心級(jí)的 AI 能力處于邊緣。

圖 3 ： GoogLeNet 網(wǎng)絡(luò)架構(gòu)在 NVIDIA Jetson TX2 和 Intel Xeon E5-2960 v4 上的性能。

Jetson TX2 的卓越 AI 性能和效率源于新的 Pascal GPU 架構(gòu)和動(dòng)態(tài)能量配置文件（ Max-Q 和 Max-P ）、 JetPack 3 。 0 附帶的優(yōu)化深度學(xué)習(xí)庫(kù)以及大內(nèi)存帶寬的可用性。

Max-Q 和 Max-P

Jetson TX2 設(shè)計(jì)用于 7 。 5W 功率下的峰值處理效率。這一性能水平被稱為 Max-Q ，代表功率/吞吐量曲線的峰值。模塊上的每個(gè)組件（包括電源）都經(jīng)過(guò)優(yōu)化，以提供最高的效率。 GPU 的最大 Q 頻率為 854 MHz ，而 Arm A57 CPU 的最大 Q 頻率為 1 。 2 GHz 。 JetPack 3 。 0 中的 L4T BSP 包括用于將 Jetson TX2 設(shè)置為 Max-Q 模式的預(yù)設(shè)平臺(tái)配置。 Jetpack3 。 0 還包括一個(gè)名為 nvpmodel 的新命令行工具，用于在運(yùn)行時(shí)切換配置文件。

雖然動(dòng)態(tài)電壓和頻率縮放（ DVFS ）允許 Jetson TX2 的 Tegra “ Parker ” SoC 在運(yùn)行時(shí)根據(jù)用戶負(fù)載和功耗調(diào)整時(shí)鐘速度，但 Max-Q 配置設(shè)置了時(shí)鐘上限，以確保應(yīng)用程序僅在最有效的范圍內(nèi)運(yùn)行。表 2 顯示了在運(yùn)行 GoogLeNet 和 AlexNet 深度學(xué)習(xí)基準(zhǔn)測(cè)試時(shí)， Jetson TX2 和 Jetson TX1 的性能和能效。在 Max-Q 模式下運(yùn)行的 Jetson TX2 的性能與在最大時(shí)鐘頻率下運(yùn)行的 Jetson TX1 的性能相似，但只消耗一半的功率，因此能量效率提高了一倍。

盡管功率預(yù)算有限的大多數(shù)平臺(tái)將從 Max-Q 行為中受益最大，但其他平臺(tái)可能更喜歡使用最大時(shí)鐘來(lái)達(dá)到峰值吞吐量，盡管這樣做會(huì)導(dǎo)致更高的功耗和更低的效率。 DVFS 可以配置為在其他時(shí)鐘速度范圍內(nèi)運(yùn)行，包括欠時(shí)鐘和超頻。 Max-P 是另一種預(yù)設(shè)平臺(tái)配置，可在不到 15W 的時(shí)間內(nèi)實(shí)現(xiàn)最大系統(tǒng)性能。啟用 Arm A57 群集或啟用丹佛 2 群集時(shí)， GPU 的 Max-P 頻率為 1122 MHz ， CPU 的 Max-P 頻率為 2 GHz ，當(dāng)兩個(gè)群集都啟用時(shí)， Max-P 頻率為 1 。 4 GHz 。您還可以創(chuàng)建具有中頻目標(biāo)的自定義平臺(tái)配置，以便在應(yīng)用程序的峰值效率和峰值性能之間實(shí)現(xiàn)平衡。下表 2 顯示了從 Max-Q 到 Max-P 的性能如何提高，以及如何在效率逐漸降低的情況下提高 GPU 時(shí)鐘頻率。

Jetson TX2 執(zhí)行 GoogLeNet 推理的速度高達(dá) 33 。 2 圖像/秒/瓦，幾乎是 Jetson TX1 的兩倍，效率比 Intel Xeon 高出近 20 倍。

端到端人工智能應(yīng)用

兩個(gè) Pascal 流式多處理器（ SMs ）是 Jetson TX2 高效性能的重要組成部分，每個(gè)處理器有 128 個(gè) CUDA 核。 Pascal GPU 架構(gòu) 提供了重大的性能改進(jìn)和電源優(yōu)化。 TX2 的 CPU 復(fù)合體包括雙核 7 路超標(biāo)量 NVIDIA Denver 2 ，用于動(dòng)態(tài)代碼優(yōu)化的高單線程性能，以及用于多線程處理的四核 Arm Cortex-A57 。

相干的丹佛 2 和 A57 CPU 都有一個(gè) 2MB 的二級(jí)緩存，并通過(guò)由 NVIDIA 設(shè)計(jì)的高性能互連結(jié)構(gòu)進(jìn)行連接，以在異構(gòu)多處理器（ HMP ）環(huán)境中實(shí)現(xiàn)兩個(gè) CPU 的同時(shí)操作。一致性機(jī)制允許根據(jù)動(dòng)態(tài)性能需求自由地對(duì)任務(wù)進(jìn)行 MIG 評(píng)級(jí)，以減少開(kāi)銷的方式有效地利用 CPU 核心之間的資源。

Jetson TX2 是自主機(jī)端到端 AI 管線的理想平臺(tái)。 Jetson 有線傳輸實(shí)時(shí)高帶寬數(shù)據(jù)：在處理 GPU 數(shù)據(jù)后，可同時(shí)接收多個(gè)傳感器的數(shù)據(jù)，執(zhí)行媒體解碼/編碼、組網(wǎng)和低級(jí)命令控制協(xié)議。圖 4 顯示了使用高速接口陣列（包括 CSI 、 PCIe 、 USB3 和千兆以太網(wǎng)）連接傳感器的常見(jiàn)管道配置。 CUDA 預(yù)處理和后處理階段通常包括色域轉(zhuǎn)換（成像 DNN 通常使用 BGR 平面格式）和對(duì)網(wǎng)絡(luò)輸出的統(tǒng)計(jì)分析。

圖 4 ：端到端人工智能管道，包括傳感器采集、處理、指揮和控制。

由于內(nèi)存和帶寬是 Jetson TX1 的兩倍， Jetson TX2 能夠同時(shí)捕獲和處理額外的高帶寬數(shù)據(jù)流，包括立體攝像機(jī)和 4K 超高清輸入和輸出。通過(guò)管道，深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)將來(lái)自不同來(lái)源和光譜域的多個(gè)傳感器融合在一起，從而增強(qiáng)了自動(dòng)導(dǎo)航期間的感知能力和態(tài)勢(shì)感知能力。

Jetson TX2 開(kāi)發(fā)工具包入門

首先， NVIDIA 為 Jetson TX2 開(kāi)發(fā)工具包提供了一個(gè)參考的小型 ITX 載體板（ 170 毫米 x 170 毫米）和一個(gè) 500 萬(wàn)像素的 MIPI CSI-2 相機(jī)模塊。開(kāi)發(fā)工具包包括文檔和設(shè)計(jì)示意圖以及 JetPack-L4T 的免費(fèi)軟件更新。圖 5 顯示了開(kāi)發(fā)工具包，顯示了 Jetson TX2 模塊和標(biāo)準(zhǔn) PC 連接，包括 USB3 、 HDMI 、 RJ45 千兆以太網(wǎng)、 SD 卡和 PCIe x4 插槽，這使得 Jetson 的應(yīng)用程序開(kāi)發(fā)更加容易。

要超越開(kāi)發(fā)到定制部署平臺(tái)，您可以修改開(kāi)發(fā)工具包載體板和相機(jī)模塊的參考設(shè)計(jì)文件，以創(chuàng)建自定義設(shè)計(jì)?；蛘撸?Jetson 生態(tài)系統(tǒng)合作伙伴為部署 Jetson TX1 和 Jetson TX2 模塊提供現(xiàn)成的解決方案，包括微型載體、外殼和攝像頭。 NVIDIA Developer Forums 為 Jetson 建造者和 NVIDIA 工程師社區(qū)提供技術(shù)支持和協(xié)作之家。表 3 列出了主要文件和有用的資源。

Jetson TX2 開(kāi)發(fā)工具包可通過(guò) NVIDIA 在線商店以 599 美元的價(jià)格預(yù)訂。 3 月 14 日開(kāi)始在北美和歐洲發(fā)貨，其他地區(qū)也將陸續(xù)發(fā)貨。 Jetson TX2 教育折扣還提供： 299 美元用于學(xué)術(shù)機(jī)構(gòu)的附屬機(jī)構(gòu)。 NVIDIA 已將 Jetson TX1 開(kāi)發(fā)工具包的價(jià)格降至 499 美元。

JetPack 3 。 0 SDK 開(kāi)發(fā)包

最新的 NVIDIA JetPack 3.0 支持 Jetson TX2 使用業(yè)界領(lǐng)先的 AI 開(kāi)發(fā)工具和硬件加速 API（見(jiàn)表4），包括 NVIDIA CUDA 工具包版本8.0、cuDNN、TensorRT、VisionWorks、GStreamer 和 OpenCV，這些都是在 Linux 內(nèi)核v4.4、L4T R27.1 BSP 和 Ubuntu 16.04 LTS 的基礎(chǔ)上構(gòu)建的。Jetpack3.0 包括用于交互式分析和調(diào)試的Tegra系統(tǒng)探查器和Tegra圖形調(diào)試器工具。Tegra多媒體API包括低級(jí)攝像頭捕獲和Video4Linux2（V4L2）編解碼器接口。在閃爍的同時(shí)，JetPack會(huì)自動(dòng)使用所選的軟件組件配置Jetson TX2，從而實(shí)現(xiàn)開(kāi)箱即用的完整環(huán)境

Jetson 是一個(gè)高性能的嵌入式解決方案，用于部署 Caffe 、 Torch 、 Theano 和 TensorFlow 等深度學(xué)習(xí)框架。這些和許多其他深度學(xué)習(xí)框架已經(jīng)將 NVIDIA 的 cuDNN 庫(kù)與 GPU 加速集成在一起，并且只需要很少的 MIG 定量工作就可以在 Jetson 上部署。 KZV3 的軟件和應(yīng)用程序通常在云計(jì)算中心和服務(wù)器上無(wú)縫部署［KZV3］軟件和應(yīng)用程序。

還有兩天就要演示了

NVIDIA Two Days to a Demo 是一個(gè)幫助任何人開(kāi)始部署深度學(xué)習(xí)的倡議。 NVIDIA 提供計(jì)算機(jī)視覺(jué)原語(yǔ)，包括圖像識(shí)別、目標(biāo)檢測(cè)+定位和分割，以及用 DIGITS 訓(xùn)練的神經(jīng)網(wǎng)絡(luò) 模型。您可以將這些網(wǎng)絡(luò)模型部署到 Jetson 上，以便使用 NVIDIA TensorRT 進(jìn)行有效的深度學(xué)習(xí)推斷。“兩天一個(gè)演示”提供了示例流式應(yīng)用程序，以幫助您體驗(yàn)實(shí)時(shí)攝像頭提要和真實(shí)世界的數(shù)據(jù)。

兩天的演示代碼是在 GitHub 上提供，以及易于遵循的測(cè)試和重新訓(xùn)練網(wǎng)絡(luò)模型的分步指導(dǎo)，為您的定制主題擴(kuò)展了視覺(jué)原語(yǔ)。這些教程演示了數(shù)字工作流的強(qiáng)大概念，向您展示了如何在云端或 PC 機(jī)上迭代地訓(xùn)練網(wǎng)絡(luò)模型，然后將其部署到 Jetson 上進(jìn)行運(yùn)行時(shí)推斷和進(jìn)一步的數(shù)據(jù)收集。

通過(guò)使用預(yù)先訓(xùn)練的網(wǎng)絡(luò)和轉(zhuǎn)移學(xué)習(xí)，此工作流使您可以輕松地使用自定義對(duì)象類來(lái)定制基礎(chǔ)網(wǎng)絡(luò)以滿足您的任務(wù)。一旦一個(gè)特定的網(wǎng)絡(luò)體系結(jié)構(gòu)被證明適用于某個(gè)原語(yǔ)或應(yīng)用程序，那么針對(duì)特定的用戶定義的應(yīng)用程序（例如包含新對(duì)象的訓(xùn)練數(shù)據(jù)）對(duì)其進(jìn)行重新調(diào)整或重新訓(xùn)練通常會(huì)非常容易。

正如在這個(gè)平行的博客文章中所討論的， NVIDIA 在數(shù)字 5 上增加了對(duì)分段網(wǎng)絡(luò)的支持，現(xiàn)在可以在 Jetson TX2 上使用，演示時(shí)間為兩天。分割原語(yǔ)使用完全卷積 Alexnet 架構(gòu)（ FCN-Alexnet ）對(duì)視野中的單個(gè)像素進(jìn)行分類。由于分類發(fā)生在像素級(jí)，與圖像識(shí)別中的圖像級(jí)不同，分割模型能夠提取對(duì)周圍環(huán)境的全面了解。這克服了自主導(dǎo)航機(jī)器人和無(wú)人機(jī)所面臨的重大障礙，這些機(jī)器人和無(wú)人機(jī)可以直接使用分割區(qū)域進(jìn)行路徑規(guī)劃和障礙物回避。

分段制導(dǎo)的自由空間探測(cè)使地面車輛能夠安全地在地面上導(dǎo)航，而無(wú)人機(jī)則通過(guò)視覺(jué)識(shí)別和跟蹤地平線和天空平面，以避免與障礙物和地形發(fā)生碰撞。感知和避免功能是智能機(jī)器與環(huán)境安全交互的關(guān)鍵。在 Jetson TX2 上使用 TensorRT 處理要求計(jì)算量大的分段網(wǎng)絡(luò)，對(duì)于避免事故所需的低響應(yīng)延遲至關(guān)重要。

兩天的演示包括一個(gè)使用 FCN Alexnet 的空中分割模型（圖 7 ），以及相應(yīng)的 horizon 第一人稱視圖（ FPV ）數(shù)據(jù)集?？罩蟹指钅Ｐ涂勺鳛闊o(wú)人機(jī)和自主導(dǎo)航的范例。您可以使用自定義數(shù)據(jù)輕松擴(kuò)展模型，以識(shí)別用戶定義的類，如著陸平臺(tái)和工業(yè)設(shè)備。一旦以這種方式增強(qiáng)，你就可以把它部署到裝備了 Jetson 的無(wú)人機(jī)上，比如 Teal 和 Aerialtronics 的無(wú)人機(jī)。

為了鼓勵(lì)開(kāi)發(fā)更多的自主飛行控制模式，我在 GitHub 上發(fā)布了空中訓(xùn)練數(shù)據(jù)集、分段模型和工具。 NVIDIA Jetson TX2 和 Two Days to a Demo 使在該領(lǐng)域開(kāi)始使用先進(jìn)的深度學(xué)習(xí)解決方案比以往任何時(shí)候都更容易。

Jetson 生態(tài)系統(tǒng)

Jetson TX2 的模塊化外形使其能夠部署到各種環(huán)境和場(chǎng)景中。 NVIDIA 的開(kāi)源參考載波設(shè)計(jì)來(lái)自于 Jetson TX2 開(kāi)發(fā)工具包，為縮小或修改單個(gè)項(xiàng)目需求的設(shè)計(jì)提供了一個(gè)起點(diǎn)。一些小型化的載體與 Jetson 模塊本身具有相同的 50x87mm 的占地面積，從而實(shí)現(xiàn)了緊湊的組裝，如圖 8 所示。使用 NVIDIA 提供的文檔和設(shè)計(jì)輔助資料，或嘗試現(xiàn)成的解決方案。今年 4 月， NVIDIA 將推出 Jetson TX1 和 TX2 模塊，價(jià)格分別為 299 美元和 399 美元，數(shù)量為 1000 臺(tái)或更多。

圖 8 ： ConnectTech

Sprocket

緊湊型托架組件，適用于 Jetson TX2 和 Jetson TX1 ，售價(jià) 99 美元。

生態(tài)系統(tǒng)合作伙伴{ ConnectTech ? Auvidea ?提供與 Jetson TX1 和 TX2 共享插座兼容的可部署微型載體和外殼，如圖 8 所示。 Image partners & 豹紋成像 ? 山脊跑提供攝像頭和多媒體支持。加固專家阿巴科系統(tǒng) ↓ 沃爾夫先進(jìn)技術(shù) ?為在惡劣環(huán)境下操作提供 MIL 規(guī)范的資質(zhì)。

除了用于部署到野外的緊湊型載體和外殼外， Jetson 的生態(tài)系統(tǒng)覆蓋范圍超出了典型的嵌入式應(yīng)用。 Jetson TX2 的多核 Arm / GPU 體系結(jié)構(gòu)和卓越的計(jì)算效率也讓高性能計(jì)算（ HPC ）行業(yè)備受關(guān)注。高密度 1U 機(jī)架式服務(wù)器現(xiàn)已提供萬(wàn)兆以太網(wǎng)和多達(dá) 24 個(gè) Jetson 模塊。圖 9 顯示了一個(gè)可伸縮陣列服務(wù)器的示例。 Jetson 的低功耗和被動(dòng)冷卻對(duì)于輕量級(jí)、可擴(kuò)展的云任務(wù)（包括低功耗的 web 服務(wù)器、多媒體處理和分布式計(jì)算）很有吸引力。視頻分析和代碼轉(zhuǎn)換后端通常與部署在現(xiàn)場(chǎng)的智能攝像機(jī)和物聯(lián)網(wǎng)設(shè)備上的 Jetson 配合工作，可以從 Jetson TX2 增加的每個(gè)處理器支持的同步數(shù)據(jù)流和視頻編解碼器的比率中獲益。

AI 在邊緣

Jetson TX2 無(wú)與倫比的嵌入式計(jì)算能力將尖端 DNN 和下一代人工智能帶到板上邊緣設(shè)備上。 Jetson TX2 提供服務(wù)器級(jí)的高能效性能。它的原始深度學(xué)習(xí)性能比 Intel Xeon 高出 1 。 25 倍，計(jì)算效率提高了近 20 倍。 Jetson 緊湊的占地面積、計(jì)算能力和具有深度學(xué)習(xí)功能的 JetPack 軟件堆棧使開(kāi)發(fā)人員能夠使用 AI 解決 21 世紀(jì)的挑戰(zhàn)。

關(guān)于作者

Dustin Franklin 是 NVIDIA 的 Jetson 團(tuán)隊(duì)的開(kāi)發(fā)人員布道者。 Dustin 擁有機(jī)器人和嵌入式系統(tǒng)方面的背景，他樂(lè)于在社區(qū)中提供幫助，并與 Jetson 一起參與項(xiàng)目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

嵌入式

嵌入式

+關(guān)注

關(guān)注
5052

文章
18912

瀏覽量
300789
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46348

瀏覽量
236508
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5437

瀏覽量
120791

評(píng)論

相關(guān)推薦

英偉達(dá)發(fā)布新一代H200，搭載HBM3e，推理速度是H100兩倍！

兼容，在推理速度上幾乎達(dá)到H100的兩倍。H200預(yù)計(jì)將于明年二季度開(kāi)始交付。此外，英偉達(dá)還透露，下一代Blackwell B100 GPU也將在2024年推出。 ? 英偉達(dá)預(yù)計(jì)在2024年推出H200

發(fā)表于 11-15 01:15 ?3276次閱讀

英偉達(dá)發(fā)布新一代H200，搭載HBM3e，<b class='flag-5'>推理</b>速度是H100<b class='flag-5'>兩倍</b>！

OPA842的datasheet里面單位增益帶寬是增益帶寬積的兩倍，為什么？

目前我參考的所有資料都說(shuō)是對(duì)于decompensated op amp，單位增益帶寬小于增益帶寬積，但是OPA842的datasheet里面卻是單位增益帶寬是增益帶寬積的兩倍，不知道這是為什么？

發(fā)表于 09-05 07:18

深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色，但它們各自的功能、應(yīng)用場(chǎng)景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對(duì)兩者區(qū)別的詳細(xì)探討。

發(fā)表于 07-17 18:12 ?1137次閱讀

如何在tx2部署模型

在本文中，我們將詳細(xì)介紹如何在NVIDIA Jetson TX2上部署深度學(xué)習(xí)模型。

發(fā)表于 07-09 10:16 ?417次閱讀

Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

Anthropic 發(fā)布Claude 3.5 Sonnet最新模型新模型在推理、知識(shí)和編碼能力評(píng)估方面超越了以前的版本和競(jìng)爭(zhēng)對(duì)手GPT 4o模型，同時(shí)其運(yùn)行速度是Claude 3 Opus的兩倍

發(fā)表于 06-21 15:43 ?643次閱讀

Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的<b class='flag-5'>兩倍</b>

Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無(wú)法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決？

我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ，請(qǐng)參閱 Nvidia Jetson

發(fā)表于 05-23 06:47

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

，推理能力提升 15 倍 GB200由兩個(gè)B200Blackwell GPU和一個(gè)基于Arm的Grace CPU組成，采用[臺(tái)積電]4納米工藝制程，共有2080億個(gè)[晶體管]，其AI性

發(fā)表于 05-13 17:16

利用NVIDIA組件提升GPU推理的吞吐

本實(shí)踐中，唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將

發(fā)表于 04-20 09:39 ?571次閱讀

FPGA在深度學(xué)習(xí)應(yīng)用中或將取代GPU

現(xiàn)場(chǎng)可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時(shí)面臨的許多問(wèn)題在過(guò)去的十年里，人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅

發(fā)表于 03-21 15:19

利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

本案例通過(guò)利用NVIDIA TensorRT-LLM加速指令識(shí)別深度學(xué)習(xí)模型，并借助NVIDIA Triton推理服務(wù)器在

發(fā)表于 01-17 09:30 ?606次閱讀

AD7760手冊(cè)中單端轉(zhuǎn)差分的參考電路會(huì)對(duì)信號(hào)有兩倍的放大如何修改？

AD7760手冊(cè)中單端轉(zhuǎn)差分的參考電路會(huì)對(duì)信號(hào)有兩倍的放大，這樣就降低了一半輸入信號(hào)范圍，能否改成其他沒(méi)有兩倍放大副作用的電路呢？如何修改？謝謝！

發(fā)表于 12-22 06:10

請(qǐng)問(wèn)AD2S1210故障會(huì)造成采樣到的位置數(shù)據(jù)為實(shí)際的兩倍嗎？

如題：最近做一個(gè)項(xiàng)目用到AD2S1210，現(xiàn)在指示有故障，而且輸出的位置數(shù)據(jù)為實(shí)際電機(jī)的兩倍，這個(gè)現(xiàn)象是故障造成的還是旋轉(zhuǎn)變壓器的極對(duì)數(shù)高出一倍下圖是電機(jī)線反電勢(shì)波形和旋變SIN波形，這個(gè)圖能不能看出是旋變極對(duì)數(shù)的問(wèn)題

發(fā)表于 12-18 08:14

NVIDIA Jetson 的嵌入式系統(tǒng)AI應(yīng)用

在這個(gè)平臺(tái)上可以使用多個(gè)不同的芯片，案例的主角是AIMobile AIM Edge Ncox，一款基于NVIDIA Jetson Orin NX的小型被動(dòng)冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個(gè)Arm內(nèi)核和NVIDIA Ampere

發(fā)表于 12-11 17:37 ?467次閱讀

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

交互速率運(yùn)行的 Llama-2-70B 模型。圖 1. 領(lǐng)先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能如要在 Jetson 上快速測(cè)試最新的模型和應(yīng)用，

發(fā)表于 11-07 21:25 ?844次閱讀

Banana Pi為何選擇rk3588開(kāi)發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品

與Jetson Nano引腳的兼容性。背景： Jetson Nano是NVIDIA公司推出的一款優(yōu)秀的嵌入式計(jì)算平臺(tái)，它在機(jī)器學(xué)習(xí)、人工智能和計(jì)算視覺(jué)等領(lǐng)域表現(xiàn)出色。然而，隨著技術(shù)的

發(fā)表于 11-02 12:30

搜索歷史

NVIDIA Jetson TX2 將深度學(xué)習(xí)推理提升至兩倍

評(píng)論

英偉達(dá)發(fā)布新一代H200，搭載HBM3e，推理速度是H100兩倍！

OPA842的datasheet里面單位增益帶寬是增益帶寬積的兩倍，為什么？

深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

如何在tx2部署模型

Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無(wú)法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決？

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

利用NVIDIA組件提升GPU推理的吞吐

FPGA在深度學(xué)習(xí)應(yīng)用中或將取代GPU

利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

AD7760手冊(cè)中單端轉(zhuǎn)差分的參考電路會(huì)對(duì)信號(hào)有兩倍的放大如何修改？

請(qǐng)問(wèn)AD2S1210故障會(huì)造成采樣到的位置數(shù)據(jù)為實(shí)際的兩倍嗎？

NVIDIA Jetson 的嵌入式系統(tǒng)AI應(yīng)用

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

Banana Pi為何選擇rk3588開(kāi)發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品