五月欧美激激激综合网色播,中日欧美精品在线播放

存在開發(fā)姿態(tài)估計(jì)的開源方法，但在推理性能方面不是最優(yōu)的，并且集成到生產(chǎn)應(yīng)用程序中非常耗時(shí)。通過這篇文章，我們將向您展示如何開發(fā)和部署姿勢(shì)估計(jì)模型，這些模型易于跨設(shè)備配置文件使用，性能非常好，并且非常精確。

姿勢(shì)估計(jì)已與 NVIDIA 轉(zhuǎn)移學(xué)習(xí)工具包（ TLT ） 3.0 集成，因此您可以利用 TLT 的所有功能（如模型修剪和量化）來創(chuàng)建精確和高性能的模型。經(jīng)過訓(xùn)練后，您可以部署此模型進(jìn)行推理以獲得實(shí)時(shí)性能。

本系列文章將引導(dǎo)您完成培訓(xùn)、優(yōu)化、部署實(shí)時(shí)高性能姿勢(shì)估計(jì)模型的步驟。在第 1 部分中，您將學(xué)習(xí)如何使用開放源代碼 COCO 數(shù)據(jù)集訓(xùn)練二維姿勢(shì)估計(jì)模型。在第 2 部分中，您將學(xué)習(xí)如何為推理吞吐量?jī)?yōu)化模型，然后使用 TLT-CV 推理管道部署模型。我們將 TLT 訓(xùn)練模型與其他最先進(jìn)的模型進(jìn)行了比較。

用 TLT 訓(xùn)練二維姿態(tài)估計(jì)模型

在本節(jié)中，我們將介紹有關(guān)使用 TLT 訓(xùn)練 2D 姿勢(shì)估計(jì)模型的以下主題：

Methodology

環(huán)境設(shè)置

數(shù)據(jù)準(zhǔn)備

實(shí)驗(yàn)配置文件

Training

Evaluation

模型驗(yàn)證

Methodology

BodyPoseNet 模型的目標(biāo)是預(yù)測(cè)給定輸入圖像中每個(gè)人的骨架，骨架由關(guān)鍵點(diǎn)和關(guān)鍵點(diǎn)之間的連接組成。

兩種常用的姿態(tài)估計(jì)方法是自頂向下和自下而上。自頂向下的方法通常使用對(duì)象檢測(cè)網(wǎng)絡(luò)來定位幀中所有人的邊界框，然后使用姿勢(shì)網(wǎng)絡(luò)來定位該邊界框內(nèi)的身體部位。顧名思義，自下而上的方法從下到上構(gòu)建骨架。它首先檢測(cè)一個(gè)框架內(nèi)的所有人體部位，然后使用一種方法對(duì)屬于特定人的部位進(jìn)行分組。

采用自下而上的方法有幾個(gè)原因。一是推理性能較高。與自頂向下的姿勢(shì)估計(jì)方法不同，自下而上的方法不需要單獨(dú)的人檢測(cè)器。計(jì)算不會(huì)隨場(chǎng)景中的人數(shù)線性縮放。這使您能夠?qū)崿F(xiàn)擁擠場(chǎng)景的實(shí)時(shí)性能。此外，自底向上還具有全局上下文的優(yōu)點(diǎn)，因?yàn)閷⒄麄€(gè)圖像作為輸入提供給網(wǎng)絡(luò)。它可以更好地處理復(fù)雜的姿勢(shì)和擁擠。

鑒于這些原因，這種方法的目的是實(shí)現(xiàn)有效的單桿，自下而上的姿態(tài)估計(jì)，同時(shí)也提供競(jìng)爭(zhēng)力的準(zhǔn)確性。本文使用的默認(rèn)模型是完全卷積模型，由主干網(wǎng)、初始預(yù)測(cè)階段組成，該階段對(duì)置信圖（ heatmap ）和部分親和場(chǎng)（ PAF ）進(jìn)行像素級(jí)預(yù)測(cè)，然后對(duì)初始預(yù)測(cè)進(jìn)行多級(jí)細(xì)化（ 0 到 N 階段）。此解決方案簡(jiǎn)化并抽象了自底向上方法的許多復(fù)雜性，同時(shí)允許針對(duì)特定應(yīng)用程序調(diào)整必要的旋鈕。

圖 1 。默認(rèn)模型架構(gòu)的簡(jiǎn)化框圖。

PAFs 是一種用自下而上的方法表示關(guān)聯(lián)分?jǐn)?shù)的方法。有關(guān)詳細(xì)信息，請(qǐng)參閱基于部分相似域的實(shí)時(shí)多人二維姿態(tài)估計(jì) 。它由一組二維向量場(chǎng)組成，對(duì)肢體的位置和方向進(jìn)行編碼。這與熱圖相關(guān)聯(lián)，用于在后處理期間通過執(zhí)行二部匹配和關(guān)聯(lián)身體部位候選來構(gòu)建骨架。

環(huán)境設(shè)置

NVIDIA TLT 工具包有助于抽象出 AI / DL 框架的復(fù)雜性，并使您能夠更快地構(gòu)建生產(chǎn)質(zhì)量模型，而無需編碼。有關(guān)硬件和軟件要求、設(shè)置所需依賴項(xiàng)以及安裝 TLT 啟動(dòng)器的更多信息，請(qǐng)參閱 TLT 快速入門指南。

使用以下命令下載最新示例：

ngc registry resource download-version "nvidia/tlt_cv_samples:v1.1.0"

您可以在tlt_cv_samples:v1.1.0/bpnet找到示例筆記本，其中還包含所有詳細(xì)步驟。

為 cleaner 命令行命令設(shè)置 env 變量。更新以下變量值：

 export KEY=
 export NUM_GPUS=1
 # Local paths
 # The dataset is expected to be present in $LOCAL_PROJECT_DIR/bpnet/data. 
 export LOCAL_PROJECT_DIR=/home//tlt-experiments
 export SAMPLES_DIR=/home//tlt_cv_samples_vv1.1.0
 # Container paths
 export USER_EXPERIMENT_DIR=/workspace/tlt-experiments/bpnet
 export DATA_DIR=/workspace/tlt-experiments/bpnet/data
 export SPECS_DIR=/workspace/examples/bpnet/specs
 export DATA_POSE_SPECS_DIR=/workspace/examples/bpnet/data_pose_config
 export MODEL_POSE_SPECS_DIR=/workspace/examples/bpnet/model_pose_config

要運(yùn)行 TLT 啟動(dòng)程序，請(qǐng)使用~/.tlt_mounts.json文件將本地計(jì)算機(jī)上的~/ TLT-experiments 目錄映射到 Docker 容器。有關(guān)詳細(xì)信息，請(qǐng)參閱TLT 發(fā)射器。

創(chuàng)建~/.tlt_mounts.json文件并更新其中的以下內(nèi)容：

 {
  "Mounts": [
  {
  "source": "/home//tlt-experiments",
  "destination": "/workspace/tlt-experiments"
  },
  {
  "source": "/home//tlt_cv_samples_vv1.1.0/bpnet/specs",
  "destination": "/workspace/examples/bpnet/specs"
  },
  {
  "source": "/home//tlt_cv_samples_vv1.1.0/bpnet/data_pose_config",
  "destination": "/workspace/examples/bpnet/data_pose_config"
  },
  {
  "source": "/home//tlt_cv_samples_vv1.1.0/bpnet/model_pose_config",
  "destination": "/workspace/examples/bpnet/model_pose_config"
  }
  ]
 }

確保要裝載的源目錄路徑有效。這會(huì)將主機(jī)上的路徑/home//tlt-experiments裝載為容器內(nèi)的路徑/workspace/tlt-experiments。它還將下載的規(guī)范裝載到主機(jī)上，使其成為容器內(nèi)的路徑/workspace/examples/bpnet/specs、/workspace/examples/bpnet/data_pose_config和/workspace/examples/bpnet/model_pose_config。

通過運(yùn)行以下命令，確保已安裝所需的依賴項(xiàng)：

 # Install requirements 
 pip3 install -r $SAMPLES_DIR/deps/requirements-pip.txt

下載預(yù)訓(xùn)練模型

首先，設(shè)置一個(gè)NGC帳戶，然后下載預(yù)訓(xùn)練模型。目前，只支持 vgg19 主干網(wǎng)。

 # Create the target destination to download the model.
 mkdir -p $LOCAL_EXPERIMENT_DIR/pretrained_vgg19/
 
 # Download the pretrained model from NGC
 ngc registry model download-version nvidia/tlt_bodyposenet:vgg19 \
  --dest $LOCAL_EXPERIMENT_DIR/pretrained_vgg19

數(shù)據(jù)準(zhǔn)備

我們以本文中的 COCO （ context 上的公共對(duì)象） 2017 數(shù)據(jù)集為例。下載數(shù)據(jù)集并按照說明提取：

將 images 目錄解壓到$LOCAL_DATA_DIR目錄中，并將注釋解壓到$LOCAL_DATA_DIR/annotations中。

要準(zhǔn)備用于訓(xùn)練的數(shù)據(jù)，必須生成分段掩碼，用于掩蓋未標(biāo)記人員和 TFR 記錄的丟失，以提供給訓(xùn)練管道。掩碼文件夾基于coco_spec.json文件中提供的路徑[mask_root_dir_path目錄是root_directory_path的相對(duì)路徑，mask_root_dir_path和annotation_root_dir_path也是如此。

 # Generate TFRecords for training dataset
 tlt bpnet dataset_convert \
  -m 'train' \
  -o $DATA_DIR/train \
  --generate_masks \
  --dataset_spec $DATA_POSE_SPECS_DIR/coco_spec.json
 
 # Generate TFRecords for validation dataset
 tlt bpnet dataset_convert \
  -m 'test' \
  -o $DATA_DIR/val \
  --generate_masks \
  --dataset_spec $DATA_POSE_SPECS_DIR/coco_spec.json

要將此示例用于自定義數(shù)據(jù)集，請(qǐng)執(zhí)行以下操作：

以類似于 COCO 數(shù)據(jù)集的格式準(zhǔn)備數(shù)據(jù)和注釋。
在 data \ u pose \ u config 下創(chuàng)建一個(gè)數(shù)據(jù)集規(guī)范，類似于 coco \ u spec . json ，其中包括數(shù)據(jù)集路徑、姿勢(shì)配置、遮擋標(biāo)記約定等。
將注釋轉(zhuǎn)換為 COCO 注釋格式。

有關(guān)更多信息，請(qǐng)參閱以下文檔：

列車試驗(yàn)配置文件

下一步是為培訓(xùn)配置 spec 文件。實(shí)驗(yàn)規(guī)范文件是必不可少的，因?yàn)樗幾g了實(shí)現(xiàn)良好模型所需的所有超參數(shù)。 BodyPoseNet 訓(xùn)練的規(guī)范文件配置訓(xùn)練管道的以下組件：

Trainer
Dataloader
Augmentation
標(biāo)簽處理機(jī)
Model
Optimizer

您可以在$SPECS_DIR/bpnet_train_m1_coco.yaml中找到默認(rèn)規(guī)范文件。我們?cè)谝?guī)范文件的每個(gè)組件上展開，但這里不包括所有參數(shù)。有關(guān)詳細(xì)信息，請(qǐng)參閱創(chuàng)建列車試驗(yàn)配置文件。

培訓(xùn)師（頂級(jí)配置）

頂層實(shí)驗(yàn)配置包括實(shí)驗(yàn)的基本參數(shù)；例如，歷元數(shù)、預(yù)訓(xùn)練權(quán)重、是否加載預(yù)訓(xùn)練圖等。根據(jù)checkpoint_n_epoch值保存加密的檢查點(diǎn)。下面是一些頂級(jí)配置的代碼示例。

checkpoint_dir: /workspace/tlt-experiments/bpnet/models/exp_m1_unpruned
 checkpoint_n_epoch: 5
 num_epoch: 100
 pretrained_weights: /workspace/tlt-experiments/bpnet/pretrained_vgg19/tlt_bodyposenet_vvgg19/vgg_19.hdf5
 load_graph: False
 use_stagewise_lr_multipliers: True
 ...

所有路徑（checkpoint_dir和pretrained_weights）都是 Docker 容器的內(nèi)部路徑。要驗(yàn)證正確性，請(qǐng)選中~/.tlt_mounts.json。有關(guān)這些參數(shù)的更多信息，請(qǐng)參閱身體姿勢(shì)訓(xùn)練器部分。

Dataloader

本節(jié)幫助您定義數(shù)據(jù)路徑、圖像配置、目標(biāo)姿勢(shì)配置、規(guī)范化參數(shù)等。augmentation_config部分提供了一些動(dòng)態(tài)增強(qiáng)選項(xiàng)。它支持基本的空間增強(qiáng)，例如翻轉(zhuǎn)、縮放、旋轉(zhuǎn)和平移，這些都可以在訓(xùn)練實(shí)驗(yàn)之前配置。label_processor_config部分提供了配置地面實(shí)況要素圖生成所需的參數(shù)。

dataloader:
  batch_size: 10
  pose_config:
  target_shape: [32, 32]
  pose_config_path: /workspace/examples/bpnet/model_pose_config/bpnet_18joints.json
  image_config:
  image_dims:
  height: 256
  width: 256
  channels: 3
  image_encoding: jpg
  dataset_config:
  root_data_path: /workspace/tlt-experiments/bpnet/data/
  train_records_folder_path: /workspace/tlt-experiments/bpnet/data
  train_records_path: [train-fold-000-of-001]
  dataset_specs:
  coco: /workspace/examples/bpnet/data_pose_config/coco_spec.json
  normalization_params:
  ...
  augmentation_config:
  spatial_augmentation_mode: person_centric
  spatial_aug_params:
  flip_lr_prob: 0.5
  flip_tb_prob: 0.0
  ...
  label_processor_config:
  paf_gaussian_sigma: 0.03
  heatmap_gaussian_sigma: 7.0
  paf_ortho_dist_thresh: 1.0

target_shape值取決于image_dims和模型步幅值（target_shape=input_shape/model stride）。當(dāng)前模型的步幅為 8 。
確保使用與dataset_spec中的root_directory_path相同的root_data_path值。dataset_spec中的掩碼和圖像數(shù)據(jù)目錄相對(duì)于root_data_path。
所有路徑，包括pose_config_path、dataset_config和dataset_specs，都是 Docker 的內(nèi)部路徑。
支持多種spatial_augmentation_modes：
- person_centric：增強(qiáng)是圍繞一個(gè)對(duì)基本真相感興趣的人。
- standard：增強(qiáng)是標(biāo)準(zhǔn)的（即，以圖像中心為中心），并且保留圖像的縱橫比。
- standard_with_fixed_aspect_ratio：與標(biāo)準(zhǔn)相同，但縱橫比固定為網(wǎng)絡(luò)輸入縱橫比。

有關(guān)每個(gè)參數(shù)的詳細(xì)信息，請(qǐng)參閱Dataloader部分。

Model

BodyPoseNet 模型可以使用 spec 文件中的 model 選項(xiàng)進(jìn)行配置。下面是一個(gè)示例模型配置，用于實(shí)例化基于 VGG19 主干網(wǎng)的自定義模型。

model:
 backbone_attributes:
  architecture: vgg
 stages: 3
 heat_channels: 19
 paf_channels: 38
 use_self_attention: False
 data_format: channels_last
 use_bias: True
 regularization_type: l1
 kernel_regularization_factor: 5.0e-4
 bias_regularization_factor: 0.0
 ...

網(wǎng)絡(luò)中用于姿勢(shì)估計(jì)的總階段數(shù)（細(xì)化階段+ 1 ）由stages參數(shù)捕獲，該參數(shù)取任何值>= 2 。我們建議在修剪前訓(xùn)練網(wǎng)絡(luò)時(shí)使用 L1 正則化器，因?yàn)?L1 正則化使修剪網(wǎng)絡(luò)權(quán)重更容易。有關(guān)模型中每個(gè)參數(shù)的詳細(xì)信息，請(qǐng)參閱Model部分。

優(yōu)化

本節(jié)介紹如何配置優(yōu)化器和學(xué)習(xí)速率計(jì)劃：

optimizer:
  __class_name__: WeightedMomentumOptimizer
  learning_rate_schedule:
  __class_name__: SoftstartAnnealingLearningRateSchedule
  soft_start: 0.05
  annealing: 0.5
  base_learning_rate: 2.e-5
  min_learning_rate: 8.e-08
  momentum: 0.9
  use_nesterov: False

默認(rèn)的base_learning_rate是為單個(gè) GPU 訓(xùn)練設(shè)置的。要使用多 GPU 訓(xùn)練，可能需要修改“學(xué)習(xí)率”值以獲得類似的精度。在大多數(shù)情況下，將學(xué)習(xí)率提高一倍$NUM_GPUS將是一個(gè)良好的開端。例如，如果您使用兩個(gè) GPU ，請(qǐng)?jiān)谝粋€(gè) GPU 設(shè)置中使用2 * base_learning_rate，如果您使用四個(gè) GPU ，請(qǐng)使用4 * base_learning_rate。有關(guān)模型中每個(gè)參數(shù)的詳細(xì)信息，請(qǐng)參閱Optimizer部分。

訓(xùn)練

在完成生成 TFRecords 和 mask 的步驟并設(shè)置了一個(gè) train 規(guī)范文件之后，現(xiàn)在就可以開始訓(xùn)練 body pose estimation 網(wǎng)絡(luò)了。使用以下命令啟動(dòng)培訓(xùn)：

tlt bpnet train -e $SPECS_DIR/bpnet_train_m1_coco.yaml \
  -r $USER_EXPERIMENT_DIR/models/exp_m1_unpruned \
  -k $KEY \
  --gpus $NUM_GPUS

使用更多 GPU 進(jìn)行培訓(xùn)可以使網(wǎng)絡(luò)更快地接收更多數(shù)據(jù)，從而在開發(fā)過程中節(jié)省寶貴的時(shí)間。 TLT 支持多 GPU 訓(xùn)練，因此可以使用多個(gè) GPU 并行訓(xùn)練模型。我們建議使用四個(gè)或更多的 GPU 來訓(xùn)練模型，因?yàn)橐粋€(gè) GPU MIG ht 需要幾天才能完成。訓(xùn)練時(shí)間大致減少了一個(gè)系數(shù)$NUM_GPUS。確保根據(jù)Optimizer一節(jié)中描述的線性縮放方法相應(yīng)地更新學(xué)習(xí)速率。

BodyPoseNet 支持從檢查點(diǎn)重新啟動(dòng)。如果訓(xùn)練作業(yè)過早終止，只需重新運(yùn)行相同的命令，就可以從上次保存的檢查點(diǎn)恢復(fù)訓(xùn)練。重新啟動(dòng)培訓(xùn)時(shí)，請(qǐng)確保使用相同數(shù)量的 GPU 。

評(píng)估

從配置推斷和評(píng)估規(guī)范文件開始。下面的代碼示例是一個(gè)示例規(guī)范：

model_path: /workspace/tlt-experiments/bpnet/models/exp_m1_unpruned/bpnet_model.tlt
 train_spec: /workspace/examples/bpnet/specs/bpnet_train_m1_coco.yaml
 input_shape: [368, 368]
 # choose from: {pad_image_input, adjust_network_input, None}
 keep_aspect_ratio_mode: adjust_network_input
 output_stage_to_use: null
 output_upsampling_factor: [8, 8]
 heatmap_threshold: 0.1
 paf_threshold: 0.05
 multi_scale_inference: False
 scales: [0.5, 1.0, 1.5, 2.0]

此處的input_shape值可以不同于用于培訓(xùn)的input_dims值。multi_scale_inference參數(shù)可在提供的比例上啟用多比例優(yōu)化。因?yàn)槟褂玫氖遣椒?8 的模型，output_upsampling_factor設(shè)置為 8 。

為了使評(píng)估與自底向上的人體姿勢(shì)估計(jì)研究保持一致，有兩種模式和規(guī)范文件來評(píng)估模型：

$SPECS_DIR/infer_spec.yaml：?jiǎn)慰潭?，非?yán)格輸入。此配置對(duì)輸入圖像進(jìn)行單比例推斷。通過固定網(wǎng)絡(luò)輸入的一側(cè)（高度或?qū)挾龋⒄{(diào)整另一側(cè)以匹配輸入圖像的縱橫比，來保持輸入圖像的縱橫比。
$SPECS_DIR/infer_spec_refine.yaml：多尺度、非嚴(yán)格輸入。此配置對(duì)輸入圖像進(jìn)行多尺度推斷。電子秤是可配置的。

還有一種模式主要用于驗(yàn)證最終導(dǎo)出的 TRT 模型。在后面的章節(jié)中使用這個(gè)。

$SPECS_DIR/infer_spec_strict.yaml：?jiǎn)慰潭?，?yán)格輸入。此配置對(duì)輸入圖像進(jìn)行單比例推斷。當(dāng) TRT 模型的輸入尺寸固定時(shí)，根據(jù)需要在側(cè)面填充圖像以適應(yīng)網(wǎng)絡(luò)輸入尺寸，從而保留輸入圖像的縱橫比。

--model_filename參數(shù)重寫推理規(guī)范文件中的model_path變量。

要計(jì)算模型，請(qǐng)使用以下命令：

# Single-scale evaluation
 tlt bpnet evaluate --inference_spec $SPECS_DIR/infer_spec.yaml \
  --model_filename $USER_EXPERIMENT_DIR/models/exp_m1_unpruned/$MODEL_CHECKPOINT \
  --dataset_spec $DATA_POSE_SPECS_DIR/coco_spec.json \
  --results_dir $USER_EXPERIMENT_DIR/results/exp_m1_unpruned/eval_default \
  -k $KEY

模型驗(yàn)證

現(xiàn)在您已經(jīng)訓(xùn)練了模型，運(yùn)行推斷并驗(yàn)證預(yù)測(cè)。要使用 TLT 直觀地驗(yàn)證模型，請(qǐng)使用tlt bpnet inference命令。該工具支持對(duì).tlt模型和 TensorRT.engine模型運(yùn)行推理。它在detections.json中生成帶注釋的圖像，在這些圖像上渲染骨架，并逐幀序列化關(guān)鍵點(diǎn)標(biāo)簽和元數(shù)據(jù)。例如，要使用經(jīng)過訓(xùn)練的.tlt模型運(yùn)行推理，請(qǐng)運(yùn)行以下命令：

tlt bpnet inference --inference_spec $SPECS_DIR/infer_spec.yaml \
  --model_filename $USER_EXPERIMENT_DIR/models/exp_m1_unpruned/$MODEL_CHECKPOINT \
  --input_type dir \
  --input $USER_EXPERIMENT_DIR/data/sample_images \
  --results_dir $USER_EXPERIMENT_DIR/results/exp_m1_unpruned/infer_default \
  --dump_visualizations \
  -k $KEY

圖 1 顯示了原始圖像的一個(gè)示例，圖 2 顯示了渲染姿勢(shì)結(jié)果的輸出圖像。如您所見，該模型對(duì)不同于 COCO 訓(xùn)練數(shù)據(jù)的圖像具有魯棒性。

結(jié)論

在這篇文章中，您學(xué)習(xí)了如何使用 TLT 中的 BodyPoseNet 應(yīng)用程序訓(xùn)練身體姿勢(shì)模型。這篇文章展示了從 NGC 獲取一個(gè)帶有預(yù)訓(xùn)練主干的開源 COCO 數(shù)據(jù)集，用 TLT 訓(xùn)練一個(gè)模型。要優(yōu)化用于推理和部署的訓(xùn)練模型，請(qǐng)參見二維姿態(tài)估計(jì)模型的訓(xùn)練與優(yōu)化，第 2 部分。

關(guān)于作者

Sakthivel Sivaraman 是 NVIDIA 的高級(jí)軟件工程師，專注于開發(fā)深度學(xué)習(xí)和計(jì)算機(jī)視覺解決方案，并將其部署到邊緣。在 2018 參加“ ZVK3］之前，他從賓夕法尼亞大學(xué)獲得機(jī)器人學(xué)博士學(xué)位。他的研究興趣包括計(jì)算機(jī)視覺、深度學(xué)習(xí)和機(jī)器人技術(shù)。

Rajath Shetty 是 NVIDIA 的工程經(jīng)理，負(fù)責(zé)在汽車和醫(yī)療保健領(lǐng)域應(yīng)用深度學(xué)習(xí)和計(jì)算機(jī)視覺的項(xiàng)目。他的興趣涉及邊緣計(jì)算、算法和人工智能應(yīng)用軟件棧。他擁有喬治亞理工學(xué)院的電子和計(jì)算機(jī)工程碩士學(xué)位。

Chintan Shah 是 NVIDIA 的產(chǎn)品經(jīng)理，專注于智能視頻分析解決方案的 AI 產(chǎn)品。他管理工具箱，用于有效的深度學(xué)習(xí)培訓(xùn)和實(shí)時(shí)推理。在他之前的工作中，他正在為 NVIDIA GPU 開發(fā)硬件 IP 。他擁有北卡羅來納州立大學(xué)電氣工程碩士學(xué)位。

Niral Pathak 是 NVIDIA 的軟件工程師，致力于計(jì)算機(jī)視覺解決方案的部署。他擁有加州大學(xué)圣地亞哥分校電子和計(jì)算機(jī)工程碩士學(xué)位。他的興趣包括計(jì)算機(jī)視覺、深度學(xué)習(xí)和機(jī)器人技術(shù)。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4814

瀏覽量
102631
應(yīng)用程序

應(yīng)用程序

+關(guān)注

關(guān)注
37

文章
3221

瀏覽量
57500

評(píng)論

相關(guān)推薦

NFC和二維碼掃描二合一的設(shè)備，用于產(chǎn)線數(shù)據(jù)采集

在當(dāng)今數(shù)字化的工業(yè)生產(chǎn)環(huán)境中，高效、準(zhǔn)確的數(shù)據(jù)采集對(duì)于優(yōu)化生產(chǎn)流程、提升產(chǎn)品質(zhì)量和管理效率至關(guān)重要。NFC和二維碼掃描二合一的設(shè)備應(yīng)運(yùn)而生，為產(chǎn)線數(shù)

發(fā)表于 09-05 14:36 ?188次閱讀

如何為柜式終端設(shè)備選配（集成）二維碼模塊？

的設(shè)計(jì)與升級(jí)過程中，集成高性能的二維碼模塊是提升用戶體驗(yàn)、優(yōu)化業(yè)務(wù)流程的關(guān)鍵一環(huán)。首要考慮的是功能需求匹配，根據(jù)具體應(yīng)用場(chǎng)景，甄選既能讀取傳統(tǒng)二維碼又能識(shí)別屏幕碼

發(fā)表于 08-05 15:48 ?172次閱讀

Labview生成二維碼

?Labview 的一個(gè)Demo，生成二維碼。

發(fā)表于 08-01 17:12 ?6次下載

深度學(xué)習(xí)模型訓(xùn)練過程詳解

深度學(xué)習(xí)模型訓(xùn)練是一個(gè)復(fù)雜且關(guān)鍵的過程，它涉及大量的數(shù)據(jù)、計(jì)算資源和精心設(shè)計(jì)的算法。訓(xùn)練一個(gè)深度學(xué)習(xí)模型，本質(zhì)上是通過

發(fā)表于 07-01 16:13 ?762次閱讀

技術(shù)|二維PDOA平面定位方案

一、方案概述二維平面定位系統(tǒng)，采用UWB定位技術(shù)，精度可到30cm。通過PDOA算法，可實(shí)現(xiàn)單基站二維平面的實(shí)時(shí)人員定位，增強(qiáng)對(duì)危險(xiǎn)區(qū)域的管控，有效預(yù)防安全事故發(fā)生。面對(duì)突發(fā)情況，能做到及時(shí)報(bào)警響應(yīng)

發(fā)表于 06-04 14:53 ?711次閱讀

二維PDMA可以使用描述符鏈嗎？

我正在嘗試使用二維描述符連鎖。編寫了一些二維描述符鏈的代碼。但我有一些疑問，比如 1.二維 PDMA 可以使用描述符鏈嗎？ 2.如果 1 是，請(qǐng)附上一些代碼我們是否可以使用 2 個(gè)結(jié)構(gòu)或只使用 1 個(gè)結(jié)構(gòu)即可。

發(fā)表于 05-31 08:16

想將一個(gè)二維數(shù)據(jù)表放在FLASH中,應(yīng)如何讀寫？

我想將一個(gè)二維數(shù)據(jù)表放在FLASH中,應(yīng)如何讀寫

發(fā)表于 05-17 07:20

使用愛芯派Pro開發(fā)板部署人體姿態(tài)估計(jì)模型

部署模型的整體架構(gòu)。接下來就回到最開始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對(duì)一些輕量化人體姿態(tài)估計(jì)

發(fā)表于 01-09 09:50 ?1271次閱讀

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署前期準(zhǔn)備

部署模型的整體架構(gòu)。接下來就回到最開始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對(duì)一些輕量化人體姿態(tài)估計(jì)

發(fā)表于 01-01 01:04

基于YOLOv8實(shí)現(xiàn)自定義姿態(tài)評(píng)估模型訓(xùn)練

Hello大家好，今天給大家分享一下如何基于YOLOv8姿態(tài)評(píng)估模型，實(shí)現(xiàn)在自定義數(shù)據(jù)集上，完成自定義姿態(tài)評(píng)估模型的

發(fā)表于 12-25 11:29 ?2619次閱讀

LabVIEW開發(fā)二維激光振鏡掃描控制系統(tǒng)

以及驅(qū)動(dòng)器底層驅(qū)動(dòng)軟件的開發(fā)。此外，還對(duì)掃描圖形的幾何失真進(jìn)行了分析和校正?；谶@些工作，二維激光振鏡掃描控制系統(tǒng)被應(yīng)用于打標(biāo)實(shí)驗(yàn)，通過實(shí)驗(yàn)結(jié)果分析，對(duì)系統(tǒng)進(jìn)行了優(yōu)化，以滿足性能指標(biāo)要求。在

發(fā)表于 12-22 11:00

將一維數(shù)組轉(zhuǎn)為二維python

將一維數(shù)組轉(zhuǎn)為二維數(shù)組是一個(gè)常見的問題，特別是在處理數(shù)據(jù)時(shí)。一維數(shù)組是由一個(gè)連續(xù)的數(shù)據(jù)塊組成，而二維

發(fā)表于 11-23 14:54 ?4630次閱讀

python如何定義二維空數(shù)組

在Python中，可以通過使用列表嵌套的方式來定義二維空數(shù)組。具體步驟如下： Step 1: 創(chuàng)建一個(gè)空的二維列表要?jiǎng)?chuàng)建一個(gè)空的二維數(shù)組，首先需要定義數(shù)組的行數(shù)和列數(shù)。我們可以使用兩個(gè)變量來表示行

發(fā)表于 11-21 15:12 ?1538次閱讀

python怎么創(chuàng)建二維數(shù)組

它們的優(yōu)缺點(diǎn)和一些常見的操作。使用嵌套列表創(chuàng)建二維數(shù)組: 嵌套列表是Python中創(chuàng)建二維數(shù)組最簡(jiǎn)單和最基本的方法之一。每個(gè)內(nèi)部的列表都代表了一行或者一列數(shù)據(jù)。下面是一個(gè)創(chuàng)建二維數(shù)組

發(fā)表于 11-21 15:10 ?3446次閱讀

基于飛控的姿態(tài)估計(jì)算法作用及原理

? 姿態(tài)估計(jì)的作用？ 姿態(tài)估計(jì)是飛控算法的一個(gè)基礎(chǔ)部分，而且十分重要。為了完成飛行器平穩(wěn)的姿態(tài)控制，首先需要精準(zhǔn)的

發(fā)表于 11-13 11:00 ?847次閱讀