亚洲午夜片手机在线播放,亚洲一级毛片久久精品

NVIDIA 計算架構團隊和NVIDIA 計算專家團隊正在熱招！

如果你對加速計算領域充滿熱情，并且希望與優(yōu)秀的技術專家一起合作，那么這個機會將是你展現(xiàn)才華的優(yōu)質平臺，快來加入！

NVIDIA 計算架構團隊

熱門崗位：

簡歷請投遞至：

sh-recruitment@nvidia.com

Deep Learning Perf ormance Architect - Triton / LLM - TensorRT

工作內容：圍繞深度學習端到端 AI 軟件全棧，包括但不限于：訓練框架、核心計算庫、推理優(yōu)化工具（比如 TensorRT）、AI 編譯器、模型壓縮等全棧軟件棧，以及可以在 AI 軟件全?；A上影響到下一代甚至下兩代硬件架構的特性設計。

技能要求: 良好 C++ 編程，熟悉 AI 軟件棧底層或者計算機體系結構，熟悉上層算法與 Python 是加分項。

工作地點：北京 / 上海

Deep Learning Performance Architect - TensorRT

工作內容：NVIDIA 深度學習推理引擎 TensorRT 的設計、開發(fā)和維護工作（比如，TensorRT 模型導入的流程和相關工具，圖優(yōu)化，算子的 CUDA 實現(xiàn)及代碼生成，算子性能優(yōu)化等)，以及對當前主流的深度學習模型使用 TensorRT 進行推理的性能進行分析和優(yōu)化。同時，還將與 NVIDIA GPU 體系結構設計團隊合作，來推動 NVIDIA 深度學習解決方案的軟硬件協(xié)同設計和研發(fā)。

技能要求:熟練掌握 C++ 編程。

加分技能 / 經驗: 深度學習框架 / 深度學習編譯器開發(fā)，性能分析 / 建模 / 優(yōu)化相關的方法論 / 工具，計算機體系結構相關知識，CUDA kernel 開發(fā) / 優(yōu)化。

工作地點：上海 / 北京

Deep Learning Performance Architect - Operator

工作內容：針對不同 GPU 架構為 TensorRT、cuDNN、cuBLAS2、cuSPARSE 等深度學習算子庫提供高性能基礎算子以及算子融合實現(xiàn)，包含在線代碼生成，代碼融合等相關開發(fā)工作，以及根據(jù)當代 GPU 優(yōu)化瓶頸影響后續(xù)硬件架構特征設計和驗證工作。

技能要求:良好 C++ 編程、熟悉計算機體系結構，有 TVM、MLIR 相關開發(fā)經驗是加分項。

工作地點：上海 / 北京

Deep Learning Performance Architect

工作內容：圍繞運算架構的全棧優(yōu)化，包括但不限于：深度學習模型分析與預測、架構的性能分析、編譯器性能分析，以及對主流運算架構和軟件生態(tài)的分析。使 NVIDIA 軟件生態(tài)與計算架構更好的支持主流應用。

技能要求:良好 C++ / Python 編程，熟悉 AI 軟件或者計算機體系結構。

工作地點：上海

上下滑動查看更多職位詳情

團隊介紹

算力是 AI 時代的基礎設施，而“后摩爾定律時代”，軟硬件協(xié)同設計，才是加速計算的未來！

NVIDIA 計算架構團隊歷經 CUDA 并行編程模型從起步至今的所有階段，其間參與了數(shù)代通用 GPU 計算架構及之上的包括 cuDNN、TensorRT、底層高性能算子、并行編程語言在內的加速軟件棧的研發(fā)工作。該團隊同時參與關鍵機器學習模型的算法及框架優(yōu)化。

目前，該團隊開放多個職位等你的加入！與我們共同書寫下一代 AI 計算架構的未來！

NVIDIA 計算架構團隊旨在推動算法、并行編程模型、核心加速軟件庫及 GPU 體系結構的協(xié)同設計和演化，在高速發(fā)展的深度學習算法與 GPU 硬件體系結構之間建立橋梁，并研發(fā)先進的軟硬件協(xié)同的加速計算解決方案。

該團隊從高性能計算、深度學習、自動駕駛等計算應用領域出發(fā)，跟蹤學界、工業(yè)界前沿算法，并掌握其發(fā)展方向；通過對前沿算法（比如：神經網絡結構）的深入理解，分析并提出芯片架構的需求，包含指令集、編程模型、計算能力、訪存帶寬、片上存儲、片上網絡及網絡互聯(lián)等。

同時，承擔基于架構的計算加速軟件棧的開發(fā)及產品化工作。自底層加速核心算子開發(fā)及優(yōu)化，基于硬件加速的并行編程模型的研發(fā)和編譯，TensorRT、cuDNN 等核心加速庫，直到上層訓練框架、編譯優(yōu)化。以及，針對模型的混合精度、稀疏矩陣訓練及量化方法開發(fā)。

上下滑動查看更多詳情

團隊發(fā)展

該團隊基于硬件架構開發(fā)軟件、編程模型、算法實現(xiàn)，通過算法、軟件開發(fā)實踐反饋并推動硬件架構優(yōu)化，形成閉環(huán)，最終實現(xiàn)軟件、編程模型及硬件架構的協(xié)同演化和迭代，達到極致計算加速的目標：

建立下一代芯片性能模型、搭建芯片性能分析平臺、調研下一代芯片新特性
研發(fā)及設計新的加速指令、開發(fā)原型代碼及編程模型、迭代優(yōu)化下一代芯片架構
跟蹤下一代芯片新特性在應用中的落地實現(xiàn)（算子實現(xiàn)、編譯等）
開發(fā)集成最終軟件產品庫 - TensorRT，cuDNN
優(yōu)化訓練框架（MLPerf 各項優(yōu)化）
開發(fā)混合精度、稀疏矩陣及量化方法

上下滑動查看更多詳情

NVIDIA 計算專家團隊

熱門崗位：

簡歷請投遞至：

sh-recruitment@nvidia.com

Developer Technology Engineer

工作內容：

包括大語言模型、生成式 AI、推薦系統(tǒng)在內的深度學習、機器學習、數(shù)據(jù)分析領域新技術，以及編程實現(xiàn)、優(yōu)化、模型、算法等方面的研究和開發(fā)；
工業(yè)界實際應用的深度分析和優(yōu)化，以保證該類應用在當前和未來的 NVIDIA 架構上都能保持卓越性能；
為關鍵客戶（業(yè)界頭部公司）提供合適的 AI 解決方案；
和 GPU / CPU / DPU 架構團隊、研究團隊、應用庫和開發(fā)工具團隊、系統(tǒng)軟件團隊等緊密合作來影響下一代產品架構、軟件平臺和編程模式的設計與開發(fā)；
與世界各地的優(yōu)秀同事一起助力深度學習技術在互聯(lián)網、交通、金融、醫(yī)療等各領域的落地。

基本要求：

計算機科學相關專業(yè)優(yōu)秀碩士、博士畢業(yè)生；
擁有良好的 C / C++ / Python 編程能力，良好的軟件設計和開發(fā)能力；
（二選一）有并行計算編程基礎，有 CUDA / C / C++ / Python 編程經驗；
（二選一）擁有深度學習，機器學習領域的扎實理論基礎，熟悉常見的深度學習網絡或機器學習算法；
良好的溝通能力、解決問題能力、時間管理能力和任務優(yōu)先級管理能力；
良好的英文技術文檔讀寫能力和日常聽說溝通能力。

工作地點：北京 / 上海 / 深圳 / 臺北

上下滑動查看更多職位詳情

團隊介紹

NVIDIA 計算專家團隊（DevTech）專注于各種深度學習算法、科學計算、數(shù)據(jù)分析和云端應用；在 NVIDIA 平臺上進行性能分析以及優(yōu)化，以充分發(fā)揮 NVIDIA GPU / CPU / DPU，集群和數(shù)據(jù)中心強大的算力，使其達到，或者接近“光速”（SOL）水平的高級技術團隊。

該團隊與世界上技術領先的企業(yè)、高校、研究院所合作，共同推動和加速各項 AI 應用的落地。通過與用戶深度緊密的合作，在大語言模型、生成式 AI、推薦系統(tǒng)、自動駕駛、自然語言處理、視頻和圖像理解、語音識別與合成，游戲等領域取得了累累碩果。該團隊成為幫助客戶發(fā)揮硬件平臺和軟件棧綜合算力的中堅力量，能夠為產品研發(fā)團隊提供性能優(yōu)化、設計原型和行業(yè)應用案例。

團隊目標：在 NVIDIA 系統(tǒng)上，將各類應用優(yōu)化到性能極致！

以打造大語言模型（LLM）應用為例，既可以直接使用 NVAIE / NVIDIA Nemo Service，也可以使用應用框架（Nemo FW、Triton+TensorRT、FT等）來訓練和部署模型，也可以基于 cuDNN / TensorRT 等軟件庫自己開發(fā)自己的框架，還可以基于 CUDA 來完全定制化自己的 pipeline，或者也可以混合采用這些方法。

如何選擇一種合適的方法，其關鍵在于取得應用場景、性能要求、平臺靈活性、時間成本、技術成本之間的平衡。NVIDIA 計算專家團隊就是幫助客戶和 NVIDIA 解決這個問題的。

上下滑動查看更多詳情

團隊發(fā)展

團隊成員主要來自北京、上海、深圳、臺北、首爾等地。

科學計算時代，當整個市場都還只關注于不斷擴大通用硬件的規(guī)模時，NVIDIA 推出了加速計算 GPGPU 和 CUDA 編程模型。GPU 和 CUDA 這一全新的加速計算范式，為業(yè)界帶來了源源不斷的加速，但是也對應用的開發(fā)和優(yōu)化提出了挑戰(zhàn)。

在不斷改進基礎庫性能的同時，NVIDIA 組建了一支特別團隊，關注更為具體的應用。團隊成員們不僅有深厚的計算機功底（從計算機體系結構、CUDA 編程，到編譯原理、網絡互連），還擁有各個領域的專業(yè)知識。這支團隊不但可以從 GPU 編程方面對程序進行優(yōu)化，更能從算法、模型方面提出改進建議，這使得 NVIDIA GPU 從科學計算領域脫穎而出。

隨著深度學習的高速發(fā)展，該團隊也在續(xù)寫著相同的故事。對于 AI 中的神經網絡，從代碼和算法兩個方面對其進行優(yōu)化。代碼方面涉及 CUDA、GPU 庫，多機多卡網絡互連等各個領域；而算法包括了模型壓縮、量化、剪枝、混合精度訓練、梯度壓縮等，其最終目標都是在模型精度沒有損失，或者損失不大的情況下，提高訓練和預測的速度。

對于一個基于 AI 的實際工業(yè)項目，除了神經網絡以外，系統(tǒng)內還包括了很多其他模塊，神經網絡在其中耗時只占 1/3 - 1/2。以互聯(lián)網核心的推薦系統(tǒng)為例，其包括了召回、過濾、粗排、精排、離線訓練、在線訓練、ETL、特征工程等模塊和流程。該團隊致力于提供全流程的參考解決方案，讓盡可能多的模塊運行在 GPU 上，進而為應用帶來顯著加速。

上下滑動查看更多詳情

點擊“閱讀原文”，或掃描下方海報二維碼，觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放，主題演講中文字幕版已上線，了解 AI、圖形及其他領域的最新進展！

原文標題：NVIDIA 招聘 | NVIDIA 最新熱招崗位！一起迎接未來加速計算！

文章出處：【微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴