0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

KUBERNETES開源平臺的定義、工作原理及重要意義

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-06-10 12:00 ? 次閱讀

Kubernetes 是一個開源平臺,用于自動進行容器編排,即容器化應用程序的部署、擴展和管理。

什么是 KUBERNETES?

Kubernetes 提供了一個框架,用于部署、管理、擴展和切換分布式容器,這些容器是隨依賴項和配置打包的微服務。

它建立在 Google 十多年的容器管理系統(tǒng)開發(fā)經驗基礎上,并結合了來自社區(qū)的出色想法、模式和實踐。

為何選擇 KUBERNETES?

軟件容器隨著 2013 年出現(xiàn)的Docker得到了普及,而現(xiàn)在,Moby也發(fā)揮了這一作用。容器鏡像會打包整個運行時環(huán)境,包括應用程序,以及執(zhí)行應用程序所需的所有依賴項、庫和其他二進制文件以及配置文件。與虛機相比,容器具有相似的資源和隔離優(yōu)勢,但更為輕巧,因為容器將操作系統(tǒng)虛擬化而非采用硬件。容器便于移植,占用空間以及使用的系統(tǒng)資源更少,且?guī)酌腌妰燃纯杉涌爝\行。容器還可提高開發(fā)者的效率。DevOps 團隊無需再等待操作系統(tǒng)來配置計算機,他們可以快速將應用程序打包到容器中并部署。

得益于這些優(yōu)勢,容器立即受到開發(fā)者的青睞,并迅速成為云應用程序部署的熱門選擇。容器的普及意味著一些組織很快會運行成千上萬個容器,因此需要實現(xiàn)管理自動化。Kubernetes 簡化了容器管理,因此大受歡迎,并通過進一步支持微服務架構使容器成為主流,該架構促進了云原生應用程序的快速交付和可擴展編排。

云原生計算基金會 (Cloud Native Computing Foundation)成立于 2015 年,是 Linux 基金會的一個項目,旨在推動云原生技術的采用。其中包括容器、服務網格、微服務、不可變基礎設施以及聲明性 API,并圍繞一套通用標準使開發(fā)者保持一致。CNCF 為許多增長快速的開源項目(包括 Kubernetes)提供了供應商中性平臺。該團隊的工作有助于防止 Kubernetes 代碼庫出現(xiàn)分叉。因此,各大計算平臺和云提供商現(xiàn)在都支持相同的 Kubernetes 代碼庫。雖然已經出現(xiàn)了 Kubernetes 的品牌版本(如Red HatOpenShift或 Amazon Elastic Kubernetes Service),但其底層代碼是相同的。

KUBERNETES 的工作原理是什么?

Kubernetes 引入了一個分組概念(稱為“POD”),允許多個容器在主機上運行,并共享資源,而不會發(fā)生沖突。POD 可用于定義共享服務(如目錄、IP 地址或存儲),并公開至 POD 中的所有容器。這使得應用程序內的服務能夠容器化并一起運行,因為每個容器都與主應用程序緊密相連。

節(jié)點代理稱為 kubelet,用于管理 POD、容器和圖像。Kubernetes 控制器管理 POD 集群,并確保分配充足資源,以實現(xiàn)所需的可擴展性和性能級別。

Kubernetes 提供各種有用服務,特別是在集群環(huán)境中。它實現(xiàn)了服務發(fā)現(xiàn)和負載均衡的自動化,自動安裝存儲系統(tǒng),并自動推廣和回退,以達到指定的預期狀態(tài)。它還會監(jiān)控容器運行狀況、重啟出現(xiàn)故障的容器,并啟用密碼和密鑰等敏感信息以安全存儲在容器中。

這簡化了機器和服務管理,使單個管理員能夠管理同時運行的數千個容器。Kubernetes 還允許跨現(xiàn)場部署到公共或私有云,以及介于兩者之間的混合部署的編制。

Kubernetes 因其作為一個支持混合云計算平臺的承諾引起了很多關注。由于每個物理和虛擬環(huán)境中的代碼庫都相同,因此從理論上講,容器化應用程序可以在支持 Kubernetes 的任何平臺上運行。業(yè)界仍在持續(xù)討論混合架構的優(yōu)點。支持者表示,這種方法可以避免出現(xiàn)鎖定問題,而反對者則認為,在可移植性方面做出的妥協(xié)在于,開發(fā)者只能使用一系列有限的開源技術,無法利用品牌云和本地平臺上的全部服務功能。

KUBERNETES 用例

如上所述,混合和多云部署是 Kubernetes 的一個理想用例,因為應用程序無需與底層平臺綁定。Kubernetes 負責處理資源分配并監(jiān)控容器運行狀況,以確保根據需要提供服務。

Kubernetes 還非常適合可用性至關重要的環(huán)境,因為編排器可以抵御故障實例、端口沖突和資源瓶頸等問題。

容器是一種用于無服務器計算的基礎技術,在這種計算中,應用程序由活躍的服務構建,這些服務僅針對該應用程序的需要執(zhí)行函數。無服務器計算有點用詞不當,因為容器必須在服務器上運行。但目標是將虛機封裝到容器中,以盡可能減少調配虛機所需的成本和時間,這些容器幾毫秒內即可啟動,由 Kubernetes 管理。

Kubernetes 還有一個稱為命名空間的功能,指一個集群內的虛擬集群。允許運營和開發(fā)團隊共享同一組物理機,并訪問相同服務,而不會造成沖突。

KUBERNETES 的重要意義

數據科學家

數據科學的挑戰(zhàn)之一是在可復制的環(huán)境中創(chuàng)建可重復的實驗,并能夠跟蹤和監(jiān)控生產中的指標。容器能夠創(chuàng)建具有多個協(xié)調階段的可重復流程,這些流程以可復制的方式協(xié)同工作,用于處理、特征提取和測試。

Kubernetes 中的聲明性配置描述了服務之間的關系。微服務架構使調試變得更容易,并改善了數據科學團隊成員之間的協(xié)作。數據科學家還可以利用BinderHub等擴展程序,從存儲庫中構建和注冊容器鏡像,并將它們發(fā)布為其他用戶可交互使用的共享筆記本。

Kubeflow等擴展程序簡化了在 Kubernetes 中設置和維護機器學習工作流程和管線的過程。編排器具有可移植性優(yōu)勢,讓數據科學家可以在筆記本電腦上進行開發(fā),并隨時隨地進行部署。

Devops

數據工程師很難將機器學習模型投入生產。他們花時間編輯配置文件、分配服務器資源,還要擔心如何在不導致項目崩潰的情況下擴展模型并整合 GPU。容器生態(tài)系統(tǒng)引入了許多工具,旨在簡化數據工程師的工作。

例如,Istio是一個可配置的開源服務網格層,可用于輕松創(chuàng)建一個具備自動化負載均衡、服務到服務身份驗證以及監(jiān)控的已部署服務網絡,且無需對服務代碼做任何更改。它可精細控制流量行為、豐富的路由規(guī)則、重試、故障轉移和故障注入,以及用于訪問控制、速率限制和配額的可插入策略層和配置 API。

Kubernetes 生態(tài)系統(tǒng)借助此類專用工具繼續(xù)發(fā)展,使服務器配置隱形,允許數據工程師可視化依賴項,從而簡化配置和故障排除。

為何 KUBERNETES 在 GPU 上表現(xiàn)更出色

Kubernetes 包括對 GPU 的支持,這使得配置和使用 GPU 資源來加速數據科學、機器學習和深度學習等工作負載變得容易。設備插件允許 POD 訪問 GPU 等專用硬件功能,并作為可調度資源公開。

隨著 AI 應用程序和服務的不斷增加以及公有云中 GPU 的全面發(fā)售,Kubernetes 需要具備 GPU 感知能力。NVIDIA 一直在穩(wěn)步構建其軟件庫,以優(yōu)化在容器環(huán)境中使用的 GPU。例如,NVIDIA GPU 上的 Kubernetes支持多云 GPU 集群通過跨多節(jié)點集群 GPU 加速容器的自動化部署、維護、調度和操作實現(xiàn)無縫擴展。

GPU 上的 Kubernetes NVIDIA 具有以下主要特性:

借助 NVIDIA 設備插件,在 Kubernetes 中啟用 GPU 支持

指定 GPU 屬性(例如 GPU 類型和內存需求),以便在異構 GPU 群集中進行部署

借助NVIDIA DCGM、Prometheus 和 Grafana 的集成 GPU 監(jiān)控堆棧,允許對 GPU 指標和運行狀況進行可視化和監(jiān)控

支持多個基礎容器運行時,例如 Docker 和 CRI-O

NVIDIA DGX系統(tǒng)提供官方支持

NVIDIA EGX堆棧是一款可擴展的原生云軟件堆棧,可實現(xiàn)由 Kubernetes 管理的容器化加速 AI 計算。借助 NVIDIA EGX 堆棧,組織可以在幾分鐘內輕松部署經過更新的 AI 容器。

但是,Kubernetes 并不是什么靈丹妙藥。它為資源發(fā)現(xiàn)和管理提供了良好的 API,但其并非簡化資源使用的全部解決方案。因此,NVIDIA 開發(fā)了 Triton,這是一個開源推理服務平臺,允許用戶在任何 GPU 或基于 CPU接口上部署 AI 訓練模型。在 Kubernetes 環(huán)境中運行 Triton,可以完全從軟件中提取出硬件。在這種情況下,Kubernetes 充當 Triton 運行的基礎。Triton 負責提取節(jié)點內的硬件,而 Kubernetes 負責編排集群,使其能夠更有效地向外擴展。

GPU 硬件中的 KUBERNETES

除了軟件之外,NVIDIA 已采取措施定制其硬件,以用于虛擬化環(huán)境。不過,這并非 Kubernetes 所特有。隨著公司推出基于 Ampere的 A100 企業(yè)級 GPU 和 DGX A100 服務器,NVIDIA 還推出了多實例 GPU (MIG)。MIG 允許將單個 A100 GPU 分割為七個小 GPU,類似于將 CPU 分割成多個單獨核心。允許用戶使用 Kubernetes 等容器運行時以更精確的粒度自動擴展其應用程序。

在 MIG 推出之前,GPU 加速 Kubernetes 集群中的每個節(jié)點都需要自己的專用 GPU。有了 MIG,單個 NVIDIA A100(DGX A100 中有 8 個)現(xiàn)在可以支持多達 7 個小節(jié)點。這使得應用程序和資源可以實現(xiàn)更大規(guī)模的線性擴展。

隨著 AI 服務成為 GPU 加速工作負載,而這正處于成功前的拐點,GPU 將開始進入 Kubernetes 的主流。隨著形勢發(fā)展,人們會把 GPU 加速視為一個快速或高效的按鈕,而不必考慮 GPU 開發(fā)或編程。

原文標題:NVIDIA 大講堂 | 什么是 KUBERNETES?

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4818

    瀏覽量

    102650
  • 開源平臺
    +關注

    關注

    0

    文章

    8

    瀏覽量

    6831
  • kubernetes
    +關注

    關注

    0

    文章

    223

    瀏覽量

    8677

原文標題:NVIDIA 大講堂 | 什么是 KUBERNETES?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    雪崩晶體管的定義工作原理

    雪崩晶體管(Avalanche Transistor)是一種具有特殊工作特性的晶體管,其核心在于其能夠在特定條件下展現(xiàn)出雪崩倍增效應。以下是對雪崩晶體管的定義工作原理以及相關特性的詳細闡述。
    的頭像 發(fā)表于 09-23 18:03 ?257次閱讀

    電動汽車充電樁工作原理介紹

    充電樁的工作原理,對于提升充電設施的使用效率、優(yōu)化電動汽車能源補給系統(tǒng)具有重要意義。 電動汽車充電樁工作原理 1. 交流充電樁(AC Charging Pile) 工作原理:交流充電樁
    的頭像 發(fā)表于 09-16 11:37 ?617次閱讀

    TTL逆變器的定義工作原理

    TTL逆變器,作為數字電路中的一個重要組成部分,其定義工作原理對于理解數字信號處理和轉換過程至關重要。
    的頭像 發(fā)表于 09-12 11:30 ?321次閱讀

    人員定位系統(tǒng)對生產密集型企業(yè)的重要意義

    ,事故頻發(fā),外來訪客進入廠區(qū)后的行蹤無法監(jiān)管,存在進入非授權區(qū)域的風險,需要對訪客行蹤進行實時監(jiān)管。人員定位系統(tǒng)的應用對生產密集型企業(yè)有著的重要意義。 云酷科技依托于強大的技術支撐和對行業(yè)的深入洞察,利用藍牙信
    的頭像 發(fā)表于 09-10 17:30 ?178次閱讀
    人員定位系統(tǒng)對生產密集型企業(yè)的<b class='flag-5'>重要意義</b>

    家用斷路器的定義工作原理

    家用斷路器是家庭電氣安全的重要組成部分,其主要功能是在電路發(fā)生過載、短路等異常情況時自動切斷電源,從而保護電線、家用電器及用戶的人身安全。以下是對家用斷路器的詳細介紹,包括其定義、工作原理、類型、選擇原則、安裝方法、使用注意事項
    的頭像 發(fā)表于 08-23 11:01 ?363次閱讀

    使用Velero備份Kubernetes集群

    Velero 是 heptio 團隊(被 VMWare 收購)開源Kubernetes 集群備份、遷移工具。
    的頭像 發(fā)表于 08-05 15:43 ?295次閱讀
    使用Velero備份<b class='flag-5'>Kubernetes</b>集群

    使用Arduino的濕度傳感器設計 濕度傳感器的工作原理和應用

    傳感器的工作原理及其應用對于提高生產效率和產品質量具有重要意義。本文將從濕度傳感器的定義、工作原理及具體應用三個方面進行詳細闡述。
    的頭像 發(fā)表于 07-08 18:11 ?1261次閱讀
    使用Arduino的濕度傳感器設計 濕度傳感器的<b class='flag-5'>工作原理</b>和應用

    控制閥的工作原理和特點

    控制閥是一種廣泛應用于工業(yè)自動化領域的設備,其主要作用是實現(xiàn)對流體的控制和調節(jié)??刂崎y的工作原理和特點對于確保工業(yè)系統(tǒng)的穩(wěn)定運行和提高生產效率具有重要意義。本文將詳細介紹控制閥的工作原理、特點以及
    的頭像 發(fā)表于 06-30 09:30 ?1504次閱讀

    PLC晶體管輸出的工作原理

    控制信號來驅動外部設備。其中,晶體管輸出是PLC輸出方式的一種,其原理和特點對于理解和應用PLC具有重要意義。本文將詳細闡述PLC晶體管輸出的原理,包括其定義工作原理、特點、應用以及與其他輸出方式的比較。
    的頭像 發(fā)表于 06-14 16:58 ?1599次閱讀

    旋轉式編碼器的工作原理和特點

    旋轉式編碼器,作為現(xiàn)代工業(yè)自動化系統(tǒng)中不可或缺的一部分,其工作原理和特點對于理解其應用及優(yōu)化系統(tǒng)性能具有重要意義。本文將詳細闡述旋轉式編碼器的工作原理,并深入探討其特點,旨在為讀者提供全面、深入的了解。
    的頭像 發(fā)表于 05-29 16:01 ?824次閱讀

    壓敏電阻的定義、作用及工作原理

    在電子電路的世界里,各種電子元器件扮演著各自獨特的角色,它們共同構成了電子設備的復雜網絡。其中,壓敏電阻作為一種特殊的電子元器件,在電路中發(fā)揮著至關重要的作用。本文將深入探討壓敏電阻的定義、作用以及工作原理,以期為讀者提供全面而
    的頭像 發(fā)表于 05-22 15:12 ?2528次閱讀

    雙向儲能變流器的定義、組成及工作原理

    隨著可再生能源和分布式能源的快速發(fā)展,電網系統(tǒng)對儲能技術的需求日益增長。雙向儲能變流器,作為儲能系統(tǒng)的關鍵設備,能夠實現(xiàn)電網與儲能系統(tǒng)之間的雙向能量轉換,對于提高電網的穩(wěn)定性、可靠性和經濟性具有重要意義。本文將詳細介紹雙向儲能變流器的定義、組成及功能。
    的頭像 發(fā)表于 05-20 15:16 ?1081次閱讀

    逆變器的定義工作原理及基本結構

    逆變器,作為一種將直流電(DC)轉化為交流電(AC)的重要設備,在現(xiàn)代電力電子系統(tǒng)中占據了不可或缺的地位。其應用范圍廣泛,從家庭電器到工業(yè)設備,從電動汽車到風力發(fā)電系統(tǒng),逆變器都發(fā)揮著至關重要的作用。本文將詳細探討逆變器的定義、
    的頭像 發(fā)表于 05-12 17:29 ?3472次閱讀

    pH傳感器的工作原理及應用

    pH傳感器技術是一種用于測量溶液酸堿度的重要工具。它可以廣泛應用于化工、生物醫(yī)藥、環(huán)境監(jiān)測等領域,對于控制和監(jiān)測溶液的酸堿度具有重要意義。本文將介紹pH傳感器技術的工作原理以及其在不同領域的應用。
    的頭像 發(fā)表于 11-21 15:52 ?3053次閱讀

    壓力繼電器的定義、工作原理及其在各領域的應用案例

    壓力繼電器的定義、工作原理及其在各領域的應用案例? 壓力繼電器是一種用于測量和控制系統(tǒng)中壓力的電氣裝置。它是一種機電轉換裝置,可以將壓力信號轉換為電信號,并通過電信號來實現(xiàn)相應的控制功能。壓力繼電器
    的頭像 發(fā)表于 11-17 14:28 ?2129次閱讀