0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

看看這5個(gè)維度是如何優(yōu)化Kubernetes集群的

馬哥Linux運(yùn)維 ? 來源:簡(jiǎn)書 ? 作者:薛海山 ? 2021-09-24 14:40 ? 次閱讀

一、節(jié)點(diǎn)配額和內(nèi)核參數(shù)調(diào)整

對(duì)于公有云上的 Kubernetes 集群,規(guī)模大了之后很容器碰到配額問題,需要提前在云平臺(tái)上增大配額。這些需要增大的配額包括:

  • 虛擬機(jī)個(gè)數(shù)

  • vCPU 個(gè)數(shù)

  • 內(nèi)網(wǎng) IP 地址個(gè)數(shù)

  • 公網(wǎng) IP 地址個(gè)數(shù)

  • 安全組條數(shù)

  • 路由表?xiàng)l數(shù)

  • 持久化存儲(chǔ)大小

參考gce隨著node節(jié)點(diǎn)的增加master節(jié)點(diǎn)的配置:

  • 1-5 nodes: n1-standard-1

  • 6-10 nodes: n1-standard-2

  • 11-100 nodes: n1-standard-4

  • 101-250 nodes: n1-standard-8

  • 251-500 nodes: n1-standard-16

  • more than 500 nodes: n1-standard-32

參考阿里云配置:

# max-file 表示系統(tǒng)級(jí)別的能夠打開的文件句柄的數(shù)量,一般如果遇到文件句柄達(dá)到上限時(shí),會(huì)碰到"Too many open files"或者Socket/File: Can’t open so many files等錯(cuò)誤。
fs.file-max=1000000

#配置arpcache大小
net.ipv4.neigh.default.gc_thresh1=1024
#存在于ARP高速緩存中的最少層數(shù),如果少于這個(gè)數(shù),垃圾收集器將不會(huì)運(yùn)行。缺省值是128。

#保存在 ARP 高速緩存中的最多的記錄軟限制。垃圾收集器在開始收集前,允許記錄數(shù)超過這個(gè)數(shù)字 5 秒。缺省值是 512。
net.ipv4.neigh.default.gc_thresh2=4096

#保存在 ARP 高速緩存中的最多記錄的硬限制,一旦高速緩存中的數(shù)目高于此,垃圾收集器將馬上運(yùn)行。缺省值是1024。
net.ipv4.neigh.default.gc_thresh3=8192

#以上三個(gè)參數(shù),當(dāng)內(nèi)核維護(hù)的arp表過于龐大時(shí)候,可以考慮優(yōu)化

#允許的最大跟蹤連接條目,是在內(nèi)核內(nèi)存中netfilter可以同時(shí)處理的“任務(wù)”(連接跟蹤條目)
net.netfilter.nf_conntrack_max=10485760

#哈希表大?。ㄖ蛔x)(64位系統(tǒng)、8G內(nèi)存默認(rèn)65536,16G翻倍,如此類推)
net.core.netdev_max_backlog=10000
#每個(gè)網(wǎng)絡(luò)接口接收數(shù)據(jù)包的速率比內(nèi)核處理這些包的速率快時(shí),允許送到隊(duì)列的數(shù)據(jù)包的最大數(shù)目。
net.netfilter.nf_conntrack_tcp_timeout_established=300
net.netfilter.nf_conntrack_buckets=655360

#關(guān)于conntrack的詳細(xì)說明:https://testerhome.com/topics/7509

#默認(rèn)值:128指定了每一個(gè)realuserID可創(chuàng)建的inotifyinstatnces的數(shù)量上限
fs.inotify.max_user_instances=524288

#默認(rèn)值:8192指定了每個(gè)inotifyinstance相關(guān)聯(lián)的watches的上限
fs.inotify.max_user_watches=524288

二、Etcd 數(shù)據(jù)庫

1、搭建高可用的etcd集群,集群規(guī)模增大時(shí)可以自動(dòng)增加etcd節(jié)點(diǎn);

目前的解決方案是使用etcd operator來搭建etcd 集群,operator是CoreOS推出的旨在簡(jiǎn)化復(fù)雜有狀態(tài)應(yīng)用管理的框架,它是一個(gè)感知應(yīng)用狀態(tài)的控制器,通過擴(kuò)展Kubernetes API來自動(dòng)創(chuàng)建、管理和配置應(yīng)用實(shí)例。

etcd operator 有如下特性:

  • ceate/destroy: 自動(dòng)部署和刪除 etcd 集群,不需要人額外干預(yù)配置。

  • resize:可以動(dòng)態(tài)實(shí)現(xiàn) etcd 集群的擴(kuò)縮容。

  • backup:支持etcd集群的數(shù)據(jù)備份和集群恢復(fù)重建

  • upgrade:可以實(shí)現(xiàn)在升級(jí)etcd集群時(shí)不中斷服務(wù)。

2、配置etcd使用ssd固態(tài)盤存儲(chǔ);

3、設(shè)置 —quota-backend-bytes 增大etcd的存儲(chǔ)限制。默認(rèn)值是 2G;

4、需要配置單獨(dú)的 Etcd 集群存儲(chǔ) kube-apiserver 的 event。

三、Kube APIServer 配置

node節(jié)點(diǎn)數(shù)量 >= 3000, 推薦設(shè)置如下配置:

--max-requests-inflight=3000
--max-mutating-requests-inflight=1000

node節(jié)點(diǎn)數(shù)量在 1000 — 3000, 推薦設(shè)置如下配置:

--max-requests-inflight=1500
--max-mutating-requests-inflight=500

內(nèi)存配置選項(xiàng)和node數(shù)量的關(guān)系,單位是MB:

--target-ram-mb=node_nums*60

四、Pod 配置

在運(yùn)行 Pod 的時(shí)候也需要注意遵循一些最佳實(shí)踐,比如:

1、為容器設(shè)置資源請(qǐng)求和限制,尤其是一些基礎(chǔ)插件服務(wù)

spec.containers[].resources.limits.cpu
spec.containers[].resources.limits.memory
spec.containers[].resources.requests.cpu
spec.containers[].resources.requests.memory
spec.containers[].resources.limits.ephemeral-storage
spec.containers[].resources.requests.ephemeral-storage

在k8s中,會(huì)根據(jù)pod不同的limit 和 requests的配置將pod劃分為不同的qos類別:

  • Guaranteed

  • Burstable

  • BestEffort

當(dāng)機(jī)器可用資源不夠時(shí),kubelet會(huì)根據(jù)qos級(jí)別劃分遷移驅(qū)逐pod。被驅(qū)逐的優(yōu)先級(jí):BestEffort > Burstable > Guaranteed

2、對(duì)關(guān)鍵應(yīng)用使用 nodeAffinity、podAffinity 和 podAntiAffinity 等保護(hù),使其調(diào)度分散到不同的node上。比如kube-dns 配置:

affinity:
podAntiAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
-weight:100
labelSelector:
matchExpressions:
-key:k8s-app
operator:In
values:
-kube-dns
topologyKey:kubernetes.io/hostname

3、盡量使用控制器來管理容器(如 Deployment、StatefulSet、DaemonSet、Job 等)Kube-scheduler 配置

設(shè)置 —kube-api-qps=100 默認(rèn)值是 50Kube-controller-manager 配置

設(shè)置 —kube-api-qps=100 默認(rèn)值是20設(shè)置 —kube-api-burst=100 默認(rèn)值是30

作者:薛海山https://www.jianshu.com/p/e9fcc1a9eea

編輯:jq
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    16041

    瀏覽量

    176765
  • kubernetes
    +關(guān)注

    關(guān)注

    0

    文章

    223

    瀏覽量

    8677

原文標(biāo)題:Kubernetes 集群怎樣優(yōu)化?看看這5個(gè)維度

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Kubernetes集群搭建容器云需要幾臺(tái)服務(wù)器?

    Kubernetes集群搭建容器云需要幾臺(tái)服務(wù)器?至少需要4臺(tái)服務(wù)器。搭建容器云所需的服務(wù)器數(shù)量以及具體的搭建步驟,會(huì)根據(jù)所選用的技術(shù)棧、業(yè)務(wù)規(guī)模、架構(gòu)設(shè)計(jì)以及安全需求等因素而有所不同。以下是一個(gè)基于
    的頭像 發(fā)表于 10-21 10:06 ?70次閱讀

    使用Velero備份Kubernetes集群

    Velero 是 heptio 團(tuán)隊(duì)(被 VMWare 收購)開源的 Kubernetes 集群備份、遷移工具。
    的頭像 發(fā)表于 08-05 15:43 ?295次閱讀
    使用Velero備份<b class='flag-5'>Kubernetes</b><b class='flag-5'>集群</b>

    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝Kubernetes集群

    Kubernetes,通??s寫為K8s,是一個(gè)開源的容器編排平臺(tái),旨在自動(dòng)化容器化應(yīng)用的部署、擴(kuò)展和管理。有了Kubernetes,您可以輕松地部署、更新和擴(kuò)展應(yīng)用,而無需擔(dān)心底層基礎(chǔ)設(shè)施。
    的頭像 發(fā)表于 07-15 13:31 ?766次閱讀
    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝<b class='flag-5'>Kubernetes</b><b class='flag-5'>集群</b>

     K8S學(xué)習(xí)教程一:使用PetaExpress云服務(wù)器安裝Minikube 集群

    使得開發(fā)人員能夠在本地機(jī)器上輕松創(chuàng)建一個(gè)單節(jié)點(diǎn)的 Kubernetes 集群,從而方便開發(fā)、測(cè)試和學(xué)習(xí) Kubernetes。 我們看下如何使用PetaExpress云服務(wù)器安裝Mi
    的頭像 發(fā)表于 07-01 15:41 ?272次閱讀
     K8S學(xué)習(xí)教程一:使用PetaExpress云服務(wù)器安裝Minikube <b class='flag-5'>集群</b>

    高性能計(jì)算集群的能耗優(yōu)化

    高性能計(jì)算(HighPerformanceComputing,HPC)是指利用大規(guī)模并行計(jì)算機(jī)集群來解決復(fù)雜的科學(xué)和工程問題的技術(shù)。高性能計(jì)算集群的應(yīng)用領(lǐng)域非常廣泛,包括天氣預(yù)報(bào)、生物信息學(xué)
    的頭像 發(fā)表于 05-25 08:27 ?297次閱讀
    高性能計(jì)算<b class='flag-5'>集群</b>的能耗<b class='flag-5'>優(yōu)化</b>

    淺析Ranther管理K8S集群

    Rancher 基于 Kubernetes 添加了新的功能,包括統(tǒng)一所有集群的身份驗(yàn)證和 RBAC,讓系統(tǒng)管理員從一個(gè)位置控制全部集群的訪問。
    的頭像 發(fā)表于 01-21 10:28 ?818次閱讀
    淺析Ranther管理K8S<b class='flag-5'>集群</b>

    Kubernetes Gateway API攻略教程

    Kubernetes Gateway API 剛剛 GA,旨在改進(jìn)將集群服務(wù)暴露給外部的過程。這其中包括一套更標(biāo)準(zhǔn)、更強(qiáng)大的 API資源,用于管理已暴露的服務(wù)。在這篇文章中,我將介紹 Gateway
    的頭像 發(fā)表于 01-12 11:32 ?782次閱讀
    <b class='flag-5'>Kubernetes</b> Gateway API攻略教程

    配置Kubernetes中Pod使用代理的兩種常見方式

    在企業(yè)網(wǎng)絡(luò)環(huán)境中進(jìn)行Kubernetes集群的管理時(shí),經(jīng)常會(huì)遇到需要配置Pods通過HTTP代理服務(wù)器訪問Internet的情況。這可能是由于各種原因,如安全策略限制、網(wǎng)絡(luò)架構(gòu)要求或者訪問特定資源
    的頭像 發(fā)表于 01-05 11:22 ?1008次閱讀
    配置<b class='flag-5'>Kubernetes</b>中Pod使用代理的兩種常見方式

    使用Jenkins和單個(gè)模板部署多個(gè)Kubernetes組件

    在持續(xù)集成和部署中,我們通常需要部署多個(gè)實(shí)例或組件到Kubernetes集群中。通過Jenkins的管道腳本,我們可以自動(dòng)化這個(gè)過程。在本文中,我將演示如何使用Jenkins Pipeline及單個(gè)
    的頭像 發(fā)表于 01-02 11:40 ?652次閱讀
    使用Jenkins和單個(gè)模板部署多個(gè)<b class='flag-5'>Kubernetes</b>組件

    Kubernetes RBAC:掌握權(quán)限管理的精髓

    Kubernetes RBAC(Role-Based Access Control)是 Kubernetes 中一項(xiàng)關(guān)鍵的安全功能,它通過細(xì)粒度的權(quán)限控制機(jī)制,確保集群資源僅被授權(quán)的用戶或服務(wù)賬號(hào)訪問。
    的頭像 發(fā)表于 12-25 09:43 ?420次閱讀

    Kubernetes開發(fā)指南之深入理解CRD

    CRD本身是Kubernetes內(nèi)置的資源類型,全稱是CustomResourceDefinition,可以通過命令查看,kubectl get查看集群內(nèi)定義的CRD資源。
    的頭像 發(fā)表于 12-13 18:19 ?765次閱讀
    <b class='flag-5'>Kubernetes</b>開發(fā)指南之深入理解CRD

    redis查看集群狀態(tài)命令

    Redis 是一個(gè)開源的、內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)系統(tǒng),提供了一系列命令來管理和操作數(shù)據(jù)。在 Redis 中,集群是一個(gè)由多個(gè) Redis 實(shí)例組成的分布式系統(tǒng),用于提高數(shù)據(jù)的可用性和性能。在進(jìn)行
    的頭像 發(fā)表于 12-04 11:39 ?956次閱讀

    redis集群狀態(tài)查看命令

    的文章。 Redis集群狀態(tài)查看命令有多種,在本文中我們將詳細(xì)介紹以下命令: CLUSTER INFO: 這個(gè)命令可以用于查看整個(gè)集群的信息。運(yùn)行這個(gè)命令后,Redis會(huì)返回一個(gè)包含集群
    的頭像 發(fā)表于 12-04 10:44 ?1158次閱讀

    Kubernetes 集群及其生態(tài)搭建

    組件也越來越豐富,可見在過去的 K8S元年 ,它發(fā)展是多么迅猛。最近想把自己寫的一些小東西封裝成開放API暴露出來,于是想把自己的幾臺(tái)機(jī)器搞成個(gè)kubernetes集群,所以這里想重溫下集群
    的頭像 發(fā)表于 11-01 16:04 ?419次閱讀
    <b class='flag-5'>Kubernetes</b> <b class='flag-5'>集群</b>及其生態(tài)搭建

    基于Kubernetes集群的typecho博客搭建方案

    Kubernetes提供了強(qiáng)大的高可用性特性,它可以自動(dòng)管理和調(diào)度容器實(shí)例,確保應(yīng)用程序在集群中始終可用。還可以監(jiān)控和自動(dòng)修復(fù)故障的容器實(shí)例,提高博客的穩(wěn)定性和可靠性。
    發(fā)表于 10-30 10:02 ?366次閱讀
    基于<b class='flag-5'>Kubernetes</b><b class='flag-5'>集群</b>的typecho博客搭建方案