0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Redis流與Kafka相比如何?

馬哥Linux運(yùn)維 ? 來(lái)源:cnblogs ? 2024-02-21 16:09 ? 次閱讀

Redis流 VS Kafka

Kafka以解決大規(guī)模數(shù)據(jù)處理問(wèn)題而聞名,并被廣泛部署在許多知名公司的基礎(chǔ)設(shè)施中。早在2015年,LinkedIn有60個(gè)集群,總共有1100個(gè)Broker,每秒處理1300萬(wàn)條信息。

但事實(shí)證明,規(guī)模并不是Kafka唯一擅長(zhǎng)的事情。它所提倡的編程范式--分區(qū)、有序、事件處理--對(duì)于你可能面臨的許多問(wèn)題都是一個(gè)很好的解決方案。例如,如果事件代表的是要被索引到搜索數(shù)據(jù)庫(kù)的行,那么最后的修改就是最后的索引,這一點(diǎn)很重要,否則搜索將無(wú)限期地返回陳舊的數(shù)據(jù)。同樣,如果事件代表用戶行為,處理第二個(gè)事件("用戶升級(jí)賬戶")可能依賴于第一個(gè)("用戶創(chuàng)建賬戶")。這種范式與傳統(tǒng)的作業(yè)隊(duì)列系統(tǒng)不同,在傳統(tǒng)的作業(yè)隊(duì)列中,事件是由許多工作者同時(shí)從隊(duì)列中彈出的,這很簡(jiǎn)單,可擴(kuò)展,但它破壞了任何排序保證。假設(shè)你想要有序的處理,但也許你不想使用Kafka,因?yàn)樗且粋€(gè)難以操作或昂貴的重型系統(tǒng)的聲譽(yù)。Redis現(xiàn)在有了5.0版本發(fā)布的"流 "數(shù)據(jù)結(jié)構(gòu),與之相比如何?它是否解決了同樣的問(wèn)題?

Kafka的架構(gòu)

我們先來(lái)看看Kafka的基本架構(gòu)?;镜臄?shù)據(jù)結(jié)構(gòu)是主題。它是一個(gè)按時(shí)間排序的記錄序列,只需追加。使用這種數(shù)據(jù)結(jié)構(gòu)的好處在Jay Kreps的經(jīng)典博文The Log中得到了很好的描述。

dea01f4e-cfd0-11ee-a297-92fbcf53809c.png

主題Topic被分區(qū),以使它們能夠擴(kuò)展:每個(gè)主題可以被托管在單獨(dú)的Kafka實(shí)例上。每個(gè)分區(qū)中的記錄都被分配了連續(xù)的ID,稱為偏移量,它可以唯一地識(shí)別分區(qū)中的每個(gè)記錄。消費(fèi)者按順序處理記錄,保持跟蹤其最后看到的偏移量。由于記錄被持久化在一個(gè)主題中,多個(gè)消費(fèi)者可以相互獨(dú)立地處理記錄。

deaca0a2-cfd0-11ee-a297-92fbcf53809c.png

在實(shí)踐中,你可能會(huì)將你的處理分布在許多機(jī)器上。為了實(shí)現(xiàn)這一點(diǎn),Kafka提供了一個(gè) "消費(fèi)者組 "的抽象,它是一組合作的進(jìn)程,從一個(gè)主題消費(fèi)數(shù)據(jù)。一個(gè)主題的分區(qū)被劃分給組內(nèi)的成員。然后,當(dāng)成員加入或離開(kāi)該組時(shí),必須重新分配分區(qū),以便每個(gè)成員都能獲得公平的分區(qū)份額。這就是所謂的再平衡算法。

deb99f6e-cfd0-11ee-a297-92fbcf53809c.png

請(qǐng)注意,一個(gè)分區(qū)只能由消費(fèi)者組的一個(gè)成員來(lái)處理。(但一個(gè)成員可能負(fù)責(zé)多個(gè)分區(qū))這使得嚴(yán)格有序的處理得到保證。

這套工具是非常有用的。你可以通過(guò)添加更多的工作者來(lái)輕松地?cái)U(kuò)展你的處理,而Kafka則負(fù)責(zé)處理分布式協(xié)調(diào)問(wèn)題。

Redis的流數(shù)據(jù)結(jié)構(gòu)

Redis的 "流 "數(shù)據(jù)結(jié)構(gòu)是如何比較的?Redis流在概念上等同于上面描述的Kafka主題的一個(gè)分區(qū),但有一些小的區(qū)別。

它是一個(gè)持久的、有序的事件存儲(chǔ)(與Kafka中相同)

它有一個(gè)可配置的最大長(zhǎng)度(與Kafka中的保留期相比)。

事件存儲(chǔ)鍵和值,就像Redis Hash(相對(duì)于Kafka中的單個(gè)鍵和值)。

最主要的區(qū)別是,Redis中的消費(fèi)者組與Kafka中的消費(fèi)者組完全不同。

在Redis中,一個(gè)消費(fèi)者組是一組全部從同一流讀取的進(jìn)程。Redis確保事件只會(huì)被傳遞給組內(nèi)的一個(gè)消費(fèi)者。例如,在下圖中,消費(fèi)者1不會(huì)處理'9',它會(huì)跳過(guò)它,因?yàn)橄M(fèi)者2已經(jīng)看到它了。消費(fèi)者1將得到下一個(gè)未被任何其他組成員看到的事件。

dec3a3c4-cfd0-11ee-a297-92fbcf53809c.png

組的作用是將單個(gè)流的處理并行化。這看起來(lái)很像一個(gè)傳統(tǒng)的作業(yè)隊(duì)列結(jié)構(gòu)。因此,它失去了作為流處理核心的排序保證,這是很不幸的。

流處理作為一個(gè)客戶端庫(kù)

那么,如果Redis只提供有效的具有作業(yè)隊(duì)列語(yǔ)義的主題的單一分區(qū),我們?cè)趺茨茉赗edis之上建立一個(gè)流處理引擎?好吧,如果你想要Kafka的功能,你需要自己構(gòu)建它們。這意味著要實(shí)現(xiàn)。

1. 事件分區(qū)。你需要?jiǎng)?chuàng)建N個(gè)流,并將每個(gè)流視為一個(gè)分區(qū)。然后,在發(fā)送時(shí),你需要決定哪個(gè)分區(qū)應(yīng)該接收它,大概是基于事件的哈希值或其中的一個(gè)字段。

2. 一個(gè)工人分區(qū)分配系統(tǒng)。為了擴(kuò)展和支持多個(gè)工作者,你需要?jiǎng)?chuàng)建一個(gè)算法,在他們之間分配分區(qū),確保每個(gè)工作者擁有一個(gè)相互排斥的子集,也就是相當(dāng)于Kafka的 "再平衡 "系統(tǒng)。

3. 有確認(rèn)的順序處理。每個(gè)工作者都需要迭代其每個(gè)分區(qū),跟蹤其偏移量。盡管Redis消費(fèi)者組有作業(yè)隊(duì)列語(yǔ)義,但它們?cè)谶@里可以提供幫助。訣竅是每個(gè)組使用一個(gè)消費(fèi)者,然后為每個(gè)分區(qū)創(chuàng)建一個(gè)組。然后每個(gè)分區(qū)將被按順序處理,你可以利用內(nèi)置的消費(fèi)者組狀態(tài)跟蹤。Redis不僅可以跟蹤偏移量,還可以跟蹤每個(gè)事件的確認(rèn),這是很強(qiáng)大的。

這是絕對(duì)的最低要求。如果你希望你的解決方案是健壯的,你可能還想考慮錯(cuò)誤處理:除了崩潰你的工作者,也許你會(huì)想要一個(gè)機(jī)制,將錯(cuò)誤轉(zhuǎn)發(fā)到一個(gè) "死信 "流并繼續(xù)處理。

好消息是--如果你喜歡Python的話--已經(jīng)解決了這些問(wèn)題,并且在一個(gè)新發(fā)布的名為Runnel的庫(kù)中解決了更多問(wèn)題。如果你想從Redis上類(lèi)似Kafka的語(yǔ)義中獲益,歡迎你來(lái)看看。下面是它的外觀,基本上與上面的Kafka圖之一相同。

ded12954-cfd0-11ee-a297-92fbcf53809c.png

工作者通過(guò)Redis中實(shí)現(xiàn)的鎖來(lái)協(xié)調(diào)他們對(duì)分區(qū)的所有權(quán)。他們通過(guò)一個(gè)特殊的 "控制 "流相互溝通。更多信息,包括架構(gòu)和再平衡算法的詳細(xì)分解,請(qǐng)參閱Runnel文檔。

權(quán)衡

Redis是大規(guī)模事件處理的好選擇嗎?有一個(gè)基本的權(quán)衡:因?yàn)橐磺卸荚趦?nèi)存中,獲得了無(wú)與倫比的處理速度,但它不適合存儲(chǔ)無(wú)限制的數(shù)據(jù)量。使用Kafka,你可能愿意無(wú)限期地保存你的所有事件,但使用Redis,你肯定要存儲(chǔ)最近的事件的固定窗口--只夠你的處理器有一個(gè)舒適的緩沖區(qū),以防止它們變慢或崩潰。這意味著你可能還想使用一個(gè)外部的長(zhǎng)期事件存儲(chǔ),例如S3,以便能夠重放它們,這增加了你的架構(gòu)的復(fù)雜性,但降低了成本。

研究這個(gè)問(wèn)題的主要?jiǎng)訖C(jī)是在部署和操作Redis時(shí)涉及的易用性和低成本。這就是為什么它對(duì)Kafka有吸引力。它也是一套神奇的工具,經(jīng)受住了時(shí)間的考驗(yàn),非常了不起。事實(shí)證明,經(jīng)過(guò)努力,它也可以支持分布式流處理范式.

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Redis
    +關(guān)注

    關(guān)注

    0

    文章

    370

    瀏覽量

    10810
  • kafka
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    5200

原文標(biāo)題:Redis流對(duì)比Kafka

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Redis Stream應(yīng)用案例

    的基本使用介紹和設(shè)計(jì)理念可以看我之前的一篇文章(Redis Stream簡(jiǎn)介)。Redis Stream本質(zhì)上是在Redis內(nèi)核上(非Redis Module)實(shí)現(xiàn)的一個(gè)消息發(fā)布訂閱功
    發(fā)表于 06-26 17:15

    基于發(fā)布與訂閱的消息系統(tǒng)Kafka

    Kafka權(quán)威指南》——初識(shí) Kafka
    發(fā)表于 03-05 13:46

    Kafka基礎(chǔ)入門(mén)文檔

    kafka系統(tǒng)入門(mén)教程(原理、配置、集群搭建、Java應(yīng)用、Kafka-manager)
    發(fā)表于 03-12 07:22

    Kafka集群環(huán)境的搭建

    1、環(huán)境版本版本:kafka2.11,zookeeper3.4注意:這里zookeeper3.4也是基于集群模式部署。2、解壓重命名tar -zxvf
    發(fā)表于 01-05 17:55

    一文讀懂什么是分布式處理系統(tǒng)Kafka

    Kafka是一個(gè)分布式處理系統(tǒng),處理系統(tǒng)使它可以像消息隊(duì)列一樣publish或者subscribe消息,分布式提供了容錯(cuò)性,并發(fā)處理消息的機(jī)制。
    的頭像 發(fā)表于 12-12 09:14 ?6664次閱讀
    一文讀懂什么是分布式<b class='flag-5'>流</b>處理系統(tǒng)<b class='flag-5'>Kafka</b>

    Kafka的概念及Kafka的宕機(jī)

    問(wèn)題要從一次Kafka的宕機(jī)開(kāi)始說(shuō)起。 筆者所在的是一家金融科技公司,但公司內(nèi)部并沒(méi)有采用在金融支付領(lǐng)域更為流行的 RabbitMQ ,而是采用了設(shè)計(jì)之初就為日志處理而生的 Kafka ,所以我一直
    的頭像 發(fā)表于 08-27 11:21 ?2016次閱讀
    <b class='flag-5'>Kafka</b>的概念及<b class='flag-5'>Kafka</b>的宕機(jī)

    Kafka的核心概念

    Kafka 是主流的消息系統(tǒng),其中的概念還是比較多的,下面通過(guò)圖示的方式來(lái)梳理一下 Kafka 的核心概念,以便在我們的頭腦中有一個(gè)清晰的認(rèn)識(shí)。
    的頭像 發(fā)表于 06-20 14:24 ?904次閱讀

    什么是Redis?各種Redis部署及其權(quán)衡取舍

    Redis不是通過(guò)迭代或者排序方式處理數(shù)據(jù),而是一開(kāi)始就按照數(shù)據(jù)結(jié)構(gòu)方式組織。早期,它的使用很像 Memcached,但隨著 Redis 的改進(jìn),它在許多其他用例中變得可行,包括發(fā)布-訂閱機(jī)制、(streaming)和隊(duì)列。
    發(fā)表于 11-09 21:11 ?576次閱讀

    什么是 Redis

    其他用例中變得可行,包括發(fā)布-訂閱機(jī)制、(streaming)和隊(duì)列。 主要來(lái)說(shuō),Redis 是一個(gè)內(nèi)存數(shù)據(jù)庫(kù),用作另一個(gè)“真實(shí)”數(shù)據(jù)
    的頭像 發(fā)表于 05-22 15:32 ?1048次閱讀
    什么是 <b class='flag-5'>Redis</b>

    Kafka 的簡(jiǎn)介

    ? 1 kafka簡(jiǎn)介 2 為什么要用消息系統(tǒng) 3 kafka基礎(chǔ)知識(shí) 4 kafka集群架構(gòu) 5 總結(jié) ? 1 kafka簡(jiǎn)介 其主要設(shè)計(jì)目標(biāo)如下: 以時(shí)間復(fù)雜度為O(1)的方式提供
    的頭像 發(fā)表于 07-03 11:10 ?553次閱讀
    <b class='flag-5'>Kafka</b> 的簡(jiǎn)介

    物通博聯(lián)5G-kafka工業(yè)網(wǎng)關(guān)實(shí)現(xiàn)kafka協(xié)議對(duì)接到云平臺(tái)

    Kafka協(xié)議是一種基于TCP層的網(wǎng)絡(luò)協(xié)議,用于在分布式消息傳遞系統(tǒng)Apache Kafka中發(fā)送和接收消息。Kafka協(xié)議定義了客戶端和服務(wù)器之間的通信方式和數(shù)據(jù)格式,允許客戶端發(fā)送消息到K
    的頭像 發(fā)表于 07-11 10:44 ?455次閱讀

    Kafka架構(gòu)技術(shù):Kafka的架構(gòu)和客戶端API設(shè)計(jì)

    Kafka 給自己的定位是事件平臺(tái)(event stream platform)。因此在消息隊(duì)列中經(jīng)常使用的 "消息"一詞,在 Kafka 中被稱為 "事件"。
    的頭像 發(fā)表于 10-10 15:41 ?2242次閱讀
    <b class='flag-5'>Kafka</b>架構(gòu)技術(shù):<b class='flag-5'>Kafka</b>的架構(gòu)和客戶端API設(shè)計(jì)

    如何將Kafka使用到我們的后端設(shè)計(jì)中

    本文介紹了以下內(nèi)容: 1.什么是Kafka? 2.為什么我們需要使用Kafka這樣的消息系統(tǒng)及使用它的好處 3.如何將Kafka使用到我們的后端設(shè)計(jì)中。 譯自timber.io
    的頭像 發(fā)表于 10-30 14:30 ?452次閱讀
    如何將<b class='flag-5'>Kafka</b>使用到我們的后端設(shè)計(jì)中

    golang中使用kafka的綜合指南

    kafka是一個(gè)比較流行的分布式、可拓展、高性能、可靠的處理平臺(tái)。在處理kafka的數(shù)據(jù)時(shí),這里有確保處理效率和可靠性的多種最佳實(shí)踐。本文將介紹這幾種實(shí)踐方式,并通過(guò)sarama實(shí)現(xiàn)他們。
    的頭像 發(fā)表于 11-30 11:18 ?508次閱讀

    Java redis鎖怎么實(shí)現(xiàn)

    的使用 在Java中使用Redis需要使用到相關(guān)的客戶端庫(kù),比如Jedis、Lettuce等 配置Redis連接池的最大連接數(shù)、最大空閑連接數(shù)、連接超時(shí)時(shí)間等參數(shù) 通過(guò)連接池
    的頭像 發(fā)表于 12-04 10:47 ?1011次閱讀