0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分析型數(shù)據(jù)庫如何創(chuàng)新

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-06-02 16:10 ? 次閱讀

在群雄逐鹿的 OLAP 數(shù)據(jù)庫市場,開源引擎 ClickHouse 憑借其出色的性能成為公認(rèn)的黑馬。官方稱其性能超過了市場上同類的列式數(shù)據(jù)庫,每臺服務(wù)器每秒可處理數(shù)億到超過十億行、體積達(dá)數(shù)十 GB 的數(shù)據(jù),運(yùn)行速度比傳統(tǒng)數(shù)據(jù)庫快 100-1000 倍。
高效運(yùn)行速度的另一面,還隱含著成本、性能、容量等諸多問題,比如不支持事務(wù),不能夠保證數(shù)據(jù)的一致性和完整性,不存在隔離級別,不支持高并發(fā)等等。這導(dǎo)致 2016 年開源的 ClickHouse 難以應(yīng)對當(dāng)下更加復(fù)雜,數(shù)據(jù)規(guī)模更加巨大的場景需求。

比如在字節(jié)內(nèi)部,從 2018 年引入 ClickHouse,因為業(yè)務(wù)的發(fā)展,要服務(wù)于大量的用戶,數(shù)據(jù)規(guī)模變得越來越巨大。由于 ClickHouse 是 Shared-Nothing 的架構(gòu),每個節(jié)點(diǎn)是獨(dú)立的,不會共享存儲資源等,因而計算資源和存儲資源是緊耦合的。這導(dǎo)致擴(kuò)縮容成本變高,且會涉及到數(shù)據(jù)遷移,不能實時按需的擴(kuò)縮容,從而導(dǎo)致資源的浪費(fèi)。此外,ClickHouse 的緊耦合的架構(gòu)會導(dǎo)致多租戶在共享集群相互影響,另外由于讀寫在一個節(jié)點(diǎn)完成,導(dǎo)致讀寫受到影響,最后 ClickHouse 在復(fù)雜查詢上例如多表 join 等的性能支持并不是很好。
字節(jié) ClickHouse 使用情況 為了解決這些痛點(diǎn),字節(jié)在 ClickHouse 架構(gòu)基礎(chǔ)上進(jìn)行了升級,于 2020 年在內(nèi)部啟動了 ByConity 項目,并于 2023 年 1 月發(fā)布 Beta 版本,將于 5 月底正式對外開源。

ByConity 是一個開源的云原生數(shù)據(jù)倉庫,采用存儲 - 計算分離的架構(gòu)。它支持多個關(guān)鍵功能特性,如存儲計算分離、彈性擴(kuò)縮容、租戶資源隔離和數(shù)據(jù)讀寫的強(qiáng)一致性等。通過利用主流的 OLAP 引擎優(yōu)化,如列存儲、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,ByConity 可以提供優(yōu)異的讀寫性能。

ByConity 的架構(gòu)分為三層,如下圖所示,服務(wù)接入層包含負(fù)責(zé)客戶端數(shù)據(jù)和服務(wù)的接入,也就是 ByConity Server;計算組為 ByConity 的計算資源層,每個 Virtual Warehouse 是一個計算組;數(shù)據(jù)存儲層由分布式文件系統(tǒng),如 HDFS、S3 等構(gòu)成。
3b7f8892-f653-11ed-90ce-dac502259ad0.jpg ByConity 三層技術(shù)架構(gòu)圖 除了兼?zhèn)?ClickHouse 的一些優(yōu)點(diǎn)外,ByConity 還實現(xiàn)了了諸多新的功能。

ByConity 的一個重要優(yōu)勢是存儲 - 計算分離的架構(gòu),它實現(xiàn)了讀寫分離和彈性擴(kuò)縮容。它的優(yōu)勢是高彈性和高擴(kuò)展性。這種架構(gòu)確保讀操作和寫操作不會相互影響,使得計算資源和存儲資源解耦,兩者可以按需的且獨(dú)立的擴(kuò)縮容,確保資源高效利用。此外,ByConity 支持多租戶資源隔離功能,保證不同租戶之間不會互相影響,使 ByConity 適用于多租戶環(huán)境,如圖 2。
3b9776e6-f653-11ed-90ce-dac502259ad0.png ByConity 存儲 - 計算分離,實現(xiàn)多租戶隔離 ByConity 支持?彈性的擴(kuò)縮容,能夠?qū)崟r、按需的對計算資源進(jìn)行擴(kuò)縮容,保證資源的高效利用。并且它能對不同的租戶進(jìn)行?資源的隔離,租戶之間不會受到相互影響。其另一個重要功能是?數(shù)據(jù)讀寫的強(qiáng)一致性?,確保數(shù)據(jù)始終是最新的,讀寫之間沒有不一致。此外,ByConity 采用了主流的 OLAP 引擎優(yōu)化,例如列存、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,來保證提供了?優(yōu)異的讀寫性能。

之所以采用開源的模式,ByConity 項目組是希望能夠把項目回饋給社區(qū),同時也希望通過社區(qū)的力量加強(qiáng)和完善 ByConity。接下來,ByConity 在 2023 開源社區(qū)發(fā)展規(guī)劃中,希望增強(qiáng) ByConity 的功能、性能和易用性,重點(diǎn)關(guān)注開發(fā)新的存儲引擎、支持更多的數(shù)據(jù)類型和與其他數(shù)據(jù)管理工具的集成領(lǐng)域。

責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4172

    瀏覽量

    85483
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3737

    瀏覽量

    64173
  • OLAP
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    10074

原文標(biāo)題:分析型數(shù)據(jù)庫如何創(chuàng)新?

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    關(guān)系數(shù)據(jù)庫與非關(guān)系數(shù)據(jù)庫的區(qū)別淺析

    關(guān)系數(shù)據(jù)庫的一個劣勢就是 阻抗失諧(impedance mismatch):關(guān)系模型和內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)之間存在差異關(guān)系數(shù)據(jù)庫中不可以含有
    發(fā)表于 06-03 06:03

    什么是層次數(shù)據(jù)庫

    什么是層次數(shù)據(jù)庫 層次數(shù)據(jù)庫管理系統(tǒng)是緊隨網(wǎng)狀數(shù)據(jù)庫而出現(xiàn)的?,F(xiàn)實世界中很多事物是按層次組織起來的。層次
    發(fā)表于 06-17 07:37 ?3081次閱讀

    什么是關(guān)系數(shù)據(jù)庫

    什么是關(guān)系數(shù)據(jù)庫 關(guān)系數(shù)據(jù)庫簡介   關(guān)系數(shù)據(jù)庫以行和列的形式存儲
    發(fā)表于 06-17 07:38 ?9113次閱讀

    什么是非關(guān)系數(shù)據(jù)庫

    什么是非關(guān)系數(shù)據(jù)庫 談到非關(guān)系數(shù)據(jù)庫設(shè)計的難點(diǎn),朱海峰說:“我們可以從一些場景來看這個問題。一般數(shù)據(jù)庫設(shè)計人員以前更多的是處理
    發(fā)表于 06-17 15:49 ?3114次閱讀

    數(shù)據(jù)庫教程之如何進(jìn)行數(shù)據(jù)庫設(shè)計

    本文檔的主要內(nèi)容詳細(xì)介紹的是數(shù)據(jù)庫教程之如何進(jìn)行數(shù)據(jù)庫設(shè)計內(nèi)容包括了:1 數(shù)據(jù)庫設(shè)計概述 ,2 數(shù)據(jù)庫需求分析 ,3
    發(fā)表于 10-19 10:41 ?21次下載
    <b class='flag-5'>數(shù)據(jù)庫</b>教程之如何進(jìn)行<b class='flag-5'>數(shù)據(jù)庫</b>設(shè)計

    數(shù)據(jù)庫不使用外鍵這是為什么?

    當(dāng)我們想要持久化地存儲數(shù)據(jù)時,使用關(guān)系數(shù)據(jù)庫往往都是最穩(wěn)妥的選擇,這不僅因為今天的關(guān)系數(shù)據(jù)庫種類非常豐富并且穩(wěn)定,還因為不同社區(qū)對關(guān)系
    的頭像 發(fā)表于 09-01 10:00 ?5017次閱讀

    動力環(huán)境監(jiān)控數(shù)據(jù)庫的簡單分析

    淺析各種數(shù)據(jù)庫的關(guān)系及區(qū)別。 數(shù)據(jù)庫常見和類型有層次式數(shù)據(jù)庫、網(wǎng)絡(luò)式數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫。然爾今
    發(fā)表于 12-19 20:59 ?393次閱讀

    華為云數(shù)據(jù)庫\-GaussDB for MySQL數(shù)據(jù)庫

    華為云數(shù)據(jù)庫-GaussDB for MySQL數(shù)據(jù)庫 GaussDB是華為云自主研發(fā)的一款高性能關(guān)系數(shù)據(jù)庫,它完全兼容了MySQL,而且它是華為云最新的一代企業(yè)級分布式關(guān)系
    的頭像 發(fā)表于 10-27 14:56 ?1161次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】MySQL數(shù)據(jù)庫Delete誤刪除的數(shù)據(jù)恢復(fù)案例

    MySQL數(shù)據(jù)庫屬于關(guān)系數(shù)據(jù)庫。SQL是一種用于操作關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化語言。關(guān)系
    的頭像 發(fā)表于 12-07 11:49 ?3294次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】MySQL<b class='flag-5'>數(shù)據(jù)庫</b>Delete誤刪除的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    OpenHarmony關(guān)系數(shù)據(jù)庫概述

    關(guān)系數(shù)據(jù)庫(Relational Database, 以下簡稱RDB)是一種基于關(guān)系模型來管理數(shù)據(jù)數(shù)據(jù)庫,是在SQLite基礎(chǔ)上提供一套完整的對本地
    的頭像 發(fā)表于 03-28 18:08 ?956次閱讀
    OpenHarmony關(guān)系<b class='flag-5'>型</b><b class='flag-5'>數(shù)據(jù)庫</b>概述

    分析數(shù)據(jù)庫如何創(chuàng)新?GOTC 2023議題揭秘

    在群雄逐鹿的 OLAP 數(shù)據(jù)庫市場,開源引擎 ClickHouse 憑借其出色的性能成為公認(rèn)的黑馬。官方稱其性能超過了市場上同類的列式數(shù)據(jù)庫,每臺服務(wù)器每秒可處理數(shù)億到超過十億行、體積達(dá)數(shù)十 GB
    的頭像 發(fā)表于 05-19 09:03 ?377次閱讀
    <b class='flag-5'>分析</b><b class='flag-5'>型</b><b class='flag-5'>數(shù)據(jù)庫</b>如何<b class='flag-5'>創(chuàng)新</b>?GOTC 2023議題揭秘

    數(shù)據(jù)庫知識

    數(shù)據(jù)時代的數(shù)據(jù)庫 --數(shù)據(jù)采集、數(shù)據(jù)清洗和分析、數(shù)據(jù)可視化:提供決策依據(jù) openGaus
    發(fā)表于 06-09 16:10 ?0次下載

    關(guān)系數(shù)據(jù)庫的基本原理(什么是關(guān)系數(shù)據(jù)庫

    什么是關(guān)系數(shù)據(jù)庫?關(guān)系數(shù)據(jù)庫,簡稱 RDBMS是由許多數(shù)據(jù)表(Table)所組成,資料表又是由許多筆記錄(Row 或Record)所組成
    的頭像 發(fā)表于 07-10 09:06 ?1336次閱讀

    MySQL數(shù)據(jù)庫管理與應(yīng)用

    MySQL數(shù)據(jù)庫管理與應(yīng)用 MySQL是一種廣泛使用的關(guān)系數(shù)據(jù)庫管理系統(tǒng),被認(rèn)為是最流行和最常見的開源數(shù)據(jù)庫之一。它可以被用于多種不同的應(yīng)用程序,包括網(wǎng)站開發(fā)、
    的頭像 發(fā)表于 08-28 17:15 ?890次閱讀

    NoSQL 數(shù)據(jù)庫如何選型

    什么是NoSQL數(shù)據(jù)庫?為什么要使用NoSQL數(shù)據(jù)庫?鍵值數(shù)據(jù)庫內(nèi)存鍵值數(shù)據(jù)庫文檔數(shù)據(jù)庫列式數(shù)據(jù)庫
    的頭像 發(fā)表于 11-26 08:05 ?401次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型