0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

相比Matplotlib 可視化神器Altair登場

電子工程師 ? 來源:fqj ? 2019-05-23 14:49 ? 次閱讀

如何將我們的數(shù)據(jù)以更好的形勢呈現(xiàn)出來?擅長不同編程語言的程序員會(huì)選擇各自技術(shù)范疇內(nèi)成熟、好用的工具包,比如 R 語言的開發(fā)者最常使用的是 ggplot2,但它不支持 Python;以前 Python 語言的開發(fā)者使用最多的是 matplotlib,一個(gè)很強(qiáng)大的可視化庫,不過它的局限也非常嚴(yán)重,制作交互式圖表也是一件難事。今天要給大家推薦一個(gè)新的工具——Altair,一個(gè) Vega-Lite 的包裝器,也許這些概念你都還不沒了解過,接下來我們就在下面的文章為大家作介紹。

ggplot2 是 R 的作圖工具包,可以使用非常簡單的語句實(shí)現(xiàn)非常復(fù)雜漂亮的效果。然而不幸的是,ggplot2 并不支持 Python。

在 Python 中,我們常使用 matplotlib 用于可視化圖形,matplotlib是一個(gè)很強(qiáng)大的可視化庫,但是它有著很嚴(yán)重的局限性。matplotlib 的使用非常靈活,這可以說的上是它的一個(gè)優(yōu)點(diǎn),但是當(dāng)我們想為圖形加一個(gè)小小的功能的時(shí)候,它的繁瑣操作會(huì)讓我們舉步維艱。除此之外,matplotlib 的兩種界面(面向?qū)ο蠼缑妗⒒跔顟B(tài)的界面)令人相當(dāng)困惑,對于新手很不友好。即使對于多年使用 matplotlib 的人而言,他們也無法完全掌握這些操作。最后不得不說的是,用 matplotlib 制作交互式圖表是一件相當(dāng)困難的事情。

Altair 和圖形語法

Altair 是 Vega-Lite 的包裝器。Vega-Lite 是 JavaScript 的高級可視化庫,它最最重要的特點(diǎn)是,它的API是基于圖形語法的。

什么是圖形語法呢?圖形語法聽起來有點(diǎn)像一個(gè)抽象的功能,值得注意的是,它是 Altair 和其他 Python 可視化庫之間最主要的區(qū)別。Altair 符合我們?nèi)祟惪梢暬瘮?shù)據(jù)的方式和習(xí)慣,Altair 只需要三個(gè)主要的參數(shù)

Mark.數(shù)據(jù)在圖形中的表達(dá)形式。點(diǎn)、線、柱狀還是圓圈?

Channels.決定什么數(shù)據(jù)應(yīng)該作為x軸,什么作為y軸;圖形中數(shù)據(jù)標(biāo)記的大小和顏色。

Encoding.指定數(shù)據(jù)變量類型。日期變量、量化變量還是類別變量?

基于以上三個(gè)參數(shù),Altair 將會(huì)選擇合理的默認(rèn)值來顯示我們的數(shù)據(jù)。

Altair 最讓人著迷的地方是,它能夠合理的選擇顏色。如果我們在 Encoding 中指定變量類型為量化變量,那么 Altair 將會(huì)使用連續(xù)的色標(biāo)來著色(默認(rèn)為 淺藍(lán)色-藍(lán)色-深藍(lán)色)。如果變量類型指定為類別變量,那么 Altair 會(huì)為每個(gè)類別賦予不同的顏色。(例如 紅色,黃色,藍(lán)色)

補(bǔ)充:Vega-Lite 有兩種類型的類別變量:名義變量和序數(shù)變量。名義變量的集合中,各元素的排序階數(shù)沒有任何實(shí)際意義,例如大陸集合是歐洲,亞洲,非洲,美洲,大洋洲,他們的次序沒有任何數(shù)值上的意義;序數(shù)變量的集合中,各元素的排序階數(shù)是有實(shí)際意義的,例如亞馬遜的評論可以是一星,二星,三星,四星或五星,星級的高低次序是由意義的。

讓我們來看一個(gè)具體的例子,如下所示,我們組織了6個(gè)國家和它們所對應(yīng)的人口數(shù)據(jù),除此之外,還有相應(yīng)的收入數(shù)據(jù):

import pandas as pdimport altair as altdata = pd.DataFrame({'country_id': [1, 2, 3, 4, 5, 6], 'population': [1, 100, 200, 300, 400, 500],
'income':
[1000,50,200,300,200,150]})

相比Matplotlib 可視化神器Altair登場

首先我們繪制每個(gè)國家的人口數(shù)據(jù):

首先我們繪制每個(gè)國家的人口數(shù)據(jù):"""As we mentioned before, we need to define 3 parameters:
1. Mark: We do this by using "mark_circle".
2. Channel: We only define an x-axis and we map it to the population.
3. Encodings: We define both variables as quantitative by using :Q after the column name"""categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', color='country_id:Q')

相比Matplotlib 可視化神器Altair登場

從上圖可以看出,Altair 選擇了連續(xù)色標(biāo),在本例中這是沒有意義的。問題的根源在于,我們將 country_id 定義為量化變量,而實(shí)際上,它應(yīng)該是一個(gè)類別變量,修改代碼如下:

# We changed color='country_id:Q' to color='country_id:N' to indicate it is a nominal variablecategorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', color='country_id:N')

相比Matplotlib 可視化神器Altair登場

從圖中可以看到,每個(gè)國家都用了不同的顏色表示。我們僅僅改變了變量 country_id 的編碼,即用 N (Nominal 名義變量)替換了 Q (Quantitative 量化變量)。這點(diǎn)小小的改變就足以使得 Altair 明白,它不該使用連續(xù)色標(biāo),而是使用獨(dú)立色標(biāo)。

圖表的擴(kuò)展

Altair 的另一個(gè)美妙之處就是,我們可以從現(xiàn)有的圖表中創(chuàng)建新的圖表。例如,我們現(xiàn)在要加入新的數(shù)據(jù) income,我們唯一需要做的就是告訴 Altair:用 income 作為y軸,代碼如下所示:

categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', y='income:Q', color='country_id:N')

相比Matplotlib 可視化神器Altair登場

如果想添加數(shù)據(jù)提示的功能(tooltip,鼠標(biāo)懸停在數(shù)據(jù)上時(shí),會(huì)顯示該數(shù)據(jù)的詳細(xì)信息),只需要增加一行代碼:

categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', y='income:Q', color='country_id:N', tooltip=['country_id', 'population', 'income']))

Altair 的迷人之處

在接觸 Altair 之前,我們常常持有一種的懷疑態(tài)度:這些可視化工具的包裝器真的好用嗎?通常來講,包裝是一個(gè)壞主意,就拿 ggplot2 來說,它的很多包裝器都沒有被 Python 社區(qū)廣泛采用。這些包裝器很難創(chuàng)建功能完整的版本,而且它們的更新也常常不及時(shí)。然而 Altair 卻不一樣:

Altair 的 API 非常全面。這就要感謝 Jake Vanderplas(JVP)偉大的設(shè)計(jì),凡是 Vega-Lite 能夠做的,Python 就可以做。這是因?yàn)?Altair 只是一個(gè) Python API,它能夠生成有效的 Vega-Lite jsons,而 API 是以編程的方式生成的,因此在 Vega-Lite 的新版本發(fā)布后,Altair 能夠全面而且快速的更新,這一切都顯得如此美妙。

直觀且具有符合 Python 習(xí)慣的接口。就像使用其他的 Python 庫一樣,我們需要一些時(shí)間來習(xí)慣。但 Altair 的精彩之處在于,它所有的設(shè)置都符合人類的推理方式,這樣我們就能很快的了解它內(nèi)部的運(yùn)作原理,并且因此而變得高效。

互動(dòng)性強(qiáng)。Vega-Lite 交互性非常強(qiáng)大,我們不僅能夠使用一行代碼來添加 tooltips,還能將圖的選擇區(qū)與另一個(gè)可視化圖關(guān)聯(lián)。

高度靈活性。Altair的marks可以理解為圖表構(gòu)建中的模塊。如下圖所示,我們用圓圈標(biāo)記、線標(biāo)記和文本標(biāo)記的組合來構(gòu)建一個(gè)圖。最終的代碼可讀性強(qiáng),而且易于修改,這對于 matplotlib 來說是很難的。

相比Matplotlib 可視化神器Altair登場

相比Matplotlib 可視化神器Altair登場

有點(diǎn)很多,同時(shí)也存在一些不足

Altair 的主要缺點(diǎn)

沒有 3d 繪圖。如果3d可視化對您的工作很重要,那么 Altair 不太適合您。

Altair 不是 D3.js。就像許多的高級可視化框架一樣,Altair 也不是 100% 可定制的,在某些時(shí)候,我們會(huì)遇到一些無法用Altair制作的圖表。(注:D3.js 是一個(gè) JavaScript 庫,用于在 Web 瀏覽器中生成動(dòng)態(tài)的交互式數(shù)據(jù)可視化。 它利用了廣泛實(shí)施的 SVG,HTML5 和 CSS 標(biāo)準(zhǔn),具有高度的可定制性)

統(tǒng)計(jì)支持較差。如果需要對數(shù)據(jù)進(jìn)行線性回歸的話,還是推薦用 Seaborn 來進(jìn)行快速可視化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 編程語言
    +關(guān)注

    關(guān)注

    10

    文章

    1919

    瀏覽量

    34502
  • Altair
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    9998

原文標(biāo)題:還在用Matplotlib? 又一可視化神器Altair登場

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    可視化MES系統(tǒng)軟件

    是關(guān)鍵部分,可視化管理可幫助企業(yè)更直觀的挖掘隱藏的數(shù)據(jù)并有效管理企業(yè)?!爸圃煳锫?lián)”是MES系統(tǒng)軟件更高階段的必然表現(xiàn)形式?!爸圃煳锫?lián)”與MES系統(tǒng)軟件的側(cè)重:(1)MES側(cè)重生產(chǎn)業(yè)務(wù)管理,制造物聯(lián)更關(guān)注
    發(fā)表于 11-30 19:55

    matplotlib動(dòng)態(tài)演示深度學(xué)習(xí)之tensorflow將神經(jīng)網(wǎng)絡(luò)系統(tǒng)自動(dòng)學(xué)習(xí)散點(diǎn)(二次函數(shù)+noise)并優(yōu)化修正并且將輸出結(jié)果可視化

    TF之NN:matplotlib動(dòng)態(tài)演示深度學(xué)習(xí)之tensorflow將神經(jīng)網(wǎng)絡(luò)系統(tǒng)自動(dòng)學(xué)習(xí)散點(diǎn)(二次函數(shù)+noise)并優(yōu)化修正并且將輸出結(jié)果可視化
    發(fā)表于 12-21 10:48

    數(shù)據(jù)可視化之Python-matplotlib概述

    數(shù)據(jù)可視化(二):Python-matplotlib
    發(fā)表于 07-22 14:58

    如何把AD中非可視化區(qū)域物件移到可視化區(qū)域?

    AD中非可視化區(qū)域物件怎么移到可視化區(qū)域???
    發(fā)表于 09-10 05:36

    基于STM的可視化門禁系統(tǒng)

    基于STM的可視化門禁系統(tǒng)
    發(fā)表于 03-07 09:49

    基于stm的可視化門禁系統(tǒng)

    基于stm的可視化門禁系統(tǒng)
    發(fā)表于 03-11 09:23

    Python數(shù)據(jù)可視化

    Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單
    發(fā)表于 07-19 08:30

    三維可視化的應(yīng)用和優(yōu)勢

    ,為此三維可視化運(yùn)維系統(tǒng)登場了?! ∪S可視化的應(yīng)用  宏觀場景可視化:在特定的環(huán)境中對隨著時(shí)間推移而不斷變化的目標(biāo)實(shí)體進(jìn)行檢測,可以直觀、靈活、逼真的展示所處區(qū)域的情景和環(huán)境,可以快
    發(fā)表于 12-02 11:52

    常見的幾種可視化介紹

    與方法,幫助人們理解和分析數(shù)據(jù)。與科學(xué)可視化相比,信息可視化則側(cè)重于抽象數(shù)據(jù)集,幫助用戶理解、分析繁雜的數(shù)據(jù)信息
    發(fā)表于 07-12 07:49

    經(jīng)驗(yàn)分享|BI數(shù)據(jù)可視化報(bào)表布局——容器

    容器功能是一種用于數(shù)據(jù)可視化圖表排版的功能,主要作用對圖表進(jìn)行有效的布局調(diào)整,或者用于巧妙在同一地方安排多個(gè)不同類型的數(shù)據(jù)可視化圖表,供使用者點(diǎn)擊切換瀏覽。目前,在奧威BI軟件上一同有兩類容器功能
    發(fā)表于 03-15 17:10

    keras可視化介紹

    keras可視化可以幫助我們直觀的查看所搭建的模型拓?fù)浣Y(jié)構(gòu),以及模型的訓(xùn)練的過程,方便我們優(yōu)化模型。 模型可視化又分為模型拓?fù)浣Y(jié)構(gòu)可視化以及訓(xùn)練過程可視化。 以上一講的mnist為例,
    發(fā)表于 08-18 07:53

    可視化技術(shù)有哪些

    完整的地理空間信息可視化概念主要包括科學(xué)計(jì)算可視化、數(shù)據(jù)可視化和信息可視化可視化技術(shù)作為解釋大量數(shù)據(jù)最有效的手段而率先被科學(xué)與工程計(jì)算領(lǐng)域
    發(fā)表于 02-05 09:09 ?3724次閱讀

    還在用Matplotlib? 又一可視化神器Altair登場

    在接觸 Altair 之前,我們常常持有一種的懷疑態(tài)度:這些可視化工具的包裝器真的好用嗎?通常來講,包裝是一個(gè)壞主意,就拿 ggplot2 來說,它的很多包裝器都沒有被 Python 社區(qū)廣泛采用。這些包裝器很難創(chuàng)建功能完整的版本,而且它們的更新也常常不及時(shí)。
    的頭像 發(fā)表于 05-11 09:43 ?2720次閱讀
    還在用<b class='flag-5'>Matplotlib</b>? 又一<b class='flag-5'>可視化</b><b class='flag-5'>神器</b><b class='flag-5'>Altair</b><b class='flag-5'>登場</b>

    使用Python來收集、處理和可視化人口數(shù)據(jù)

    數(shù)據(jù)分析和可視化: pandas:一個(gè)提供高性能、易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具的庫。 requests:一個(gè)簡潔、優(yōu)雅的HTTP庫,用于發(fā)送網(wǎng)絡(luò)請求和獲取數(shù)據(jù)。 matplotlib:一個(gè)強(qiáng)大的繪圖庫,支持多種圖形和樣式。 seaborn:一個(gè)基于
    的頭像 發(fā)表于 06-21 17:08 ?1275次閱讀
    使用Python來收集、處理和<b class='flag-5'>可視化</b>人口數(shù)據(jù)

    Altair:一個(gè)漂亮易用的數(shù)據(jù)可視化

    Altair 是一個(gè)基于Jupyter Notebook的強(qiáng)大可視化庫。它提供了強(qiáng)大而簡潔的可視化語法,使我們能夠快速構(gòu)建各種統(tǒng)計(jì)可視化圖表。 通過下面10行代碼,你就能創(chuàng)建一個(gè)可交互
    的頭像 發(fā)表于 10-21 10:43 ?834次閱讀
    <b class='flag-5'>Altair</b>:一個(gè)漂亮易用的數(shù)據(jù)<b class='flag-5'>可視化</b>庫