0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

管道數(shù)據(jù)流"實時性" 和使用小提示

Linux愛好者 ? 來源:YXQ ? 2019-08-09 17:36 ? 次閱讀

相信很多在linux平臺工作的童鞋, 都很熟悉管道符 '|', 通過它, 我們能夠很靈活的將幾種不同的命令協(xié)同起來完成一件任務(wù)

不過這次咱們不來說這些用法, 而是來探討一些更加有意思的, 那就是管道兩邊的數(shù)據(jù)流"實時性"和管道使用的小提示.

其實我們在利用管道的時候, 可能會不經(jīng)意的去想, 我前一個命令的輸出, 是全部處理完再通過管道傳給第二個命令, 還是一邊處理一邊輸出呢? 可能在大家是試驗中或者工作經(jīng)驗中, 應該是左邊的命令全部處理完再一次性交給右邊的命令進行處理, 不光是大家, 我在最初接觸管道時, 也曾有這么一個誤會, 因為我們通過現(xiàn)象看到的就是這樣.

但其實只要有簡單了解過管道這工具, 應該都不難得出解釋:

管道是兩邊是同時進行, 也就是說, 左邊的命令輸出到管道, 管道的右邊將馬上進行處理.

管道的定義

管道是由內(nèi)核管理的一個緩沖區(qū),相當于我們放入內(nèi)存中的一個紙條。管道的一端連接一個進程的輸出。這個進程會向管道中放入信息。管道的另一端連接一個進程的輸入,這個進程取出被放入管道的信息。一個緩沖區(qū)不需要很大,它被設(shè)計成為環(huán)形的數(shù)據(jù)結(jié)構(gòu),以便管道可以被循環(huán)利用。當管道中沒有信息的話,從管道中讀取的進程會等待,直到另一端的進程放入信息。當管道被放滿信息的時候,嘗試放入信息的進程會堵塞,直到另一端的進程取出信息。當兩個進程都終結(jié)的時候,管道也自動消失。

管道工作流程圖

通過上面的解釋可以看到, 假設(shè) COMMAND1 | COMMAND2, 那么COMMAND1的標準輸出, 將會被綁定到管道的寫端, 而COMMAND2的標準輸入將會綁定到管道的讀端, 所以當COMMAND1一有輸出, 將會馬上通過管道傳給COMMAND2, 我們先來做個實驗驗證下:

#1.pyimporttimeimportsyswhile1:print'1111'time.sleep(3)print'2222'time.sleep(3)
[root@iZ23pynfq19Z~]#python1|cat

在上面的命令, 我們可以猜測下輸出結(jié)果: 究竟是 睡眠6秒之后, 輸出"1111222", 還是輸出 "1111" 睡眠3秒, 再輸出 "2222", 然后再睡眠3秒, 再輸出"1111" 呢? 答案就是: 都不是! what! 這不可能, 大家可以嘗試下, 我們會看到終端沒反應了, 為什么呢? 這就要涉及到文件IO的緩沖方式了,關(guān)于文件IO, 可以參考我的另一篇文章:淺談文件描述符1和2, 在最下面的地方提到文件IO的三種緩沖方式:

全緩沖:直到緩沖區(qū)被填滿,才調(diào)用系統(tǒng)I/O函數(shù), (一般是針對文件)

行緩沖: 遇到換行符就輸出(標準輸出)

無緩沖:沒有緩沖區(qū),數(shù)據(jù)會立即讀入或者輸出到外存文件和設(shè)備上(標準錯誤

因為python是默認采用帶緩沖的fputs(參考py27源碼: fileobject.c: PyFile_WriteString函數(shù)),又因為標準輸出被改寫到管道, 所以將會采取全緩沖的方式(shell 命令具體要看實現(xiàn), 因為有些是用不帶緩沖write實現(xiàn),如果不帶緩沖區(qū),會直接寫入管道), 所以將會采取全緩沖的方式, 也就是說, 直到緩沖區(qū)被填滿, 或者手動顯示調(diào)用flush刷入,才能看到輸出.那我們可以將代碼改寫成下面兩種方式吧

#方式1:填滿緩沖區(qū),我這邊大小是4096字節(jié),你們也可以試下這個值,估計都一樣importtimeimportsyswhile1:print'1111'*4096time.sleep(3)print'2222'*4096time.sleep(3)#方式2:手動刷入寫隊列importtimeimportsyswhile1:print'1111'sys.stdout.flush()//因為是標準輸出,所以直接通過sys的接口去flushtime.sleep(3)print'2222'sys.stdout.flush()time.sleep(3)

輸出結(jié)果:


#第一種方式:[root@iZ23pynfq19Z~]#python1|cat1111.....(超多1,刷屏了..)睡眠3秒..2222.....(超多2,刷屏了..)#第二種方式:[root@iZ23pynfq19Z~]#python1|cat1111睡眠3秒..2222睡眠3秒..1111....

在這里我們已經(jīng)能夠得出結(jié)果, 如果像我們以前所想的那樣, 要等到COMMAND1全部執(zhí)行完才一次性輸出給COMMAND2, 那么結(jié)果應該是無限堵塞..因為我的程序一直沒有執(zhí)行完..這樣應該是不符合老前輩們設(shè)計初衷的, 因為這樣可能會導致管道越來越大..然而管道也是有大小的~ 具體可以去看posix標準, 所以我們得出結(jié)論是: 只要COMMAND1的輸出寫入管道的寫端(不管是緩沖區(qū)滿還是手動flush), COMMAND2都將立刻得到數(shù)據(jù)并且馬上處理.

那么管道兩邊的數(shù)據(jù)流"實時性"討論到就先暫告一段落, 接下來將在這個基礎(chǔ)上繼續(xù)討論:管道使用的小提示.

在開始討論前, 我想先引入一個專業(yè)術(shù)語, 也是我們偶爾會遇到的, 那就是:SIGPIPE或者是一個更加具體的描述:broken pipe (管道破裂)

上面的專業(yè)術(shù)語都是跟管道讀寫規(guī)則息息相關(guān)的, 那咱們來看下 管道的讀寫規(guī)則吧:

當沒有數(shù)據(jù)可讀時

O_NONBLOCK (未設(shè)置):read調(diào)用阻塞,即進程暫停執(zhí)行,一直等到有數(shù)據(jù)來到為止。

O_NONBLOCK ( 設(shè)置 ) :read調(diào)用返回-1,errno值為EAGAIN。

當管道滿的時候

O_NONBLOCK (未設(shè)置):write調(diào)用阻塞,直到有進程讀走數(shù)據(jù)

O_NONBLOCK ( 設(shè)置 ):調(diào)用返回-1,errno值為EAGAIN

如果所有管道寫端對應的文件描述符被關(guān)閉,則read返回0

如果所有管道讀端對應的文件描述符被關(guān)閉,則write操作會產(chǎn)生信號SIGPIPE

當要寫入的數(shù)據(jù)量不大于PIPE_BUF時,linux將保證寫入的原子性。

當要寫入的數(shù)據(jù)量大于PIPE_BUF時,linux將不再保證寫入的原子性。

在上面我們可以看到, 如果我們收到SIGPIPE信號, 那么一般情況就是讀端被關(guān)閉, 但是寫端卻依舊嘗試寫入

咱們來重現(xiàn)下SIGPIPE

#!/usr/bin/pythonimporttimeimportsyswhile1:time.sleep(10)#手速不夠快的童鞋可以將睡眠時間設(shè)置長點print'1111'sys.stdout.flush()

這次執(zhí)行命令需要考驗手速了, 因為我們要趕在py醒過來之前, 將讀端進程殺掉

python1|cat------------------------#另一個終端[root@iZ23pynfq19Z~]#ps-fe|grep-P'cat|python'root107754074000:05pts/200:00:00python1root107764074000:05pts/200:00:00cat#讀端進程root1083332581000:06pts/000:00:00grep-Pcat|python[root@iZ23pynfq19Z~]#kill10776

輸出結(jié)果

[root@iZ23pynfq19Z~]#python1|catTraceback(mostrecentcalllast):File"1",line6,insys.stdout.flush()IOError:[Errno32]BrokenpipeTerminated

從上圖我們可以驗證兩個點:

當我們殺掉讀端時, 寫端會收到SIGPIPE而默認退出, 管道結(jié)束

當我們殺掉讀端時, 寫端的程序并不會馬上收到SIGPIPE, 相反的, 只有真正寫入管道寫端時才會觸發(fā)這個錯誤

如果寫入一個 讀端已經(jīng)關(guān)閉的管道, 將會收到一個SIGPIPE, 那讀一個寫端已經(jīng)關(guān)閉的管道又會這樣呢?

importtimeimportsys#這次我們不需要死循環(huán),因為我們想要寫端快點關(guān)閉退出time.sleep(5)print'1111'sys.stdout.flush()
#因為我們想要讀端等到足夠長的時間,讓寫端關(guān)閉,所以我們需要利用awk先睡眠10秒[root@iZ23pynfq19Z~]#python1.py|awk'{system("sleep10");print123}'------------------------[root@iZ23pynfq19Z~]#ps-fe|grep-P'awk|python'root117174074000:20pts/200:00:00python1.pyroot117184074000:20pts/200:00:00awk{system("sleep10");print123}root1172132581000:20pts/000:00:00grep-Pawk|python#5秒過后[root@iZ23pynfq19Z~]#ps-fe|grep-P'awk|python'root116854074000:20pts/200:00:00awk{system("sleep10");print123}root1169832581000:20pts/000:00:00grep-Pawk|python#10秒過后[root@iZ23pynfq19Z~]#python1|awk'{system("sleep10");print123}'123

在上面也已經(jīng)證明了上文提到的讀寫規(guī)則: 如果所有管道寫端對應的文件描述符被關(guān)閉,將產(chǎn)生EOF結(jié)束標志,read返回0, 程序退出。

總結(jié)

通過上面的理論和實驗, 我們知道在使用管道時, 兩邊命令的數(shù)據(jù)傳輸過程, 以及對管道讀寫規(guī)則有了初步的認識, 希望我們以后在工作時, 再接觸管道時, 能夠更加有把握的去利用這一強大的工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11161

    瀏覽量

    208460
  • 管道
    +關(guān)注

    關(guān)注

    3

    文章

    145

    瀏覽量

    17906

原文標題:聊聊 Linux 的匿名管道

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    大眾數(shù)據(jù)流分析

    、3.0發(fā)動機數(shù)據(jù)流定義與解釋別克君威2.0發(fā)動機數(shù)據(jù)流定義與解釋凱越數(shù)據(jù)流列表凱越發(fā)動機數(shù)據(jù)流定義賽歐數(shù)據(jù)流列表賽歐
    發(fā)表于 06-15 12:28

    研究labview的數(shù)據(jù)流

    我在NI上下載了labview一個程序,運行起來還有點小問題,我想運行 看看他的數(shù)據(jù)流,深入的研究下,哪位大神能指導下,怎么增加個仿真信號 和輸出采集,這樣能清楚的看到其整個數(shù)據(jù)流的過程,謝謝~
    發(fā)表于 12-31 10:40

    探測小提示

    選擇滿足示波器和應用需求的探頭,可以使您能夠進行必要的測量。實際上,進行測量和獲得有用的結(jié)果還取決于怎樣使用工具。下面的探測小提示將有助于您避免某些常見的測量問題。補償探頭大多數(shù)探頭是為與特定
    發(fā)表于 12-17 17:12

    部署實時數(shù)據(jù)流平臺面臨的挑戰(zhàn)有哪些?

    部署實時數(shù)據(jù)流平臺面臨的五大挑戰(zhàn)
    發(fā)表于 03-17 07:00

    LabVIEW數(shù)據(jù)流控制方法研究

    本文剖析了LabVIEW 數(shù)據(jù)流語言的特點,提供了其若干有效控制方法,指出LabVIEW 本身即可解決數(shù)據(jù)流控制上的變量沖突、響應時序控制、初始狀態(tài)自適應調(diào)整等問題并保證其通用
    發(fā)表于 07-30 11:39 ?13次下載

    基于數(shù)據(jù)流的Java字節(jié)碼分析

    本文基于數(shù)據(jù)流框架理論,提出了如何將數(shù)據(jù)流分析方法應用于JAVA 字節(jié)碼中,通過建立數(shù)據(jù)流與半格、數(shù)據(jù)流和函數(shù)調(diào)用圖的關(guān)系,從而對類型信息進行分析。實驗表明該
    發(fā)表于 12-25 13:22 ?9次下載

    網(wǎng)絡(luò)數(shù)據(jù)流存儲算法分析與實現(xiàn)

    針對網(wǎng)絡(luò)數(shù)據(jù)流存儲的瓶頸問題,提出了一種網(wǎng)絡(luò)數(shù)據(jù)流存儲算法分析與實現(xiàn)方法,仿真結(jié)果表明,模型能顯著提高網(wǎng)絡(luò)數(shù)據(jù)流實時存儲能力
    發(fā)表于 05-26 15:57 ?21次下載
    網(wǎng)絡(luò)<b class='flag-5'>數(shù)據(jù)流</b>存儲算法分析與實現(xiàn)

    基于FPGA芯片的數(shù)據(jù)流結(jié)構(gòu)分析

    的兼容。 這里詳細介紹了Virtex 系列FPGA 芯片的數(shù)據(jù)流大小及結(jié)構(gòu)。Virtex支持一些新的非常強大的配置模式,包括部分重新配置,這種配置機制被設(shè)計到高級應用中,以便通過芯片的配置接口能夠訪問及操作片內(nèi)數(shù)據(jù)。但想要配置
    發(fā)表于 11-18 11:37 ?2265次閱讀

    數(shù)據(jù)流編程模型優(yōu)化

    數(shù)據(jù)流編程模型將程序的計算與通信分離,暴露了應用程序潛在的并行并簡化了編程難度。分布式計算框架利用廉價PC構(gòu)建多核集群解決了大規(guī)模并行計算問題,但多核集群層次存儲結(jié)構(gòu)和處理單元對數(shù)據(jù)流
    發(fā)表于 11-23 15:48 ?3次下載
    <b class='flag-5'>數(shù)據(jù)流</b>編程模型優(yōu)化

    數(shù)據(jù)環(huán)境下的分布式數(shù)據(jù)流處理關(guān)鍵技術(shù)探析

    數(shù)據(jù)環(huán)境下的數(shù)據(jù)流處理實時性要求高,數(shù)據(jù)計算要求持續(xù)和高可靠。分布式
    發(fā)表于 12-05 19:04 ?0次下載
    大<b class='flag-5'>數(shù)據(jù)</b>環(huán)境下的分布式<b class='flag-5'>數(shù)據(jù)流</b>處理關(guān)鍵技術(shù)探析

    數(shù)據(jù)流的網(wǎng)絡(luò)實時入侵檢測

    針對計算機網(wǎng)絡(luò)訪問請求具有實時到達以及動態(tài)變化的特點,為了實時檢測網(wǎng)絡(luò)入侵,并且適應網(wǎng)絡(luò)訪問數(shù)據(jù)的動態(tài)變化,提出一個基于數(shù)據(jù)流的網(wǎng)絡(luò)入侵實時
    發(fā)表于 01-17 10:09 ?0次下載
    <b class='flag-5'>數(shù)據(jù)流</b>的網(wǎng)絡(luò)<b class='flag-5'>實時</b>入侵檢測

    時間數(shù)據(jù)流的并行檢測算法

    針對現(xiàn)有長持續(xù)時間數(shù)據(jù)流檢測算法的實時差、檢測精度與估計精度低的問題,提出長持續(xù)時間數(shù)據(jù)流的并行檢測算法?;诠蚕?b class='flag-5'>數(shù)據(jù)結(jié)構(gòu)的長持續(xù)時間
    發(fā)表于 03-06 15:54 ?0次下載
    時間<b class='flag-5'>數(shù)據(jù)流</b>的并行檢測算法

    數(shù)據(jù)流是什么

    數(shù)據(jù)流最初是通信領(lǐng)域使用的概念,代表傳輸中所使用的信息的數(shù)字編碼信號序列。然而,我們所提到的數(shù)據(jù)流概念與此不同。這個概念最初在1998年由Henzinger在文獻87中提出,他將數(shù)據(jù)流定義為“只能以事先規(guī)定好的順序被讀取一次的
    的頭像 發(fā)表于 02-27 15:25 ?6966次閱讀

    控制數(shù)據(jù)流的區(qū)別

    控制數(shù)據(jù)流的區(qū)別? 在計算機科學中,控制數(shù)據(jù)流是兩個非常重要的概念。雖然它們經(jīng)常一起使用,但它們具有非常不同的含義。本文將討論控制
    的頭像 發(fā)表于 09-13 11:17 ?4965次閱讀

    示波器探頭的探測小提示

    選擇滿足示波器和應用需求的探頭,可以使您能夠進行必要的測量。實際上,進行測量和獲得有用的結(jié)果還取決于怎樣使用工具。下面的探測小提示將有助于您避免某些常見的測量問題: 補償探頭 大多數(shù)探頭是為與特定
    的頭像 發(fā)表于 07-23 10:53 ?142次閱讀
    示波器探頭的探測<b class='flag-5'>小提示</b>