0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何知道你的代碼是否線程安全

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-11-01 11:42 ? 次閱讀

在并發(fā)編程時,如果多個線程訪問同一資源,我們需要保證訪問的時候不會產(chǎn)生沖突,數(shù)據(jù)修改不會發(fā)生錯誤,這就是我們常說的 線程安全 。

那什么情況下,訪問數(shù)據(jù)時是安全的?什么情況下,訪問數(shù)據(jù)是不安全的?如何知道你的代碼是否線程安全?要如何訪問數(shù)據(jù)才能保證數(shù)據(jù)的安全?

本篇文章會一一回答你的問題。

1. 線程不安全是怎樣的?

要搞清楚什么是線程安全,就要先了解線程不安全是什么樣的。

比如下面這段代碼,開啟兩個線程,對全局變量 number 各自增 10萬次,每次增量 1。

from threading import Thread, Lock

number = 0

def target():
    global number
    for _ in range(1000000):
        number += 1

thread_01 = Thread(target=target)
thread_02 = Thread(target=target)
thread_01.start()
thread_02.start()

thread_01.join()
thread_02.join()

print(number)

正常我們的預期輸出結(jié)果,一個線程自增100萬,兩個線程就自增 200 萬嘛,輸出肯定為 2000000 。

可事實卻并不是你想的那樣,不管你運行多少次,每次輸出的結(jié)果都會不一樣,而這些輸出結(jié)果都有一個特點是,都小于 200 萬。

以下是執(zhí)行三次的結(jié)果

1459782
1379891
1432921

這種現(xiàn)象就是線程不安全,究其根因,其實是我們的操作 number += 1 ,不是原子操作,才會導致的線程不安全。

2. 什么是原子操作?

原子操作( atomic operation ),指不會被線程調(diào)度機制打斷的操作,這種操作一旦開始,就一直運行到結(jié)束,中間不會切換到其他線程。

它有點類似數(shù)據(jù)庫中的 事務(wù) 。

Python 的官方文檔上,列出了一些常見原子操作

L.append(x)
L1.extend(L2)
x = L[i]
x = L.pop()
L1[i:j] = L2
L.sort()
x = y
x.field = y
D[x] = y
D1.update(D2)
D.keys()

而下面這些就不是原子操作

i = i+1
L.append(L[-1])
L[i] = L[j]
D[x] = D[x] + 1

像上面的我使用自增操作 number += 1,其實等價于 number = number + 1,可以看到這種可以拆分成多個步驟(先讀取相加再賦值),并不屬于原子操作。

這樣就導致多個線程同時讀取時,有可能讀取到同一個 number 值,讀取兩次,卻只加了一次,最終導致自增的次數(shù)小于預期。

當我們還是無法確定我們的代碼是否具有原子性的時候,可以嘗試通過 dis 模塊里的 dis 函數(shù)來查看

圖片

當我們執(zhí)行這段代碼時,可以看到 number += 1 這一行代碼,由兩條字節(jié)碼實現(xiàn)。

  • BINARY_ADD :將兩個值相加
  • STORE_GLOBAL:將相加后的值重新賦值

每一條字節(jié)碼指令都是一個整體,無法分割,他實現(xiàn)的效果也就是我們所說的原子操作。

當一行代碼被分成多條字節(jié)碼指令的時候,就代表在線程線程切換時,有可能只執(zhí)行了一條字節(jié)碼指令,此時若這行代碼里有被多個線程共享的變量或資源時,并且拆分的多條指令里有對于這個共享變量的寫操作,就會發(fā)生數(shù)據(jù)的沖突,導致數(shù)據(jù)的不準確。

為了對比,我們從上面列表的原子操作拿一個出來也來試試,是不是真如官網(wǎng)所說的原子操作。

這里我拿字典的 update 操作舉例,代碼和執(zhí)行過程如下圖

圖片

從截圖里可以看到,info.update(new) 雖然也分為好幾個操作

  • LOAD_GLOBAL:加載全局變量
  • LOAD_ATTR:加載屬性,獲取 update 方法
  • LOAD_FAST:加載 new 變量
  • CALL_FUNCTION:調(diào)用函數(shù)
  • POP_TOP:執(zhí)行更新操作

但我們要知道真正會引導數(shù)據(jù)沖突的,其實不是讀操作,而是寫操作。

上面這么多字節(jié)碼指令,寫操作都只有一個( POP_TOP ),因此字典的 update 方法是原子操作。

3. 實現(xiàn)人工原子操作

在多線程下,我們并不能保證我們的代碼都具有原子性,因此如何讓我們的代碼變得具有 “ 原子性 ” ,就是一件很重要的事。

方法也很簡單,就是當你在訪問一個多線程間共享的資源時,加鎖可以實現(xiàn)類似原子操作的效果,一個代碼要嘛不執(zhí)行,執(zhí)行了的話就要執(zhí)行完畢,才能接受線程的調(diào)度。

因此,我們使用加鎖的方法,對例子一進行一些修改,使其具備“ 原子性 ”。

from threading import Thread, Lock


number = 0
lock = Lock()


def target():
    global number
    for _ in range(1000000):
        with lock:
            number += 1

thread_01 = Thread(target=target)
thread_02 = Thread(target=target)
thread_01.start()
thread_02.start()

thread_01.join()
thread_02.join()

print(number)

此時,不管你執(zhí)行多少遍,輸出都是 2000000.

4. 為什么 Queue 是線程安全的?

Python 的 threading 模塊里的消息通信機制主要有如下三種:

  1. Event
  2. Condition
  3. Queue

使用最多的是 Queue,而我們都知道它是線程安全的。當我們對它進行寫入和提取的操作不會被中斷而導致錯誤,這也是我們在使用隊列時,不需要額外加鎖的原因。

他是如何做到的呢?

其根本原因就是 Queue 實現(xiàn)了鎖原語,因此他能像第三節(jié)那樣實現(xiàn)人工原子操作。

原語指由若干個機器指令構(gòu)成的完成某種特定功能的一段程序,具有不可分割性;即原語的執(zhí)行必須是連續(xù)的,在執(zhí)行過程中不允許被中斷。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6754

    瀏覽量

    88614
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4256

    瀏覽量

    62224
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4694

    瀏覽量

    68078
  • 線程安全
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    2453
收藏 人收藏

    評論

    相關(guān)推薦

    知道最短最高效的代碼是什么?

    知道最短最高效的代碼是什么?我先公布我的答案,是下面這個代碼片: #include int main() { printf(“Hello world!”) } 就是這個,是它
    發(fā)表于 12-01 17:16

    XC32源碼和字符串線程安全

    我正在嘗試我的項目的FrReTOS遷移,我想了解哪些字符串處理函數(shù)是線程安全的,或者不是線程安全的。特別是,我想看看StrudStruts,Strutk,還有一些其他的源
    發(fā)表于 11-26 16:03

    是否知道量程選擇的原理呢?

    是否知道量程選擇的原理呢?
    發(fā)表于 04-29 06:16

    Linux下的線程安全是什么

    Linux下的線程安全原文結(jié)構(gòu)有點亂線程安全:多個執(zhí)行流對臨界資源進行爭搶訪問,而不會造成數(shù)據(jù)二義性和邏輯混亂,成這段代碼的過程是
    發(fā)表于 07-01 13:34

    什么是線程安全?如何去實現(xiàn)線程安全?

    什么是線程安全?如何去實現(xiàn)線程安全?互斥實現(xiàn)的技術(shù)是什么?有哪些注意事項?同步實現(xiàn)的技術(shù)是什么?其操作流程有哪些?
    發(fā)表于 07-23 09:57

    有沒有人知道rt-thread的dfs+uffs是否線程安全

    有沒有人知道,dfs+uffs是否線程安全?1、如A線程寫A文件,同時B線程讀B文件
    發(fā)表于 04-20 11:37

    A線程如何在線程本身識別變量是否改變

    阻塞獲取可以解決但是這個B線程是別人代碼寫的。不好修改不想再增加一個線程去循環(huán)讀取變量X是否改變,再釋放信號量需求A線程如何在
    發(fā)表于 11-02 11:02

    Python中最常用的幾種線程會用嗎

    多進程編程中的一個概念,在擁有共享數(shù)據(jù)的多條線程并行執(zhí)行的程序中,線程安全代碼會通過同步機制保證各個線程都可以正常且正確的執(zhí)行,不會出現(xiàn)數(shù)
    的頭像 發(fā)表于 10-11 16:07 ?1067次閱讀

    示波器的這些安全操作知道嗎?

    示波器的這些安全操作知道嗎?示波器維修。很多人都知道示波器是用來干什么的,也知道示波器都有哪些種類和品牌,當然也
    發(fā)表于 11-05 11:19 ?1622次閱讀

    什么是線程安全 如何實現(xiàn)線程安全代碼

    相信有很多同學在面對多線程代碼時都會望而生畏,認為多線程代碼就像一頭難以馴服的怪獸,制服不了這頭怪獸它就會反過來吞噬
    的頭像 發(fā)表于 05-17 12:45 ?1578次閱讀

    什么是線程線程池中線程實現(xiàn)復用的原理

    一般建議自定義線程工廠,構(gòu)建線程的時候設(shè)置線程的名稱,這樣就在查日志的時候就方便知道是哪個線程執(zhí)行的代碼
    發(fā)表于 01-29 13:44 ?1662次閱讀

    如何理解線程安全

    本次分享線程安全的基礎(chǔ)知識。
    的頭像 發(fā)表于 05-08 15:03 ?815次閱讀
    如何理解<b class='flag-5'>線程</b><b class='flag-5'>安全</b>?

    什么是線程安全?如何理解線程安全?

    在多線程編程中,線程安全是必須要考慮的因素。
    的頭像 發(fā)表于 05-30 14:33 ?1929次閱讀
    什么是<b class='flag-5'>線程</b><b class='flag-5'>安全</b>?如何理解<b class='flag-5'>線程</b><b class='flag-5'>安全</b>?

    線程安全怎么辦

    線程安全一直是多線程開發(fā)中需要注意的地方,可以說,并發(fā)安全保證了所有的數(shù)據(jù)都安全。 1 線程
    的頭像 發(fā)表于 10-10 15:00 ?317次閱讀
    <b class='flag-5'>線程</b><b class='flag-5'>安全</b>怎么辦

    redis多線程還能保證線程安全

    Redis是一種使用C語言編寫的高性能鍵值存儲系統(tǒng),它是單線程的,因為使用了多路復用的方式來處理并發(fā)請求。這樣的實現(xiàn)方式帶來了很好的性能,但同時也引發(fā)了一些線程安全方面的問題。 在Redis中,由于
    的頭像 發(fā)表于 12-05 10:28 ?1515次閱讀