0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

C語言中Linux字節(jié)對齊的問題

multisim ? 來源: 一口Linux ? 作者:土豆居士 ? 2021-08-16 11:25 ? 次閱讀

最近作者在做一個項目,遇到一個問題,運行于ARM上的threadx在與DSP通信采用消息隊列的方式傳遞消息(最終實現(xiàn)原理是中斷+共享內(nèi)存的方式),在實際操作過程中發(fā)現(xiàn)threadx總是crash,于是經(jīng)過排查,是因為傳遞消息的結(jié)構(gòu)體沒有考慮字節(jié)對齊的問題。

隨手整理一下C語言中字節(jié)對齊的問題與大家一起分享。

一、概念

對齊跟數(shù)據(jù)在內(nèi)存中的位置有關(guān)。如果一個變量的內(nèi)存地址正好位于它長度的整數(shù)倍,他就被稱做自然對齊。比如在32位cpu下,假設(shè)一個整型變量的地址為0x00000004,那它就是自然對齊的。

首先了解什么位、字節(jié)、字

bit 1個二進(jìn)制位稱為1個bit
字節(jié) Byte 8個二進(jìn)制位稱為1個Byte
word 電腦用來一次性處理事務(wù)的一個固定長度
名稱 英文名 含義

字長

一個字的位數(shù),現(xiàn)代電腦的字長通常為16,32, 64位。(一般N位系統(tǒng)的字長是N/8字節(jié)。)

不同的CPU一次可以處理的數(shù)據(jù)位數(shù)是不同的,32位CPU可以一次處理32位數(shù)據(jù),64位CPU可以一次處理64位數(shù)據(jù),這里的位,指的就是字長。

而所謂的字長,我們有時會稱為字(word)。在16位的CPU中,一個字剛好為兩個字節(jié),而32位CPU中,一個字是四個字節(jié)。若以字為單位,向上還有雙字(兩個字),四字(四個字)。

二、對齊規(guī)則

對于標(biāo)準(zhǔn)數(shù)據(jù)類型,它的地址只要是它的長度的整數(shù)倍就行了,而非標(biāo)準(zhǔn)數(shù)據(jù)類型按下面的原則對齊:數(shù)組 :按照基本數(shù)據(jù)類型對齊,第一個對齊了后面的自然也就對齊了。聯(lián)合 :按其包含的長度最大的數(shù)據(jù)類型對齊。結(jié)構(gòu)體:結(jié)構(gòu)體中每個數(shù)據(jù)類型都要對齊。

三、如何限制定字節(jié)對齊位數(shù)?

1. 缺省

在缺省情況下,C編譯器為每一個變量或是數(shù)據(jù)單元按其自然對界條件分配空間。一般地,可以通過下面的方法來改變?nèi)笔〉膶鐥l件:

2. #pragma pack(n)

· 使用偽指令#pragma pack (n),C編譯器將按照n個字節(jié)對齊?!?使用偽指令#pragma pack (),取消自定義字節(jié)對齊方式。

#pragma pack(n) 用來設(shè)定變量以n字節(jié)對齊方式。n字節(jié)對齊就是說變量存放的起始地址的偏移量有兩種情況:

如果n大于等于該變量所占用的字節(jié)數(shù),那么偏移量必須滿足默認(rèn)的對齊方式

如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對齊方式。

結(jié)構(gòu)的總大小也有一個約束條件,如果n大于等于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);否則必須是n的倍數(shù)。

3. __attribute

另外,還有如下的一種方式:· __attribute((aligned (n))),讓所作用的結(jié)構(gòu)成員對齊在n字節(jié)自然邊界上。如果結(jié)構(gòu)中有成員的長度大于n,則按照最大成員的長度來對齊。·attribute((packed)),取消結(jié)構(gòu)在編譯過程中的優(yōu)化對齊,按照實際占用字節(jié)數(shù)進(jìn)行對齊。

3. 匯編.align

匯編代碼通常用.align來制定字節(jié)對齊的位數(shù)。

.align:用來指定數(shù)據(jù)的對齊方式,格式如下:

.align[absexpr1,absexpr2]

以某種對齊方式,在未使用的存儲區(qū)域填充值. 第一個值表示對齊方式,4, 8,16或 32. 第二個表達(dá)式值表示填充的值。

四、為什么要對齊?

操作系統(tǒng)并非一個字節(jié)一個字節(jié)訪問內(nèi)存,而是按2,4,8這樣的字長來訪問。因此,當(dāng)CPU從存儲器讀數(shù)據(jù)到寄存器,IO的數(shù)據(jù)長度通常是字長。如32位系統(tǒng)訪問粒度是4字節(jié)(bytes), 64位系統(tǒng)的是8字節(jié)。當(dāng)被訪問的數(shù)據(jù)長度為n字節(jié)且該數(shù)據(jù)地址為n字節(jié)對齊時,那么操作系統(tǒng)就可以高效地一次定位到數(shù)據(jù),無需多次讀取,處理對齊運算等額外操作。數(shù)據(jù)結(jié)構(gòu)應(yīng)該盡可能地在自然邊界上對齊。如果訪問未對齊的內(nèi)存,CPU需要做兩次內(nèi)存訪問。

字節(jié)對齊可能帶來的隱患:

代碼中關(guān)于對齊的隱患,很多是隱式的。比如在強(qiáng)制類型轉(zhuǎn)換的時候。例如:

unsignedinti=0x12345678; unsignedchar*p=NULL; unsignedshort*p1=NULL; p=&i; *p=0x00; p1=(unsignedshort*)(p+1); *p1=0x0000;

最后兩句代碼,從奇數(shù)邊界去訪問unsignedshort型變量,顯然不符合對齊的規(guī)定。在x86上,類似的操作只會影響效率,但是在MIPS或者sparc上,可能就是一個error,因為它們要求必須字節(jié)對齊.

五、舉例

例1:os基本數(shù)據(jù)類型占用的字節(jié)數(shù)

首先查看操作系統(tǒng)的位數(shù)

在64位操作系統(tǒng)下查看基本數(shù)據(jù)類型占用的字節(jié)數(shù):

#include intmain() { printf("sizeof(char)=%ld ",sizeof(char)); printf("sizeof(int)=%ld ",sizeof(int)); printf("sizeof(float)=%ld ",sizeof(float)); printf("sizeof(long)=%ld ",sizeof(long)); printf("sizeof(longlong)=%ld ",sizeof(longlong)); printf("sizeof(double)=%ld ",sizeof(double)); return0; }

例2:結(jié)構(gòu)體占用的內(nèi)存大小--默認(rèn)規(guī)則

考慮下面的結(jié)構(gòu)體占用的位數(shù)

structyikou_s { doubled; charc; inti; }yikou_t;

執(zhí)行結(jié)果

sizeof(yikou_t)=16

在內(nèi)容中各變量位置關(guān)系如下:

9e6db748-fdb8-11eb-9bcf-12bb97331649.png

其中成員C的位置還受字節(jié)序的影響,有的可能在位置8

編譯器給我們進(jìn)行了內(nèi)存對齊,各成員變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量必須為該變量類型所占用的字節(jié)數(shù)的倍數(shù), 且結(jié)構(gòu)的大小為該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)的倍數(shù)。

對于偏移量:變量type n起始地址相對于結(jié)構(gòu)體起始地址的偏移量必須為sizeof(type(n))的倍數(shù)結(jié)構(gòu)體大?。罕仨殲槌蓡T最大類型字節(jié)的倍數(shù)

char:偏移量必須為sizeof(char)即1的倍數(shù) int:偏移量必須為sizeof(int)即4的倍數(shù) float:偏移量必須為sizeof(float)即4的倍數(shù) double:偏移量必須為sizeof(double)即8的倍數(shù)

例3:調(diào)整結(jié)構(gòu)體大小

我們將結(jié)構(gòu)體中變量的位置做以下調(diào)整:

structyikou_s { charc; doubled; inti; }yikou_t;

執(zhí)行結(jié)果

sizeof(yikou_t)=24

各變量在內(nèi)存中布局如下:

9eb0590e-fdb8-11eb-9bcf-12bb97331649.png

當(dāng)結(jié)構(gòu)體中有嵌套符合成員時,復(fù)合成員相對于結(jié)構(gòu)體首地址偏移量是復(fù)合成員最寬基本類型大小的整數(shù)倍。

例4:#pragma pack(4)

#pragmapack(4) structyikou_s { charc; doubled; inti; }yikou_t;sizeof(yikou_t)=16

例5:#pragma pack(8)

#pragmapack(8) structyikou_s { charc; doubled; inti; }yikou_t;sizeof(yikou_t)=24

例6:匯編代碼

舉例:以下是截取的uboot代碼中異常向量irq、fiq的入口位置代碼:

9f00b354-fdb8-11eb-9bcf-12bb97331649.png

六、匯總實力

有手懶的同學(xué),直接貼一個完整的例子給你們:

#include main() { structA{ inta; charb; shortc; }; structB{ charb; inta; shortc; }; structAA{ //inta; charb; shortc; }; structBB{ charb; //inta; shortc; }; #pragmapack(2)/*指定按2字節(jié)對齊*/ structC{ charb; inta; shortc; }; #pragmapack()/*取消指定對齊,恢復(fù)缺省對齊*/ #pragmapack(1)/*指定按1字節(jié)對齊*/ structD{ charb; inta; shortc; }; #pragmapack()/*取消指定對齊,恢復(fù)缺省對齊*/ ints1=sizeof(structA); ints2=sizeof(structAA); ints3=sizeof(structB); ints4=sizeof(structBB); ints5=sizeof(structC); ints6=sizeof(structD); printf("%d ",s1); printf("%d ",s2); printf("%d ",s3); printf("%d ",s4); printf("%d ",s5); printf("%d ",s6); } ------------END------------

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11172

    瀏覽量

    208484
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7581

    瀏覽量

    135594
  • 字節(jié)
    +關(guān)注

    關(guān)注

    0

    文章

    39

    瀏覽量

    13683

原文標(biāo)題:Linux字節(jié)對齊的那些事

文章出處:【微信號:A1411464185,微信公眾號:multisim】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    C語言中的typedef的應(yīng)用

    C 語言提供了 typedef 關(guān)鍵字,您可以使用它來為類型取一個新的名字。下面的實例為單字節(jié)數(shù)字定義了一個術(shù)語 BYTE。
    發(fā)表于 03-06 11:34 ?303次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言中</b>的typedef的應(yīng)用

    如何解決C語言中的“訪問權(quán)限沖突”異常?C語言引發(fā)異常原因分析

    如何解決C語言中的“訪問權(quán)限沖突”異常?C語言引發(fā)異常原因分析? 在C語言中,訪問權(quán)限沖突異常通
    的頭像 發(fā)表于 01-12 16:03 ?4126次閱讀

    C語言中結(jié)構(gòu)體能不能相加

    C語言中,結(jié)構(gòu)體能不能相加?
    的頭像 發(fā)表于 12-19 17:04 ?1144次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言中</b>結(jié)構(gòu)體能不能相加

    c語言中邏輯真等價于什么

    C語言中,邏輯真等價于1。邏輯真可以理解為一個表達(dá)式、語句或條件的結(jié)果為真,即滿足條件。在計算機(jī)科學(xué)和編程中,邏輯真在控制流語句、循環(huán)和條件語句中具有重要的作用。 邏輯真等價于條件為真的情況。在C
    的頭像 發(fā)表于 11-30 14:10 ?1805次閱讀

    c語言中數(shù)據(jù)溢出是歸0還是歸1

    C語言中,數(shù)據(jù)溢出通常不會自動歸0或歸1,而是發(fā)生未定義行為。這是因為C語言中的數(shù)據(jù)類型都有一定范圍,超出該范圍的值會導(dǎo)致數(shù)據(jù)溢出。數(shù)據(jù)溢出意味著存儲在變量中的值超過了變量所能容納的
    的頭像 發(fā)表于 11-30 11:47 ?2324次閱讀

    c語言中decimal的含義

    C語言中的“decimal”是一種數(shù)據(jù)類型,用于表示十進(jìn)制數(shù)字。在C語言中,常用的數(shù)據(jù)類型有整數(shù)類型(int)、浮點類型(float和double)、字符類型(char)等,而deci
    的頭像 發(fā)表于 11-30 10:57 ?2111次閱讀

    c語言中數(shù)組怎么定義

    C語言中,數(shù)組是一種用來存儲相同類型元素的數(shù)據(jù)結(jié)構(gòu)。它可以存儲多個元素,并通過一個共同的名稱來引用這些元素。數(shù)組是一種很重要的數(shù)據(jù)結(jié)構(gòu),可以用于解決很多實際的問題。 在C語言中,定義數(shù)
    的頭像 發(fā)表于 11-24 10:11 ?2579次閱讀

    \0在c語言中怎么用

    是由貝爾實驗室的Dennis Ritchie為了開發(fā)UNIX操作系統(tǒng)而設(shè)計的。它在20世紀(jì)70年代初首次出現(xiàn),并迅速流行起來。C語言以其簡潔、高效、低級別的特性成為了廣泛使用的編程語言。 二、基本語法 注釋 在
    的頭像 發(fā)表于 11-24 09:59 ?2898次閱讀

    scanf在C語言中的作用

    scanf在C語言中的作用? scanf是C語言中的輸入函數(shù),用于從標(biāo)準(zhǔn)輸入設(shè)備(如鍵盤)讀取數(shù)據(jù),并將其存儲到變量中。它是C
    的頭像 發(fā)表于 11-23 14:13 ?1153次閱讀

    c語言中順序結(jié)構(gòu)的基本流程

    的語句組成,這些語句用于完成特定的任務(wù)或操作。在C語言中,每個語句都以分號結(jié)束,多個語句可以用大括號括起來形成一個語句塊。在順序結(jié)構(gòu)中,每個語句都依次執(zhí)行,按照代碼的順序執(zhí)行,然后才會執(zhí)行下一條語句。 首先,我們
    的頭像 發(fā)表于 11-22 10:20 ?869次閱讀

    C語言中如何實現(xiàn)注釋

    C語言中,注釋是用來增加代碼可讀性和注釋過程和功能的文本。C語言中支持兩種類型的注釋:單行注釋和多行注釋。 單行注釋以雙斜杠(//)開始,直到該行結(jié)束。該注釋語句可以在代碼的任何位置
    的頭像 發(fā)表于 11-22 10:17 ?1117次閱讀

    什么是結(jié)構(gòu)體的字節(jié)對齊現(xiàn)象

    什么是結(jié)構(gòu)體的字節(jié)對齊現(xiàn)象 程序員,咱都用代碼說話,先上 code: (說明:以下代碼均在 ARM 平臺上,使用 Keil 進(jìn)行編譯測試) # define offset_of (TYPE
    的頭像 發(fā)表于 11-20 15:55 ?529次閱讀
    什么是結(jié)構(gòu)體的<b class='flag-5'>字節(jié)</b><b class='flag-5'>對齊</b>現(xiàn)象

    編程語言中一個奇怪的代碼結(jié)構(gòu)

    C語言C++等編程語言中,我們常常會遇到一個奇怪的代碼結(jié)構(gòu)。
    發(fā)表于 11-01 10:24 ?352次閱讀
    編程<b class='flag-5'>語言中</b>一個奇怪的代碼結(jié)構(gòu)

    C語言中數(shù)字怎么轉(zhuǎn)成指針?

    C語言中數(shù)字怎么轉(zhuǎn)成指針,比如我要去內(nèi)存地址為0x100的內(nèi)容,用一句話表達(dá),不如uchar a=?我要問號等于0x100地址的內(nèi)容
    發(fā)表于 10-31 06:29

    C語言中ASCII代碼是什么意思?

    C語言中ASCII代碼是什么意思常見的ASCII代碼都需要記嗎
    發(fā)表于 10-25 07:10