0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

剖析鴻蒙的匯編語言和CPU指令

鴻蒙系統(tǒng)HarmonyOS ? 來源:my.oschina ? 作者:my.oschina ? 2021-04-24 09:37 ? 次閱讀

本篇通過拆解一段很簡單的匯編代碼來快速認識匯編,為讀懂鴻蒙匯編打基礎.系列篇后續(xù)將逐個剖析鴻蒙的匯編文件.

匯編很簡單

第一: 要認定匯編語言一定是簡單的,沒有高深的東西,無非就是數(shù)據的搬來搬去,運行時數(shù)據主要待在兩個地方:內存和寄存器。寄存器是CPU內部存儲器,離運算器最近,所以最快.

第二: 運行空間(??臻g)就是CPU打卡上班的地方,內核設計者規(guī)定誰請CPU上班由誰提供場地,用戶程序提供的場地叫用戶棧,敏感工作CPU要帶回公司做,公司提供的場地叫內核棧,敏感工作叫系統(tǒng)調用,系統(tǒng)調用的本質理解是CPU要切換工作模式即切換辦公場地。

第三:CPU的工作順序是流水線的,它只認指令,而且只去一個地方(指向代碼段的PC寄存器)拿指令運算消化。指令集是告訴外界我CPU能干什么活并提供對話指令,匯編語言是人和CPU能愉快溝通不擰巴的共識語言。一一對應了CPU指令,又能確保記性不好的人類能模塊化的設計idea, 先看一段C編譯成匯編代碼再來說模塊化。

square(c -> 匯編)

//編譯器: armv7-a clang (trunk)
//++++++++++++ square(c -> 匯編)++++++++++++++++++++++++
int square(int a,int b){
    return a*b;
}
square(int, int):
        sub     sp, sp, #8     @sp減去8,意思為給square分配??臻g,只用2個??臻g完成計算
        str     r0, [sp, #4]   @第一個參數(shù)入棧
        str     r1, [sp]       @第二個參數(shù)入棧
        ldr     r1, [sp, #4]   @取出第一個參數(shù)給r1
        ldr     r2, [sp]       @取出第二個參數(shù)給r2
        mul     r0, r1, r2     @執(zhí)行a*b給R0,返回值的工作一直是交給R0的
        add     sp, sp, #8     @函數(shù)執(zhí)行完了,要釋放申請的??臻g
        bx      lr             @子程序返回,等同于mov pc,lr,即跳到調用處

fp(c -> 匯編)

//++++++++++++ fp(c -> 匯編)++++++++++++++++++++++++
int fp(int b)
{
    int a = 1;
    return square(a+b,a+b);
}
fp(int):
        push    {r11, lr}      @r11(fp)/lr入棧,保存調用者main的位置
        mov     r11, sp        @r11用于保存sp值,函數(shù)棧開始位置 
        sub     sp, sp, #8     @sp減去8,意思為給fp分配??臻g,只用2個棧空間完成計算
        str     r0, [sp, #4]   @先保存參數(shù)值,放在SP+4,此時r0中存放的是參數(shù)
        mov     r0, #1         @r0=1
        str     r0, [sp]       @再把1也保存在SP的位置
        ldr     r0, [sp]       @把SP的值給R0
        ldr     r1, [sp, #4]   @把SP+4的值給R1
        add     r1, r0, r1     @執(zhí)行r1=a+b
        mov     r0, r1         @r0=r1,用r0,r1傳參
        bl      square(int, int)@先mov lr, pc 再mov pc square(int, int)   
        mov     sp, r11        @函數(shù)執(zhí)行完了,要釋放申請的??臻g 
        pop     {r11, lr}      @彈出r11和lr,lr是專用標簽,彈出就自動復制給lr寄存器
        bx      lr             @子程序返回,等同于mov pc,lr,即跳到調用處

main(c -> 匯編)

//++++++++++++ main(c -> 匯編)++++++++++++++++++++++++
int main()
{
    int sum = 0;
    for(int a = 0;a < 100; a++){
        sum = sum + fp(a);
    }
    return sum;
}
main:
        push    {r11, lr}      @r11(fp)/lr入棧,保存調用者的位置
        mov     r11, sp        @r11用于保存sp值,函數(shù)棧開始位置
        sub     sp, sp, #16    @sp減去16,意思為給main分配棧空間,只用4個??臻g完成計算
        mov     r0, #0         @初始化r0
        str     r0, [r11, #-4] @執(zhí)行sum = 0
        str     r0, [sp, #8]   @sum將始終占用SP+8的位置
        str     r0, [sp, #4]   @a將始終占用SP+4的位置
        b       .LBB1_1        @跳到循環(huán)開始位置
.LBB1_1:                       @循環(huán)開始位置入口
        ldr     r0, [sp, #4]   @取出a的值給r0
        cmp     r0, #99        @跟99比較
        bgt     .LBB1_4        @大于99,跳出循環(huán) mov pc .LBB1_4
        b       .LBB1_2        @繼續(xù)循環(huán),直接 mov pc .LBB1_2
.LBB1_2:                       @符合循環(huán)條件入口
        ldr     r0, [sp, #8]   @取出sum的值給r0,sp+8用于寫SUM的值
        str     r0, [sp]       @先保存SUM的值,SP的位置用于讀SUM值
        ldr     r0, [sp, #4]   @r0用于傳參,取出A的值給r0作為fp的參數(shù)
        bl      fp(int)        @先mov lr, pc再mov pc fp(int)
        mov     r1, r0         @fp的返回值為r0,保存到r1
        ldr     r0, [sp]       @取出SUM的值
        add     r0, r0, r1     @計算新sum的值,由R0保存
        str     r0, [sp, #8]   @將新sum保存到SP+8的位置
        b       .LBB1_3        @無條件跳轉,直接 mov pc .LBB1_3
.LBB1_3:                       @完成a++操作入口
        ldr     r0, [sp, #4]   @SP+4中記錄是a的值,賦給r0
        add     r0, r0, #1     @r0增加1
        str     r0, [sp, #4]   @把新的a值放回SP+4里去
        b       .LBB1_1        @跳轉到比較 a < 100 處
.LBB1_4:                       @循環(huán)結束入口
        ldr     r0, [sp, #8]   @最后SUM的結果給R0,返回值的工作一直是交給R0的
        mov     sp, r11        @函數(shù)執(zhí)行完了,要釋放申請的棧空間
        pop     {r11, lr}      @彈出r11和lr,lr是專用標簽,彈出就自動復制給lr寄存器
        bx      lr             @子程序返回,跳轉到lr處等同于 MOV PC, LR

代碼有點長,都加了注釋,如果能直接看懂那么恭喜你,鴻蒙內核的6個匯編文件基于也就懂了。這是以下C文件全貌

文件全貌

#include 
#include 

int square(int a,int b){
    return a*b;
}

int fp(int b)
{
    int a = 1;
    return square(a+b,a+b);
}

int main()
{
    int sum = 0;
    for(int a = 0;a < 100; a++){
        sum = sum + fp(a);
    }
    return sum;
}

代碼很簡單誰都能看懂,代碼很典型,具有代表性,有循環(huán),有判斷,有運算,有多級函數(shù)調用。編譯后的匯編代碼基本和C語言的結構差不太多, 區(qū)別是對循環(huán)的實現(xiàn)用了四個模塊,四個模塊也好理解: 一個是開始塊(LBB1_1), 一個符合條件的處理塊(LBB1_2),一個條件發(fā)生變化塊(LBB1_3),最后收尾塊(LBB1_4).

按塊逐一剖析.

先看最短的那個

int square(int a,int b){
    return a*b;
}
//編譯成
square(int, int):
        sub     sp, sp, #8     @sp減去8,意思為給square分配??臻g,只用2個??臻g完成計算
        str     r0, [sp, #4]   @第一個參數(shù)入棧
        str     r1, [sp]       @第二個參數(shù)入棧
        ldr     r1, [sp, #4]   @取出第一個參數(shù)給r1
        ldr     r2, [sp]       @取出第二個參數(shù)給r2
        mul     r0, r1, r2     @執(zhí)行a*b給R0,返回值的工作一直是交給R0的
        add     sp, sp, #8     @函數(shù)執(zhí)行完了,要釋放申請的棧空間
        bx      lr             @子程序返回,等同于mov pc,lr,即跳到調用處

首先上來一句 sub sp, sp, #8 等同于 sp = sp - 8 ,CPU運行需要場地,這個場地就是棧 ,SP是指向棧的指針,表示此時用棧的刻度. 代碼和鴻蒙內核用棧方式一樣,都采用了遞減滿棧的方式(FD). 什么是遞減滿棧? 遞減指的是棧底地址高于棧頂?shù)刂?棧的生長方向是遞減的, 滿棧指的是SP指針永遠指向棧頂. 每個函數(shù)都有自己獨立的棧底和棧頂,之間的空間統(tǒng)稱棧幀.可以理解為分配了一塊 區(qū)域給函數(shù)運行,sub sp, sp, #8 代表申請2個??臻g,一個??臻g按四個字節(jié)算. 用完要不要釋放?當然要,add sp, sp, #8 就是釋放棧空間. 是一對的,減了又加回去,空間就歸還了. ldr r1, [sp, #4] 的意思是取出SP+4這個虛擬地址的值給r1寄存器,而SP的指向并沒有改變的,還是在棧頂, 為什么要+呢, +就是往回數(shù), 定位到分配的??臻g上.
一定要理解遞減滿棧,這是關鍵! 否則讀不懂內核匯編代碼.

入參方式

一般都是通過寄存器(r0..r10)傳參,fp調用square之前會先將參數(shù)給(r0..r10)

        add     r1, r0, r1     @執(zhí)行r1=a+b
        mov     r0, r1         @r0=r1,用r0,r1傳參
        bl      square(int, int)@先mov lr, pc 再mov pc square(int, int) 

到了square中后,先讓 r0,r1入棧,目的是保存參數(shù)值, 因為 square中要用r0,r1 ,

        str     r0, [sp, #4]   @先入棧保存第一個參數(shù)
        str     r1, [sp]       @再入棧保存第二個參數(shù)
        ldr     r1, [sp, #4]   @再取出第一個參數(shù)給r1,(a*b)中a值
        ldr     r2, [sp]       @再取出第二個參數(shù)給r2,用于計算 (a*b)中b值

是不是感覺這段匯編很傻,直接不保存計算不就完了嗎,這個是流程問題,編譯器統(tǒng)一先保存參數(shù),至于你想怎么用它不管,也管不了. 另外返回值都是默認統(tǒng)一給r0保存. square中將(a*b)的結果給了r0,回到fp中取出R0對fp來說這就是square的返回值,這是規(guī)定.

函數(shù)調用main 和 fp 中都需要調用其他函數(shù),所以都出現(xiàn)了

        push    {r11, lr}
        //....
        pop     {r11, lr}

這哥倆也是成對出現(xiàn)的,這是函數(shù)調用的必備裝備,作用是保存和恢復調用者的現(xiàn)場,例如 main -> fp, fp要保存main的棧幀范圍和指令位置, lr保存的是main函數(shù)執(zhí)行到哪個指令的位置, r11的作用是指向main的棧頂位置,如此fp執(zhí)行完后return回main的時候,先mov pc,lr, PC寄存器的值一變, 表示執(zhí)行的代碼就變了,又回到了main的指令和棧幀繼續(xù)未完成的事業(yè).

內存和寄存器數(shù)據怎么搬?

數(shù)據主要待在兩個地方:內存和寄存器. 寄存器<->寄存器 , 內存<->寄存器 , 內存<->內存 搬運指令都不一樣.

        str     r1, [sp]       @ 寄存器->內存
        ldr     r1, [sp, #4]   @ 內存->寄存器

這又是一對,用于 內存<->寄存器之間,熟知的 mov r0, r1 用于 寄存器<->寄存器

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 寄存器
    +關注

    關注

    31

    文章

    5271

    瀏覽量

    119648
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10772

    瀏覽量

    210438
  • 鴻蒙系統(tǒng)

    關注

    183

    文章

    2632

    瀏覽量

    66048
收藏 人收藏

    評論

    相關推薦

    【RISC-V開放架構設計之道|閱讀體驗】匯編語言和擴展指令

    【RISC-V開放架構設計之道|閱讀體驗】匯編語言和擴展指令匯編語言 將C語言翻譯成可執(zhí)行的機器語言的重要步驟包括編譯過程,
    發(fā)表于 02-03 13:29

    請問匯編語言和C語言哪個好用些

    匯編語言和C語言哪個好用一點
    發(fā)表于 04-23 07:55

    C語言和匯編語言在開發(fā)單片機時各有哪些優(yōu)缺點

    01、C語言和匯編語言在開發(fā)單片機時各有哪些優(yōu)缺點?匯編語言是一種用文字助記符來表示機器指令的符號語言,是最接近機器碼的一種
    發(fā)表于 07-14 06:49

    C語言和匯編語言的優(yōu)缺點是什么?

    什么是c語言?什么是匯編語言?C語言和匯編語言的優(yōu)缺點是什么?
    發(fā)表于 10-14 08:48

    MSP430單片機C語言和匯編語言混合編程

    為了發(fā)揮C語言和匯編語言各自的優(yōu)點,二者需要相互調用函數(shù)。本文首先介紹了MSP430單片機的C語言函數(shù)的參數(shù)傳遞規(guī)則,然后對C語言和匯編語言
    發(fā)表于 08-31 10:55 ?50次下載

    MDP430單片機語言和匯編語言混合編程

    摘要:為了發(fā)揮C語言和匯編語言各自的優(yōu)點二者需要相互調用函數(shù)本文首先介紹了"MSP430”單片機的!語言函數(shù)的參數(shù)傳遞規(guī)則然后對C語言和匯編語言
    發(fā)表于 07-15 12:02 ?46次下載

    16位和32位微處理器指令系統(tǒng)與匯編語言編程

    16位和32位微處理器指令系統(tǒng)與匯編語言編程, 本章學習要點 8086CPu指令系統(tǒng)的尋址方式 8086CPU
    發(fā)表于 12-31 10:41 ?0次下載

    C語言和匯編語言混合編程方法和C語言中斷處理方法

    C語言和匯編語言混合編程方法和C語言中斷處理方法,new
    發(fā)表于 01-06 14:36 ?36次下載

    基于MSP430單片機C語言和匯編語言混合編程

    基于MSP430單片機C語言和匯編語言混合編程
    發(fā)表于 10-12 17:05 ?18次下載
    基于MSP430單片機C<b class='flag-5'>語言和</b><b class='flag-5'>匯編語言</b>混合編程

    MSP430單片機的C語言和匯編語言混合編程

    MSP430單片機的C語言和匯編語言混合編程
    發(fā)表于 10-13 08:35 ?24次下載
    MSP430單片機的C<b class='flag-5'>語言和</b><b class='flag-5'>匯編語言</b>混合編程

    匯編語言指令

    匯編語言指令
    發(fā)表于 10-24 08:45 ?24次下載
    <b class='flag-5'>匯編語言</b>的<b class='flag-5'>指令</b>集

    高級語言和匯編語言_機器語言的區(qū)別

    本文首先介紹了高級語言的優(yōu)缺點、匯編語言的優(yōu)缺點及使用匯編語言的理由,其次介紹了機器語言的優(yōu)缺點,最后闡述了高級語言和
    的頭像 發(fā)表于 04-16 10:28 ?3w次閱讀

    C語言和匯編語言在開發(fā)單片機時各有哪些優(yōu)缺點?

    匯編語言是一種用文字助記符來表示機器指令的符號語言,是最接近機器碼的一種語言。其主要優(yōu)點是占用資源少、程序執(zhí)行效率高。但是不同的CPU, 其
    的頭像 發(fā)表于 11-26 14:21 ?9799次閱讀

    單片機C語言和匯編語言混合編程實例詳解

    單片機C語言和匯編語言混合編程實例詳解
    發(fā)表于 08-16 09:50 ?225次下載

    單片機匯編語言的結構/數(shù)據類型/匯編指令

    開發(fā)匯編語言是為了為機器級代碼指令提供助記符或符號,匯編語言程序由助記符組成,因此應將它們翻譯成機器代碼。負責這種轉換的程序稱為匯編程序。匯編語言
    的頭像 發(fā)表于 07-07 12:28 ?2755次閱讀