0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

系統(tǒng)調用具體是如何實現(xiàn)的

Linux閱碼場 ? 來源:Rand ? 作者:Rand ? 2021-09-29 11:10 ? 次閱讀

系統(tǒng)調用就是調用操作系統(tǒng)提供的一系列內核功能函數,因為內核總是對用戶程序持不信任的態(tài)度,一些核心功能不能直接交由用戶程序來實現(xiàn)執(zhí)行。用戶程序只能發(fā)出請求,然后內核調用相應的內核函數來幫著處理,將結果返回給應用程序。如此才能保證系統(tǒng)的穩(wěn)定和安全。本文采用 的實例來講解系統(tǒng)調用具體是如何實現(xiàn)的。

系統(tǒng)調用是給用戶態(tài)下的程序使用的,但是用戶程序并不直接使用系統(tǒng)調用,而是系統(tǒng)調用在用戶態(tài)下的接口。這個用戶接口就是操作系統(tǒng)提供的系統(tǒng)調用 ,一般遵循 標準。

的系統(tǒng)調用是用 INT n 指令實現(xiàn)的,INT n 的作用就是觸發(fā)一個 號中斷,中斷的過程應該很熟悉了吧,不熟悉的可以看看前文:多處理器下的中斷機制。 里面系統(tǒng)調用使用的向量號是 , 里面使用的 (不同 版本可能不同)。只要這個向量號 不是一些異常使用的,一些保留的和一些外設默認使用的,用多少來表示系統(tǒng)調用其實無傷大雅, 要用 ,那就 好了。

上述說的用戶接口就會執(zhí)行 INT 64 觸發(fā)一個 號中斷,這里 做了簡化,按照以前版本的 ,用戶接口是調用一個宏定義 ,這個宏再來執(zhí)行 INT 指令觸發(fā)中斷。關于這部分可以看看前文:捋一捋系統(tǒng)調用

執(zhí)行 INT 64 之后, 會根據向量號 去 中索引第 個門描述符(從 0 計數),這個門描述符中存放的有系統(tǒng)調用程序的偏移量和段選擇子,再根據段選擇子去 中索引段描述符,段描述符中記錄的有段基址,與門描述符中記錄的偏移量相加就是系統(tǒng)調用程序的地址。拿到系統(tǒng)調用程序的地址,就可以執(zhí)行程序做相應的處理了。

可是系統(tǒng)調用是有很多的,雖然 中實現(xiàn)的系統(tǒng)調用沒多少,沒多少也還是有那么一些的,怎么區(qū)別它們呢?這就涉及了系統(tǒng)調用號概念,每一個系統(tǒng)調用都唯一分配了一個整數來標識,比如說 里面 系統(tǒng)調用的調用號就為 1。INT 64,表示觸發(fā)一個中斷向量號為 64 的中斷,而這個中斷表示系統(tǒng)調用,并沒有具體說是哪一個系統(tǒng)調用,所以還需要一個系統(tǒng)調用號來表示具體的系統(tǒng)調用。

系統(tǒng)調用通俗的講就是是用戶態(tài)下的程序托內核辦事,既然是托人辦事那得告訴人家你要辦什么事對吧。這個告訴人家具體要辦什么事就是要給內核傳遞系統(tǒng)調用號,問題是怎么傳呢?通常的做法就是將這個系統(tǒng)調用號放進 寄存器,當執(zhí)行到系統(tǒng)調用入口程序的時候就會根據 eax 的值去調用具體的系統(tǒng)調用程序,比如說 中存放的是 1 那么就會去調用 這個系統(tǒng)調用的相關函數。這個系統(tǒng)調用的入口程序可以理解為在第 個門描述符中記錄的程序,因為肯定是要先根據向量號拿到總的中斷服務程序(在這兒就是總的系統(tǒng)調用程序),然后再根據 的值去調用的具體的內核功能函數。

上面只是說的一般的大致情況,如果看過前文多處理器下的中斷機制應該知道, 對所有中斷(包括系統(tǒng)調用)的處理是先執(zhí)行共同的中斷入口程序,主要就是保護現(xiàn)場壓棧寄存器,然后根據向量號的不同執(zhí)行不同的中斷處理程序。在這里就是執(zhí)行系統(tǒng)調用入口程序,然后再根據 的值調用具體的內核功能函數。

這個具體的內核功能函數咱們就不討論了,內核中的表現(xiàn)形式就是一個個不同的函數,咱們這兒只討論兩件事:

一是參數,有些系統(tǒng)調用的是需要參數的,用戶接口不真正干活,真正干活的是內核功能函數,但是需要的參數在用戶態(tài)下,所以需要在用戶接口部分向內核傳遞參數。傳參有兩種方法:

直接傳給寄存器,寄存器是通用的,在用戶態(tài)將值傳給寄存器,進入內核態(tài)之后就可以直接使用,這可以使用內聯(lián)匯編來實現(xiàn)。

壓棧,壓棧有個問題,系統(tǒng)調用使用中斷/陷阱來實現(xiàn),這期間會換棧,在用戶態(tài)下壓棧的參數對內核來說似乎沒什么用處。所以要想使用用戶態(tài)下棧中的參數,必須要獲得用戶棧的地址,這個值在哪呢?沒錯,在內核棧中的上下文保存著,從內核棧中取出用戶棧的棧頂 值,就可以取到系統(tǒng)調用的參數了, 就是這樣實現(xiàn)的。

二是返回值,函數的調用約定中規(guī)定了返回值應該放在 寄存器里面。而在系統(tǒng)調用的一開始我們將系統(tǒng)調用號傳進了 寄存器,然后中斷時保存上下文,將 壓入內核棧,系統(tǒng)調用處理程序將最后結果放到 寄存器中。下面注意了,如果不對上下文中的 作修改的話,中斷退出的時候恢復上下文彈出 ,彈出的值是啥?是系統(tǒng)調用號,也就是說將結果放到 寄存器中放了個寂寞,所以肯定會有一個步驟修改上下文中 為結果這么一個步驟,這樣回到用戶態(tài)的時候這個結果才會在 寄存器中。

上述差不多將系統(tǒng)調用的一些理論知識說完了,下面用 的實例來看看系統(tǒng)調用具體如何實現(xiàn)的。

首先便是用戶接口部分,用戶接口是操作系統(tǒng)提供的系統(tǒng)調用 函數,一般是 標準, 關于這用戶接口定義在 中,來隨便看兩個:

int fork(void);

int write(int, const void*, int);

這只是對函數原型的聲明。具體做了什么事呢?這個定義在 中:

#include “syscall.h”

#include “traps.h”

#define SYSCALL(name)

.globl name;

name:

movl $SYS_ ## name, %eax;

int $T_SYSCALL;

ret

SYSCALL(fork)

SYSCALL(write)

SYSCALL(getpid)

這是用匯編來寫的,而且使用了宏定義,我們來仔細閱讀一下這段代碼

.global name 聲明了一個全局可見的名字,可以是變量也可以是函數名,這里就與用戶接口的函數名。函數名就相當于一個地址,name: 后面的代碼就是這個函數具體要做的事,就像 c 語言編寫函數時的函數體,只不過這里是用匯編寫的而已。

所以這個函數做了什么事?應該一目了然啊,就三條指令:

movl $SYS_ ## name, %eax 將系統(tǒng)調用號傳到寄存器

int $T_SYSCALL 觸發(fā) 號中斷

ret 函數返回

這里還使用了一些宏定義,首先是系統(tǒng)調用號,定義在 當中,隨便看幾個意思一下:

#define SYS_fork 1#define SYS_getpid 11#define SYS_write 16

這個號就是自定義的,能夠將每個系統(tǒng)調用唯一區(qū)分開就好。

上面的宏定義中還涉及了 # 的用法,# 一般有兩種用法:

#define STR(x) #x#define CAT(x, y) x##y

一個 # 表示字符串化,如果 為 abc,則結果為 “abc”

兩個 ## 表示連接符,如果 為 ab, 為 cd,則結果為 abcd

所以上述 SYS_ ## name,如果 為 ,那么結果就是 SYS_fork,表示 的系統(tǒng)調用號。

代表的系統(tǒng)調用的向量號, 版本不同,這個數可能不同,我這兒是 ,所以 int $T_SYSCALL 相當于觸發(fā)了一個 號中斷。

接著就應該是中斷的處理過程,這一塊在前文多處理器下的中斷機制已經講述的很詳細了,而且還有過程圖,本文就不再贅述。本文重點講述執(zhí)行了通用的中斷入口程序之后如何執(zhí)行系統(tǒng)調用分支的,如何獲取用戶棧的參數,如何修改上下文中的 使其返回正確的結果。

問題很多,咱們一個一個來解決,首先從 IDT, GDT 中獲取到中斷入口程序的地址之后,執(zhí)行中斷入口程序壓棧寄存器來保存上下文,這個上下文中包括了向量號。

保存了上下文之后跳到 這個總的中斷處理程序,這個程序中會根據向量號不同去執(zhí)行不同的中斷處理程序,如果向量號表示的是系統(tǒng)調用的話,就會進行如下操作:

void trap(struct trapframe *tf

{

if(tf-》trapno == T_SYSCALL){ //如果向量號表示的是系統(tǒng)調用

if(myproc()-》killed

exit();

myproc()-》tf = tf; //當前進程的中斷棧幀

syscall(); //執(zhí)行系統(tǒng)調用入口程序

if(myproc()-》killed)

exit();

return;

}

/*******略略略略********/

}

可以看到,如果中斷棧幀中的向量號表示的是系統(tǒng)調用號的話,就會去執(zhí)行系統(tǒng)調用入口程序。

這個系統(tǒng)調用入口程序定義在 里面:

void syscall(void)

{

int num;

struct proc *curproc = myproc(); //獲取當前進程的PCB

num = curproc-》tf-》eax; //獲取系統(tǒng)調用號

if(num 》 0 && num 《 NELEM(syscalls) && syscalls[num]) {

curproc-》tf-》eax = syscalls[num](); //調用相應的系統(tǒng)調用處理函數,返回值賦給eax

} else {

cprintf(“%d %s: unknown sys call %d

”,

curproc-》pid, curproc-》name, num);

curproc-》tf-》eax = -1;

}

}

這個系統(tǒng)調用的入口函數的作用就是根據中斷棧幀中的系統(tǒng)調用號去調用相應的內核功能函數,然后將返回值再填寫到棧幀中的 處。

這個流程整個邏輯應該是很清晰的,主要注意一點,調用內核功能函數的方式:syscalls[num]() , 是系統(tǒng)調用號, 看形式應該是個數組,從這里其實應該就能猜出來了, 將所有具體的系統(tǒng)調用處理函數地址按照系統(tǒng)調用號的順序集合成了一個數組。事實也的確如此,同樣的來隨便看幾個:

extern int sys_fork(void);

extern int sys_getpid(void);

extern int sys_write(void);

static int (*syscalls[])(void) = {

[SYS_fork] sys_fork,

/**********************/

[SYS_getpid] sys_getpid,

/**********************/

[SYS_write] sys_write,

/***********************/

}

extern int sys_fork(void); 表示具體的 這個內核的功能函數,這個函數才是真正干事的,它在外面定義,所以用了 ,至于具體這個函數干了什么事,在本文不重要,本文主要事了解系統(tǒng)調用這個流程,后面講述進程的時候再具體講述這個函數,或者前面寫過一篇關于 的文章:使用分身術變身術創(chuàng)建新進程

接下來是定義了一個函數指針數組,就是將上述函數地址填到數組相應的位置上。[SYS_fork] sys_fork 這種填充數組元素的方式似乎不太常見,但在這里就非常實用,表示將 這個函數的地址填寫到索引為 的位置上去。

關于系統(tǒng)調用還剩下最后一個問題,根據上述內核中具體的系統(tǒng)調用函數原型可以看出,它們的返回類型都是 型且沒有參數,但是有些系統(tǒng)調用是需要參數的,所以那些需要參數的系統(tǒng)調用就要去獲取參數,去哪獲取呢?是的,去用戶棧獲取參數,因為 沒有使用寄存器來傳參,而是將參數直接壓入用戶棧里面的。

回到系統(tǒng)調用的開頭,何時將參數壓棧的,參數是為被調用函數準備的,所以調用函數之前一定會將參數壓棧。這個被調用函數就是用戶接口,舉個例子如果調用 ,則在這之前一定會將參數 按照這個順序壓棧,再 調用函數,只是在 語言中這個過程可能看起來不是那么真切,如果是用匯編來寫,或者查看編譯之后的程序,會有下面的大致過程:

push size

push buf

push fd

call write

在 call wirte 之后又會將下條指令地址壓棧當作放回地址, (用戶接口) 又做了三件事,傳系統(tǒng)調用號,int T_SYSCALL, ret 返回。int T_SYSCALL 之后換棧,用戶棧棧頂 保存在上下文中的 處。

捋清楚這個關系之后就知道怎么去拿參數了,直接去中斷棧幀中獲取用戶棧棧頂值 ,再根據參數返回地址的位置關系獲取一個個參數,來看 中有關獲取參數的幾個函數:

int argint(int n, int *ip) //獲取系統(tǒng)調用的第n個int型的參數,存到ip這個位置

{

return fetchint((myproc()-》tf-》esp) + 4 + 4*n, ip); //原棧中獲取n個int型參數,加4是跳過

}

int fetchint(uint addr, int *ip)

{

struct proc *curproc = myproc();

if(addr 》= curproc-》sz || addr+4 》 curproc-》sz)

return -1;

*ip = *(int*)(addr);

return 0;

}

這是獲取一個 t 型的參數,(myproc()-》tf-》esp) + 4 + 4*n 表示第 個參數( 型) 的位置,多加了一個 是因為要跳過返回地址 字節(jié)。然后調用 ) 去取參數,核心語句就一句:*ip = *(int*)(addr); 將這個地址轉化為 型再解引用放在地址 上,說著有些繞口,自己看一下應該還是很好明白的。至于這個函數中關于進程部分的一些條件檢查,現(xiàn)下可以不予理會。

int argptr(int n, char **pp, int size)

{

int i;

struct proc *curproc = myproc();

if(argint(n, &i) 《 0)

return -1;

if(size 《 0 || (uint)i 》= curproc-》sz || (uint)i+size 》 curproc-》sz)

return -1;

*pp = (char*)i;

return 0;

}

這個函數用來獲取一個指針,指針就是地址,地址就是一個 位無符號數,所以調用前面的 來獲取這個數存到 中,這個 本身其實是個地址值,所以將其轉化 類型,然后賦值給 。

注意這里使用的是二級指針,為什么要使用二級指針,我們來看看如果使用一級指針會發(fā)生什么,如果這個函數是這樣:

int argptr(int n, char *pp, int size) //pp類型變?yōu)閏har*

{

int i;

/*********************/

if(argint(n, &i) 《 0)

return -1;

/*********************/

pp = (char*)i; //這里變?yōu)橹苯咏opp賦值

return 0;

}

如果這個函數變成這樣還對嗎,答案是不對的。舉個例子來說明,在 這個內核功能函數中會調用 :

char *p;

argptr(1, &p, n);

/**如果用一級指針**/

argptr(1, p, n);

調用 的本意是獲取第一個參數,也就是用戶接口 的 地址值,并將其賦給 。

假如 等于某個地址 ,如果使用一級指針:調用 argptr(1, p, n); int argptr(int n, char *pp, int size),這個 是實參, 是形參,,雖然 和 的值相等,但它們兩個是兩個不同的變量,所以如果修改 , 的值是不會變化的,因此使用一級指針就不對。

如果使用的是二級指針,調用 argptr(1, &p, n); int argptr(int n, char **pp, int size)。實參是 的地址, 本身就是個地址值,所以 ,修改 就是 。嗯這下就對了,所以這里要使用二級指針才對頭。

還有個獲取字符串的函數,跟獲取指針差不了太多,只是多了一個算字符串長度的步驟,這里就不贅述了。

這是以 write 系統(tǒng)調用為例的系統(tǒng)調用過程圖,圖是丑了點,不過這條線應該捋得還是挺清晰的,好啦,本文就到這里,有什么錯誤還請批評指正,也歡迎大家來同我討論交流學習進步。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內核
    +關注

    關注

    3

    文章

    1350

    瀏覽量

    40155
  • 函數
    +關注

    關注

    3

    文章

    4262

    瀏覽量

    62234
  • 系統(tǒng)調用

    關注

    0

    文章

    28

    瀏覽量

    8316

原文標題:系統(tǒng)調用如何實現(xiàn)?

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用具有精密電壓閾值的使能引腳實現(xiàn)精密啟動延遲

    電子發(fā)燒友網站提供《使用具有精密電壓閾值的使能引腳實現(xiàn)精密啟動延遲.pdf》資料免費下載
    發(fā)表于 09-04 10:13 ?0次下載
    使<b class='flag-5'>用具</b>有精密電壓閾值的使能引腳<b class='flag-5'>實現(xiàn)</b>精密啟動延遲

    使用具有延長引線的SOT-583封裝的好處

    電子發(fā)燒友網站提供《使用具有延長引線的SOT-583封裝的好處.pdf》資料免費下載
    發(fā)表于 08-28 11:39 ?0次下載
    使<b class='flag-5'>用具</b>有延長引線的SOT-583封裝的好處

    鴻蒙ArkUI-X跨語言調用說明:【平臺橋接開發(fā)指南(Android)BridgePlugin】

    本模塊提供ArkUI端和Android平臺端消息通信的功能,包括數據傳輸、方法調用和事件調用。需配套ArkUI端API使用,ArkUI側具體用法請參考[Bridge API]。
    的頭像 發(fā)表于 05-22 14:52 ?1046次閱讀
    鴻蒙ArkUI-X跨語言<b class='flag-5'>調用</b>說明:【平臺橋接開發(fā)指南(Android)BridgePlugin】

    verilog如何調用其他module

    。 1.2 為什么要調用其他模塊? 在復雜的設計中,我們通常需要實現(xiàn)各種不同的功能,并且這些功能往往可以通過不同的模塊來實現(xiàn)。通過調用其他模塊,我們可以將問題分解為更小的子問題,并且可
    的頭像 發(fā)表于 02-22 15:56 ?4774次閱讀

    Linux內核中信號相關的系統(tǒng)調用

    正如我們所知,運行在用戶態(tài)下的程序可以發(fā)送和接收信號。這意味著必須定義一組系統(tǒng)調用來允許這類操作。不幸的是,由于歷史原因,有些系統(tǒng)調用可能功能相同。 因此,其中一些
    的頭像 發(fā)表于 01-20 09:34 ?575次閱讀

    linux內核系統(tǒng)調用之參數傳遞

    與普通函數一樣,系統(tǒng)調用通常需要一些輸入/輸出參數,這些參數可能包括實際值(即數字)、用戶模式進程地址空間中的變量地址,甚至包括指向用戶模式函數指針的數據結構的地址(參見第11章“信號相關的系統(tǒng)
    的頭像 發(fā)表于 12-20 09:32 ?1232次閱讀

    Linux系統(tǒng)調用腳本的常見方法

    在linux系統(tǒng)中有多種方法可以在系統(tǒng)啟動后調用腳本,接下來介紹幾種常見的方法
    的頭像 發(fā)表于 12-13 18:16 ?945次閱讀

    python調用windows命令

    Windows命令,提供一些實際的示例和代碼。 首先,我們需要了解一些基本概念。Windows命令是一種命令行界面(CLI),它允許用戶通過鍵入命令來與操作系統(tǒng)進行交互。Python提供了一個名為 subprocess 的內置模塊,它允許我們在Python程序中執(zhí)行外部命令。 調
    的頭像 發(fā)表于 11-29 14:34 ?918次閱讀

    如何在AOSP12中查看binder調用信息呢?

    部分APP不會使用常規(guī)的framework api調用系統(tǒng)的一些函數獲取信息,但是如果他自己構建binder調用的信息獲取,最后都會跑到這個函數中去。
    的頭像 發(fā)表于 11-27 09:40 ?760次閱讀

    malloc在Linux上執(zhí)行的是哪個系統(tǒng)調用

    malloc底層為什么是內存池 malloc大家都用過,其是庫函數。我們都知道庫函數在不同的操作系統(tǒng)中其實執(zhí)行的是系統(tǒng)調用,那么malloc在Linux上執(zhí)行的是哪個系統(tǒng)
    的頭像 發(fā)表于 11-13 10:36 ?888次閱讀
    malloc在Linux上執(zhí)行的是哪個<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>調用</b>

    什么情況下避免使用系統(tǒng)調用

    制。如果對變量的每次訪問都使用上述機制,由于系統(tǒng)調用會陷入內核空間,需要頻繁的進行上下文切換,這就導致了程序的時間開銷比較大。 自然的,我們就想到,在多線程環(huán)境中,在某些情況下是否能減少甚至避免使用系統(tǒng)
    的頭像 發(fā)表于 11-13 10:32 ?383次閱讀
    什么情況下避免使用<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>調用</b>

    Linux網絡子系統(tǒng)實現(xiàn)

    socket API 需要屏蔽協(xié)議、硬件、平臺(API)的差異,因而采用分層結構: 系統(tǒng)調用提供用戶的應用程序訪問內核的唯一途徑。協(xié)議無關接口由socket layer來實現(xiàn)的,其提供一組通用功能,以支持
    的頭像 發(fā)表于 11-11 11:25 ?1173次閱讀
    Linux網絡子<b class='flag-5'>系統(tǒng)</b>的<b class='flag-5'>實現(xiàn)</b>

    什么是遠程過程調用

    )。 什么是遠程過程調用呢? 那么對于一個聊天系統(tǒng)有int send_information(int friend_id,string msg)這個方法,我們的一個處理邏輯是不是這樣: 調用bool
    的頭像 發(fā)表于 11-10 10:10 ?918次閱讀
    什么是遠程過程<b class='flag-5'>調用</b>

    Linux系統(tǒng)調用概述

    系統(tǒng)調用概述 計算機系統(tǒng)的各種硬件資源是有限的,在現(xiàn)代多任務操作系統(tǒng)上同時運行的多個進程都需要訪問這些資源,為了更好的管理這些資源進程是不允許直接操作的,所有對這些資源的訪問都必須有操
    的頭像 發(fā)表于 11-09 10:27 ?485次閱讀
    Linux<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>調用</b>概述

    如何具體實現(xiàn)輸出信號的分頻和倍頻?

    如何具體實現(xiàn)輸出信號的分頻和倍頻? 在現(xiàn)代電子系統(tǒng)中,信號分頻和倍頻是非常常見的技術。它們可以幫助電子設備在處理信號時具有更高的精度和準確性。下面我將詳細介紹如何實現(xiàn)輸出信號的分頻和倍
    的頭像 發(fā)表于 10-31 10:33 ?2574次閱讀