訂閱
糾錯
加入自媒體

C語言中威力最大的指針底層原理和使用技巧講解

這是道哥的第014篇原創(chuàng)

一、前言

二、變量與指針的本質(zhì)

三、指針的幾個相關(guān)概念

四、指向不同數(shù)據(jù)類型的指針

五、總結(jié)

一、前言

如果問C語言中最重要、威力最大的概念是什么,答案必將是指針!威力大,意味著使用方便、高效,同時也意味著語法復雜、容易出錯。指針用的好,可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源;如果用的不好,程序中將會充滿陷阱、漏洞。

這篇文章,我們就來聊聊指針。從最底層的內(nèi)存存儲空間開始,一直到應用層的各種指針使用技巧,循序漸進、抽絲剝繭,以最直白的語言進行講解,讓你一次看過癮。

說明:為了方便講解和理解,文中配圖的內(nèi)存空間的地址是隨便寫的,在實際計算機中是要遵循地址對齊方式的。

二、變量與指針的本質(zhì)

 1. 內(nèi)存地址

我們編寫一個程序源文件之后,編譯得到的二進制可執(zhí)行文件存放在電腦的硬盤上,此時它是一個靜態(tài)的文件,一般稱之為程序。

當這個程序被啟動的時候,操作系統(tǒng)將會做下面幾件事情:

把程序的內(nèi)容(代碼段、數(shù)據(jù)段)從硬盤復制到內(nèi)存中;創(chuàng)建一個數(shù)據(jù)結(jié)構(gòu)PCB(進程控制塊),來描述這個程序的各種信息(例如:使用的資源,打開的文件描述符...);在代碼段中定位到入口函數(shù)的地址,讓CPU從這個地址開始執(zhí)行。

當程序開始被執(zhí)行時,就變成一個動態(tài)的狀態(tài),一般稱之為進程。

內(nèi)存分為:物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對物理內(nèi)存進行管理、包裝,我們開發(fā)者面對的是操作系統(tǒng)提供的虛擬內(nèi)存。
這2個概念不妨礙文章的理解,因此就統(tǒng)一稱之為內(nèi)存。

在我們的程序中,通過一個變量名來定義變量、使用變量。變量本身是一個確確實實存在的東西,變量名是一個抽象的概念,用來代表這個變量。就比如:我是一個實實在在的人,是客觀存在與這個地球上的,道哥是我給自己起的一個名字,這個名字是任意取得,只要自己覺得好聽就行,如果我愿意還可以起名叫:鳥哥、龍哥等等。

那么,我們定義一個變量之后,這個變量放在哪里呢?那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個很大的存儲區(qū)域,被操作系統(tǒng)劃分為一個一個的小空間,操作系統(tǒng)通過地址來管理內(nèi)存。

內(nèi)存中的最小存儲單位是字節(jié)(8個bit),一個內(nèi)存的完整空間就是由這一個一個的字節(jié)連續(xù)組成的。在上圖中,每一個小格子代表一個字節(jié),但是好像大家在書籍中沒有這么來畫內(nèi)存模型的,更常見的是下面這樣的畫法:

也就是把連續(xù)的4個字節(jié)的空間畫在一起,這樣就便于表述和理解,特別是深入到代碼對齊相關(guān)知識時更容易理解。(我認為根本原因應該是:大家都這么畫,已經(jīng)看順眼了~~)

2. 32位與64位系統(tǒng)

我們平時所說的計算機是32位、64位,指的是計算機的CPU中寄存器的最大存儲長度,如果寄存器中最大存儲32bit的數(shù)據(jù),就稱之為32位系統(tǒng)。

在計算機中,數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進行來回存取。CPU通過3種總線把各組成部分聯(lián)系在一起:地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力,也就是CPU能達到的最大地址范圍。

剛才說了,內(nèi)存是通過地址來管理的,那么CPU想從內(nèi)存中的某個地址空間上存取一個數(shù)據(jù),那么CPU就需要在地址總線上輸出這個存儲單元的地址。假如地址總線的寬度是8位,能表示的最大地址空間就是256個字節(jié),能找到內(nèi)存中最大的存儲單元是255這個格子(從0開始)。即使內(nèi)存條的實際空間是2G字節(jié),CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位,那么能表示的最大地址就是2的32次方,也就是4G字節(jié)的空間。

【注意】:這里只是描述地址總線的概念,實際的計算機中地址計算方式要復雜的多,比如:虛擬內(nèi)存中采用分段、分頁、偏移量來定位實際的物理內(nèi)存,在分頁中還有大頁、小頁之分,感興趣的同學可以自己查一下相關(guān)資料。

3. 變量

我們在C程序中使用變量來“代表”一個數(shù)據(jù),使用函數(shù)名來“代表”一個函數(shù),變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的,而內(nèi)存中所有的信息(代碼和數(shù)據(jù))都是以二進制的形式來存儲的,計算機根據(jù)就不會從格式上來區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時候需要的是地址,而不是變量名、函數(shù)名。

問題來了:在程序代碼中使用變量名來指代變量,而變量在內(nèi)存中是根據(jù)地址來存放的,這二者之間如何映射(關(guān)聯(lián))起來的?

答案是:編譯器!編譯器在編譯文本格式的C程序文件時,會根據(jù)目標運行平臺(就是編譯出的二進制程序運行在哪里?是x86平臺的電腦?還是ARM平臺的開發(fā)板?)來安排程序中的各種地址,例如:加載到內(nèi)存中的地址、代碼段的入口地址等等,同時編譯器也會把程序中的所有變量名,轉(zhuǎn)成該變量在內(nèi)存中的存儲地址。

變量有2個重要屬性:變量的類型和變量的值。

示例:代碼中定義了一個變量

int a = 20;

類型是int型,值是20。這個變量在內(nèi)存中的存儲模型為:

我們在代碼中使用變量名a,在程序執(zhí)行的時候就表示使用0x11223344地址所對應的那個存儲單元中的數(shù)據(jù)。因此,可以理解為變量名a就等價于這個地址0x11223344。換句話說,如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個單元格中,我們就可以在程序中直接用這個地址值來操作這個變量。

在上圖中,變量a的值為20,在內(nèi)存中占據(jù)了4個格子的空間,也就是4個字節(jié)。為什么是4個字節(jié)呢?在C標準中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個字節(jié),這是與具體的機器、編譯器有關(guān)。

比如:32位的編譯器中:

char: 1個字節(jié);
short int: 2個字節(jié);
int: 4個字節(jié);
long: 4個字節(jié)。

比如:64位的編譯器中:

char: 1個字節(jié);
short int: 2個字節(jié);
int: 4個字節(jié);
long: 8個字節(jié)。

為了方便描述,下面都以32位為例,也就是int型變量在內(nèi)存中占據(jù)4個字節(jié)。

另外,0x11223344,0x11223345,0x11223346,0x11223347這連續(xù)的、從低地址到高地址的4個字節(jié)用來存儲變量a的數(shù)值20。在圖示中,使用十六進制來表示,十進制數(shù)值20轉(zhuǎn)成16進制就是:0x00000014,所以從開始地址依次存放0x00、0x00、0x00、0x14這4個字節(jié)(存儲順序涉及到大小端的問題,不影響文本理解)。

根據(jù)這個圖示,如果在程序中想知道變量a存儲在內(nèi)存中的什么位置,可以使用取地址操作符&,如下:

printf("&a = 0x%x ", &a);

這句話將會打印出:&a = 0x11223344。

考慮一下,在32位系統(tǒng)中:指針變量占用幾個字節(jié)?

4. 指針變量

指針變量可以分2個層次來理解:

指針變量首先是一個變量,所以它擁有變量的所有屬性:類型和值。它的類型就是指針,它的值是其他變量的地址。 既然是一個變量,那么在內(nèi)存中就需要為這個變量分配一個存儲空間。在這個存儲空間中,存放著其他變量的地址。指針變量所指向的數(shù)據(jù)類型,這是在定義指針變量的時候就確定的。例如:int *p; 意味著指針指向的是一個int型的數(shù)據(jù)。

首先回答一下剛才那個問題,在32位系統(tǒng)中,一個指針變量在內(nèi)存中占據(jù)4個字節(jié)的空間。因為CPU對內(nèi)存空間尋址時,使用的是32位地址空間(4個字節(jié)),也就是用4個字節(jié)就能存儲一個內(nèi)存單元的地址。而指針變量中的值存儲的就是地址,所以需要4個字節(jié)的空間來存儲一個指針變量的值。

示例:

int a = 20;
int *pa;
pa = &a;
printf("value = %d ", *pa);

在內(nèi)存中的存儲模型如下:

對于指針變量pa來說,首先它是一個變量,因此在內(nèi)存中需要有一個空間來存儲這個變量,這個空間的地址就是0x11223348;

其次,這個內(nèi)存空間中存儲的內(nèi)容是變量a的地址,而a的地址為0x11223344,所以指針變量pa的地址空間中,就存儲了0x11223344這個值。

這里對兩個操作符&和*進行說明:

&:取地址操作符,用來獲取一個變量的地址。上面代碼中&a就是用來獲取變量a在內(nèi)存中的存儲地址,也就是0x11223344。

*:這個操作符用在2個場景中:定義一個指針的時候,獲取一個指針所指向的變量值的時候。

int *pa; 這個語句中的表示定義的變量pa是一個指針,前面的int表示pa這個指針指向的是一個int類型的變量。不過此時我們沒有給pa進行賦值,也就是說此刻pa對應的存儲單元中的4個字節(jié)里的值是沒有初始化的,可能是0x00000000,也可能是其他任意的數(shù)字,不確定;

printf語句中的*表示獲取pa指向的那個int類型變量的值,學名叫解引用,我們只要記住是獲取指向的變量的值就可以了。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號