訂閱
糾錯(cuò)
加入自媒體

一個(gè)printf(結(jié)構(gòu)體指針)引發(fā)的血案

編譯、執(zhí)行,打印結(jié)果如下:

示例3:參數(shù)類型是 char*,但是參數(shù)個(gè)數(shù)不固定#include <unistd.h>#include <stdio.h>#include <stdlib.h>#include <stdarg.h>
void my_printf_string(char *first, ...){    char *str = first;    va_list arg;    va_start(arg, first);    do     {        printf("%s ", str);        str = va_arg(arg, char*);    } while (str 。 NULL );    va_end(arg);    printf("");}
int main(){    char *a = "aaa", *b = "bbb", *c = "ccc";    my_printf_string(a, b, c, NULL);}

編譯、執(zhí)行,打印結(jié)果如下:

注意:以上這3個(gè)示例中,雖然傳入的參數(shù)個(gè)數(shù)是不固定的,但是參數(shù)的類型都必須是一樣的!

另外,處理函數(shù)中必須能夠知道傳入的參數(shù)有多少個(gè),處理 int 和 float 的函數(shù)是通過第一個(gè)參數(shù)來判斷的,處理 char* 的函數(shù)是通過最后一個(gè)可變參數(shù)NULL來判斷的。

2. 可變參數(shù)的原理2.1 可變參數(shù)的幾個(gè)宏定義typedef char *    va_list;
#define va_start  _crt_va_start#define va_arg    _crt_va_arg  #define va_end    _crt_va_end  
#define _crt_va_start(ap,v)  ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )  #define _crt_va_arg(ap,t)    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )  #define _crt_va_end(ap)      ( ap = (va_list)0 )

注意:va_list 就是一個(gè) char* 型指針。

2.2 可變參數(shù)的處理過程

我們以剛才的示例 my_printf_int 函數(shù)為例,重新貼一下:

void my_printf_int(int num, ...) // step1{    int i, val;    va_list arg;    va_start(arg, num);         // step2    for(i = 0; i < num; i++)    {        val = va_arg(arg, int); // step3        printf("%d ", val);    }    va_end(arg);                // step4    printf("");}
int main(){    int a = 1, b = 2, c = 3;    my_printf_int(3, a, b, c);}

Step1: 函數(shù)調(diào)用時(shí)

C語言中函數(shù)調(diào)用時(shí),參數(shù)是從右到左、逐個(gè)壓入到棧中的,因此在進(jìn)入 my_printf_int 的函數(shù)體中時(shí),棧中的布局如下:

Step2: 執(zhí)行 va_start

va_start(arg, num);

把上面這語句,帶入下面這宏定義:

#define _crt_va_start(ap,v)  ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )

宏擴(kuò)展之后得到:

arg = (char *)num + sizeof(num);

結(jié)合下面的圖來分析一下:首先通過 _ADDRESSOF 得到 num 的地址 0x01020300,然后強(qiáng)轉(zhuǎn)成 char* 類型,再然后加上 num 占據(jù)的字節(jié)數(shù)(4個(gè)字節(jié)),得到地址 0x01020304,最后把這個(gè)地址賦值給 arg,因此 arg 這個(gè)指針就指向了棧中數(shù)字 1 的那個(gè)地址,也就是第一個(gè)參數(shù),如下圖所示:

Step3: 執(zhí)行 va_arg

val = va_arg(arg, int);

把上面這語句,帶入下面這宏定義:

#define _crt_va_arg(ap,t)    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

宏擴(kuò)展之后得到:

val = ( *(int *)((arg += _INTSIZEOF(int)) - _INTSIZEOF(int)) )

結(jié)合下面的圖來分析一下:先把 arg 自增 int 型數(shù)據(jù)的大。4個(gè)字節(jié)),使得 arg = 0x01020308;然后再把這個(gè)地址(0x01020308)減去4個(gè)字節(jié),得到的地址(0x01020304)里的這個(gè)值,強(qiáng)轉(zhuǎn)成 int 型,賦值給 val,如下圖所示:

簡單理解,其實(shí)也就是:得到當(dāng)前 arg 指向的 int 數(shù)據(jù),然后把 arg 指向位于高地址處的下一個(gè)參數(shù)位置。

va_arg 可以反復(fù)調(diào)用,直到獲取棧中所有的函數(shù)傳入的參數(shù)。

Step4: 執(zhí)行 va_end

va_end(arg);

把上面這語句,帶入下面這宏定義:

#define _crt_va_end(ap)      ( ap = (va_list)0 )

宏擴(kuò)展之后得到:

arg = (char *)0;

這就好理解了,直接把指針 arg 設(shè)置為空。因?yàn)闂V械乃袆?dòng)態(tài)參數(shù)被提取后,arg 的值為 0x01020310(最后一個(gè)參數(shù)的上一個(gè)地址),如果不設(shè)置為 NULL 的話,下面使用的話就得到未知的結(jié)果,為了防止誤操作,需要設(shè)置為NULL。

3. printf利用可變參數(shù)打印信息

理解了 C 語言中可變參數(shù)的處理機(jī)制,再來思考 printf 語句的實(shí)現(xiàn)機(jī)制就很好理解了。

3.1 GNU 中的 printf 代碼__printf (const char *format, ...){   va_list arg;   int done;
  va_start (arg, format);   done = vfprintf (stdout, format, arg);   va_end (arg);
  return done;}

可見,系統(tǒng)庫中的 printf 也是這樣來處理動(dòng)態(tài)參數(shù)的,vfprintf 函數(shù)最終會(huì)調(diào)用系統(tǒng)函數(shù) sys_write,把數(shù)據(jù)輸出到 stdout 設(shè)備上(顯示器)。vfprintf 函數(shù)代碼看起來還是有點(diǎn)復(fù)雜,不過稍微分析一下就可以得到其中的大概實(shí)現(xiàn)思路:

逐個(gè)比對格式化字符串中的每一個(gè)字符;如果是普通字符就直接輸出;如果是格式化字符,就根據(jù)指定的數(shù)據(jù)類型,從可變參數(shù)中讀取數(shù)據(jù),輸出顯示;

以上只是很粗略的思路,實(shí)現(xiàn)細(xì)節(jié)肯定復(fù)雜的多,需要考慮各種細(xì)節(jié)問題。下面是 2 個(gè)簡單的示例:

void my_printf_format_v1(char *fmt, ...){    va_list arg;    int d;    char c, *s;
  va_start(arg, fmt);    while (*fmt)     {        switch (*fmt) {            case 's':                 s = va_arg(arg, char *);                printf("%s", s);                    break;
           case 'd':                  d = va_arg(arg, int);                printf("%d", d);                break;
           case 'c':                      c = (char) va_arg(arg, int);                printf(" %c", c);                break;            default:                if ('%' 。 *fmt || ('s' != *(fmt + 1) && 'd' 。 *(fmt + 1) && 'c' 。 *(fmt + 1)))                    printf("%c", *fmt);                break;        }        fmt++;    }    va_end(arg);}
int main(){    my_printf_format_v1("age = %d, name = %s, num = %d ",         20, "zhangsan", 98);}

編譯、執(zhí)行,輸出結(jié)果:

完美!但是再測試下面代碼(把格式化字符串最后面的 num 改成 score):

my_printf_format_v1("age = %d, name = %s, score = %d ",         20, "zhangsan", 98);

編譯、執(zhí)行,輸出結(jié)果:

因?yàn)槠胀ㄗ址?score 中的字符 s 被第一個(gè) case 捕獲到了,所以發(fā)生錯(cuò)誤。稍微改進(jìn)一下:

void my_printf_format_v2(char *fmt, ...){    va_list arg;    int d;    char c, lastC = '', *s;
  va_start(arg, fmt);    while (*fmt)     {        switch (*fmt) {            case 's':                 if ('%' == lastC)                {                    s = va_arg(arg, char *);                    printf("%s", s);                }                else                {                   printf("%c", *fmt);                }                break;
           case 'd':                  if ('%' == lastC)                {                    d = va_arg(arg, int);                    printf("%d", d);                }                 else                {                   printf("%c", *fmt);                }                break;
           case 'c':                   if ('%' == lastC)                {                        c = (char) va_arg(arg, int);                    printf(" %c", c);                }                else                {                    printf("%c", *fmt);                }                                break;            default:                if ('%' 。 *fmt || ('s' != *(fmt + 1) && 'd' 。 *(fmt + 1) && 'c' != *(fmt + 1)))                    printf("%c", *fmt);                break;        }        lastC = *fmt;        fmt++;    }    va_end(arg);}
int main(){    my_printf_format_v2("age = %d, name = %s, score = %d ",         20, "zhangsan", 98);}

編譯、執(zhí)行,打印結(jié)果:

五、總結(jié)

我們來復(fù)盤一下上面的分析過程,開頭的第一個(gè)代碼本意是測試關(guān)于指針的,結(jié)果到最后一直分析到 C 語言中的可變參數(shù)問題?梢钥闯,分析問題-定位問題-解決問題是一連串的思考過程,把這個(gè)過程走一遍之后,理解才會(huì)更深刻。

我還有另外一個(gè)感受:如果我沒有寫公眾號,就不會(huì)寫這篇文章;如果不寫這篇文章,就不會(huì)研究的這么較真。也許在中間的某個(gè)步驟,我就會(huì)偷懶對自己說:理解到這個(gè)層次就差不多了,不用繼續(xù)深究了。所以說以文章的形式來把自己的思考過程進(jìn)行輸出,是技術(shù)提升是非常有好處的,也強(qiáng)烈建議各位小伙伴嘗試一下這么做。

而且,如果這些思考過程能得到你們的認(rèn)可,那么我就會(huì)更有動(dòng)力來總結(jié)、輸出文章。因此,如果這篇總結(jié)對你能有一絲絲的幫助,請轉(zhuǎn)發(fā)、分享給你的技術(shù)朋友,在此表示衷心的感謝!

【原創(chuàng)聲明】

作者:道哥

<上一頁  1  2  3  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號