提升字符串格式化效率的小技巧
一、前言
二、最簡單的格式化
三、測試1:手動格式化數字
四、測試2:混合格式化字符串和數字
五、sprintf 的實現機制
六、總結
一、前言
在嵌入式項目開發(fā)中,字符串格式化是很常見的操作,我們一般都會使用 C 庫中的 sprintf 系列函數來完成格式化。
從功能上來說,這是沒有問題的,但是在一些時間關鍵場合,字符串的格式化效率會對整個系統產生顯著的影響。
例如:在一個日志系統中,吞吐率是一個重要的性能指標。每個功能模塊都產生了大量的日志信息,日志系統需要把時間戳添加到每條日志的頭部,此時字符串的格式化效率就比較關鍵了。
天下武功,唯快不破!
這篇文章就專門來聊一聊把數字格式化成字符串,可以有什么更好的方法。也許技術含量不高,但是很實用!
二、最簡單的格式化
#include
其中,LONG_MAX 表示 long 型數值的最大值。代碼在眨眼功夫之間就執(zhí)行結束了,但是如果是一百萬、一千萬次呢?
三、測試1:手動格式化數字
1. 獲取系統時間戳函數
我的測試環(huán)境是:在 Win10 中通過 VirtualBox,安裝了 Ubuntu16.04 虛擬機,使用系統自帶的 gcc 編譯器。
為了測試代碼執(zhí)行的耗時,我們寫一個簡單的函數:獲取系統的時間戳,通過計算時間差值來看一下代碼的執(zhí)行速度。
// 獲取系統時間戳long long getSysTimestamp(){ struct timeval tv; gettimeofday(&tv, 0); long long ts = (long long)tv.tv_sec * 1000000 + tv.tv_usec; return ts; }
2. 實現格式化數字的函數// buff: 格式化之后字符串存儲地址;// value: 待格式化的數字void Long2String(char *buff, long value){ long tmp; char tmpBuf[32] = { 0 }; // p 指向臨時數組的最后一個位置 char *p = &tmpBuf[sizeof(tmpBuf) - 1]; while (value != 0) { tmp = value / 10; // 把一個數字轉成 ASCII 碼,放到 p 指向的位置。 // 然后 p 往前移動一個位置。 *--p = (char)('0' + (value - tmp * 10)); value = tmp; }
// 把臨時數組中的每個字符,復制到 buff 中。 while (*p) *buff++ = *p++;}
這個函數的過程很簡單,從數字的后面開始,把每一個數字轉成 ASCII 碼,放到一個臨時數組中(也是從后往前放),最后統一復制到形參指針 buff 指向的空間。
3. 測試代碼int main(){ printf("long size = %d, LONG_MAX = %ld", sizeof(long), LONG_MAX); // 測試 1000 萬次 int total = 1000 * 10000; char buff1[32] = { 0 }; char buff2[32] = { 0 };
// 測試 sprintf long long start1 = getSysTimestamp(); for (int i = 0; i < total; ++i) sprintf(buff1, "%ld", LONG_MAX); printf("sprintf ellapse: %lld us ", getSysTimestamp() - start1);
// 測試 Long2String long long start2 = getSysTimestamp(); for (int i = 0; i < total; ++i) Long2String(buff2, LONG_MAX); printf("Long2String ellapse: %lld us ", getSysTimestamp() - start2); return 0;}
4. 執(zhí)行結果對比long size = 4, LONG_MAX = 2147483647sprintf ellapse: 1675761 us Long2String ellapse: 527728 us
也就是說:把一個 long 型數字格式化成字符串:
使用 sprintf 庫函數,耗時 1675761 us;使用自己寫的 Long2String 函數,耗時 527728 us;
大概是 3 倍左右的差距。當然,在你的電腦上可能會得到不同的結果,這與系統的負載等有關系,可以多測試幾次。
四、測試2:混合格式化字符串和數字
看起來使用自己寫的 Long2String 函數執(zhí)行速度更快一些,但是它有一個弊端,就是只能格式化數字。
如果我們需要把字符串和數字一起格式化成一個字符串,應該如何處理?
如果使用 sprintf 庫函數,那非常方便:
sprintf(buff, "%s%d", "hello", 123456);
如果繼續(xù)使用 Long2String 函數,那么就要分步來格式化,例如:
// 拆成 2 個步驟sprintf(buff, "%s", "hello");Long2String(buff + strlen(buff), 123456);
以上兩種方式都能達到目的,那執(zhí)行效率如何呢?繼續(xù)測試:
int main(){ printf("long size = %d, LONG_MAX = %ld", sizeof(long), LONG_MAX); // 測試 1000 萬 次 const char *prefix = "ZhangSan has money: "; int total = 1000 * 10000; char buff1[32] = { 0 }; char buff2[32] = { 0 };
// 測試 sprintf long long start1 = getSysTimestamp(); for (int i = 0; i < total; ++i) sprintf(buff1, "%s%ld", prefix, LONG_MAX); printf("sprintf ellapse: %lld us ", getSysTimestamp() - start1);
// 測試 Long2String long long start2 = getSysTimestamp(); for (int i = 0; i < total; ++i) { sprintf(buff2, "%s", prefix); Long2String(buff2 + strlen(prefix), LONG_MAX); } printf("Long2String ellapse: %lld us ", getSysTimestamp() - start2); return 0;}
執(zhí)行結果對比:
long size = 4, LONG_MAX = 2147483647sprintf ellapse: 2477686 us Long2String ellapse: 816119 us
執(zhí)行速度仍然是 3 倍左右的差距。就是說,即使拆分成多個步驟來執(zhí)行,使用 Long2String 函數也會更快一些!
五、sprintf 的實現機制
sprintf 函數家族中,存在著一系列的函數,其底層是通過可變參數來實現的。之前寫過一篇文章一個printf(結構體指針)引發(fā)的血案,其中的第四部分,使用圖片詳細描述了可變參數的實現原理,摘抄如下。
1. 可變參數的幾個宏定義typedef char * va_list;
#define va_start _crt_va_start#define va_arg _crt_va_arg #define va_end _crt_va_end
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) #define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define _crt_va_end(ap) ( ap = (va_list)0 )
注意:va_list 就是一個 char* 型指針。
2. 可變參數的處理過程
我們以剛才的示例 my_printf_int 函數為例,重新貼一下:
void my_printf_int(int num, ...) // step1{ int i, val; va_list arg; va_start(arg, num); // step2 for(i = 0; i < num; i++) { val = va_arg(arg, int); // step3 printf("%d ", val); } va_end(arg); // step4 printf("");}
int main(){ int a = 1, b = 2, c = 3; my_printf_int(3, a, b, c);}
Step1: 函數調用時
C語言中函數調用時,參數是從右到左、逐個壓入到棧中的,因此在進入 my_printf_int 的函數體中時,棧中的布局如下:
Step2: 執(zhí)行 va_start
va_start(arg, num);
把上面這語句,帶入下面這宏定義:
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )
宏擴展之后得到:
arg = (char *)num + sizeof(num);
結合下面的圖來分析一下:首先通過 _ADDRESSOF 得到 num 的地址 0x01020300,然后強轉成 char* 類型,再然后加上 num 占據的字節(jié)數(4個字節(jié)),得到地址 0x01020304,最后把這個地址賦值給 arg,因此 arg 這個指針就指向了棧中數字 1 的那個地址,也就是第一個參數,如下圖所示:
Step3: 執(zhí)行 va_arg
val = va_arg(arg, int);
把上面這語句,帶入下面這宏定義:
#define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
宏擴展之后得到:
val = ( *(int *)((arg += _INTSIZEOF(int)) - _INTSIZEOF(int)) )
結合下面的圖來分析一下:先把 arg 自增 int 型數據的大小(4個字節(jié)),使得 arg = 0x01020308;然后再把這個地址(0x01020308)減去4個字節(jié),得到的地址(0x01020304)里的這個值,強轉成 int 型,賦值給 val,如下圖所示:
簡單理解,其實也就是:得到當前 arg 指向的 int 數據,然后把 arg 指向位于高地址處的下一個參數位置。
va_arg 可以反復調用,直到獲取棧中所有的函數傳入的參數。
Step4: 執(zhí)行 va_end
va_end(arg);
把上面這語句,帶入下面這宏定義:
#define _crt_va_end(ap) ( ap = (va_list)0 )
宏擴展之后得到:
arg = (char *)0;
這就好理解了,直接把指針 arg 設置為空。因為棧中的所有動態(tài)參數被提取后,arg 的值為 0x01020310(最后一個參數的上一個地址),如果不設置為 NULL 的話,下面使用的話就得到未知的結果,為了防止誤操作,需要設置為NULL。
六、總結
這篇文章描述的格式化方法靈活性不太好,也許存在一定的局限性。但是在一些關鍵場景下,能明顯提高執(zhí)行效率。
如果文中演示代碼有什么問題,或者你有更好的方法,歡迎分享給大家!
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月20日火熱報名中>> 2024 智能家居出海論壇
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【在線會議】多物理場仿真助跑新能源汽車
推薦專題
- 1 腦機接口芯片,華為出了新專利!
- 2 今年諾獎對人工智能的重視,給我們的基礎教育提了個醒
- 3 銀行業(yè)AI大模型,從入局到求變
- 4 巨頭搶布局,VC狂撒錢,為了能讓「AI讀心」這些公司卷瘋了
- 5 阿斯麥ASML:“骨折級”洋相,又成AI第一殺手?
- 6 蘋果市值創(chuàng)新高,iPhone 16能否助力突破4萬億美元大關?
- 7 洞見AI風潮 第二屆vivo藍河操作系統創(chuàng)新賽開啟招募
- 8 地平線開啟配售,阿里百度各砸5000萬美金,市值最高超500億
- 9 小馬智行沖刺納斯達克:或成「全球Robotaxi第一股」,兩年半營收約12億元
- 10 云從科技:營收低迷與虧損加劇,2025年盈利目標挑戰(zhàn)重重
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市