電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 68|回復: 0
收起左側(cè)

C語言為什么不檢查數(shù)組下標

[復制鏈接]

485

主題

485

帖子

1623

積分

三級會員

Rank: 3Rank: 3

積分
1623
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2022-5-24 08:30:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
+ o' I) Z% C; i" ~最近在查一個bug,查到最后發(fā)現(xiàn)是數(shù)組越界導致的。數(shù)組只有30個字節(jié),代碼卻向這個數(shù)組填充了35個數(shù)據(jù),這個bug還是偶現(xiàn)的,查到它確實廢了一番功夫。我就突然想到:C語言為什么不檢查數(shù)組下標呢???先來個demo驗證下* o! X' r: O9 j) `1 U; Z2 B
  • #include#include: R( ]! n' W- R: v8 W
    int main(){    int data[5]={0};    for(int i=0;i8;++i)    {        printf("%d ",data);    }    printf("
    ! C5 {) v, @- k- }% U5 t& J");  W2 ?0 b4 E, D9 v/ y
        return 0;}結(jié)果顯示,C語言還真的不檢查數(shù)組的下標。不僅沒有報錯,而且運行正常4 B+ j9 w1 j+ Y# S* t
    1 m# V6 `0 g1 c* C3 `: W# _) K3 X
    思考$ c" b( v! H% K0 |
    這就讓我陷入了思考,C語言為什么不檢查下標呢?想上文這么簡單的,data數(shù)據(jù)組就5個數(shù)據(jù),編譯器是知道的,為什么是訪問第8個數(shù)據(jù)時,編譯器來個報錯也沒有呢?我想到了之前的文章《指針與數(shù)組》中有如下示例代碼:
    + }; K! i2 [( k: Q, e$ [
  • void main(){    int data[4] = {0, 1, 2, 3};    int *p;    p = data +2;    printf("p[-1] is %d3 e5 Z5 ^' N% D+ R5 S2 F
    ",p[-1]);    printf("*(p-1) is %d
      Q3 P  K' @+ D7 b! s7 Z; J",*(p-1));}運行結(jié)果如下
    6 k. m2 k: [+ T% N; f3 [ 2 P4 Y) `  H4 T  |9 Q
    不僅可以編譯通過,還能正確的輸出結(jié)果為1。這表明,C的下標引用和間接訪問表達式是一樣的。這讓我突然意識到,數(shù)組的這些特性,如數(shù)組名本質(zhì)上是一個常量指針(不懂的同學看之前的推文《指針與數(shù)組》)C語言很難檢查下標合法性的。如果C語言檢查數(shù)組是否越界,因為當數(shù)組出現(xiàn)在表達式中的時候,它會立刻被解讀成指針。此外,使用其他的指針變量也可以指向數(shù)組的任意元素,并且這個指針可以隨意進行加減運算。引用數(shù)組元素的時候,雖然你可以寫成a,但是它只不過是*(a+i)的一種表達,C語言本身的語法是無法檢查的,只能通過編譯器檢查。那么編譯器將加入額外的代碼用于檢測數(shù)組是否越界,C的下標檢查所涉及的開銷比你開始想象的要多。編譯器必須在程序中插入指令,證實下標的結(jié)果所引用的元素和指針表達式所指向的元素屬于同一個數(shù)組,可能僅僅是個小功能,生成的程序的數(shù)組檢查占有大量的代碼空間,這必將影響程序的運行效率。這也讓我意識到一個事情:數(shù)組的標識符(也就是數(shù)組名),它只包含并沒有包含數(shù)組的長度的信息,它只是個地址信息,也就是上面說的數(shù)組名本質(zhì)上是個常量指針。讀到這里,請你想一下,C語言有提供數(shù)組長度的底層函數(shù)嗎???答案是否定的,一般情況下,我們獲取一個數(shù)組的長度,我們可以獲取數(shù)組所占的內(nèi)存大小,然后除以單個元素的內(nèi)存大小計算數(shù)組長度。
  • int a[8];printf("%d",sizeof(a)/sizeof(a[0]));3 g2 B$ _+ R% e' P* }- i  r! q* c
    為什么不修復“漏洞”' s( I' `: \( a( B! `& t& y& q
    既然我們發(fā)現(xiàn)了上述問題,那么那些C語言的大神為什么不修復這個“漏洞”呢?其他編程語言會吸取“教訓”嗎?學過JAVA的同學可以看下面代碼; K5 ~" r( \; l' f
  • int [][] array = {{1,2,3},{1,4}};System.out.println(array[1][2]);這也是一個數(shù)組越界訪問的例子,但是JAVA的控制臺會打印如下信息Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 2/ [) ]9 y; a8 H6 M
    at demo.Array.main(Array.java:31)+ E9 }7 v' i/ E0 n
    會明確告訴你數(shù)組下標越界了,是的,高級語言JAVA是支持的。那么我們就來講講C語言的設(shè)計目標:提供一種能以簡易的方式編譯、處理低級存儲器、僅產(chǎn)生少量的機器碼以及不需要任何運行環(huán)境支持便能運行的編程語言。如果C語言加入了類似下標檢查,實現(xiàn)一個簡單的數(shù)組數(shù)據(jù)寫入,需要大量指令檢查下標是否正確,那么還符合C語言設(shè)計目標嗎?如果C語言有大量的這樣設(shè)計,操作系統(tǒng)內(nèi)核還會使用C語言編寫嗎?單片機等實時系統(tǒng)還會使用C語言嗎?所以C語言給了程序員更大空間,C語言執(zhí)行效率高,可以直接訪問硬件,具有非常好的可移植性,所以世界上絕大部分的操作系統(tǒng)內(nèi)核都是用C語言編寫的。那么問題來了,JAVA都檢查了數(shù)組下標,C語言難道一點進步也沒有嗎?其實也不然,微軟在這一方面也做了貢獻。在早期的CRT函數(shù)中也不對字符串指針或數(shù)組進行越界檢查,都是要求程序員確?臻g足夠,因此也才也才有了在VS2005之后微軟提供的安全的CRT函數(shù)版本。(CRT函數(shù)不是本文的重點,不懂的同學請面向百度編程)。& H  D) E2 x" [* ?) C
    總結(jié)
    . n% ^: X5 u: G' @: N, TC語言為什么不檢查數(shù)組下標???答案一個字:
    * G: Y( F8 Y2 v5 a" l/ W* n; y+ w& ?0 K
    ' w& i2 _9 O/ ~6 y4 t( e* HEND. t. E+ f1 e" p" \) V
    1 ^2 j# f" q) \/ o5 Q/ S+ S9 o% T
    . W4 y. q7 L; Z* x
    ?STM32 IIC詳解3 p! ]) P) C" k, T: R& v
    ?VScode 調(diào)試C語言 必讀
    ; m. M$ s% j, [& ^$ W?單片機中volatile的應用
    / F. D# a% }7 e$ E?聯(lián)合體在單片機編程中的應用  必讀5 r1 G2 p' e$ b" z+ _
    ?STM32串口開發(fā)之環(huán)形緩沖區(qū)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表