本文来源:声明int a[3][6], a[0][9]越界吗?
1. 问题
看下面的程序:
#include <stdio.h>
int main(void)
{int a[3][6];for(int i=0; i<3; i++) {for(int j=0; j<6; j++){a[i][j] =i * 6 + j;}}printf("%d\n",a[0][9]);return 0;
}
第10行中的数组元素a[0][9]中的下标9越界吗?
这是一个关于二维数组的问题,下面先了解一下二维数组的相关知识。
2. 二维及多维数组定义和存储方式
二维数组通常用于表示由固定多个同类型的、具有行列结构的数据所构成的复合数据。
二维数组定义的一般形式是:
类型说明符 数组名[元素长度1][元素长度2];
其中类型说明符、数组名的含义和一维数组完全相同。元素长度1表示数组第一维(高维)的长度,元素长度2 表示第二维的长度。二维数组经常用来表示行列式,因此第一维也称为行,第二维也称为列。例如:
int mat[3][4];
定义了一个三行四列的二维数组,数组名为mat,该数组共有3×4=12个int类型元素,每个元素的名称、前后顺序如图1所示。
图1 二维数组mat
二维数组的两个下标在横向和纵向两个方向上变化,而不像一维数组只是一个方向。但是,计算机中存储器是一维编址的,或者说存储器单元是按一维线性排列的,只有一个方向。那么如何在一维结构的存储器中存放二维数组呢,一般有两种方式存储二维数组:一种是按行优先存放,即存放完二维数组第一行之后再存放入第二行;另一种是按列优先存放,即存放完二维数组第一列之后再存放第二列。C实现都是按行优先存放。
因此图1所示二维数组mat,各元素在存储器中存放的先后次序为:
mat[0][0],mat[0][1],mat[0][2],mat[0][3],mat[1][0],mat[1][1],mat[1][2],mat[1][3],mat[2][0],mat[2][1],mat[2][2],mat[2][3]
和一维数组一样,二维数组定义后,系统会在内存中为二维数组分配一块连续区域,从内存的低地址开始依次存放二维数组的各元素数据。因此mat[3][4]定义以后,12个整型元素存放在一块连续的内存中。这一原则对任何类型的数组都成立。
3. C标准的规定
C标准规定,多维数组按行优先存放。在附录J.2 未定义行为一节中列出了下标越界,这说明,下标越界属于未定义行为。
An array subscript is out of range, even if an object is apparently accessible with the given subscript (as in the lvalue expression a[1][7] given the declaration int a[4][5]) (6.5.6).
给定声明int a[4][5],显然左值表达式a[1][7]给定的下标是可以访问的,但其数组下标越界了(6.5.6)。
4. 结论
声明int a[3][6], 则a[0][9]的下标越界。
对于数组越界来说,它属于未定义行为。任何未定义行为都是潜在的bug。但C编译器对数组越界不进行判断,对于a[0][9]仍可以正常访问,我们可以认为这是一个假越界。
对于声明int a[3][6]来说,a[i][j]等价于 *(a+(i*6+j)*sizeof(int))。
如果i*6+j<3*6,且0<=i<3, j>=6,我们定义这种情况为假越界,程序可以正常访问,这是一个假bug。
如果i*6+j>=3*6,且 i>=0, j>=0,我们定义这种情况为真越界。可以判断这是一个真的bug。