一文详解C语言char类型中的存储
作者:Jambo!
char是如何存储的
字符型(char)用于储存字符(character),如英文字母或标点。但是char
类型在内存中并不是以字符的形式储存,而是以ASII码的形式储存,也可以说char
类型储存的实际上是整数。所以char
类型也被归类为整形家族。
int main() { char c = 'A'; printf("%d\n", c); printf("%c\n", c); return 0; }
从上面的代码可以看出,因为char类型储存的是整形,所以可以以正数的形式打印出
打开内存窗口,也可以看出char
是以整数的形式存储:
既然知道char
实际上是整形,所以也可以用int
类型对char
类型赋值
int main() { char c = 65; printf("%d\n", c); printf("%c\n", c); return 0; }
以
%d
输出就是输出存储在内存中的整形,以%c
输出就会输出初始化时整数对应的ASKII码字符
其实关于由int
类型对char
赋值,以及对于char
类型之间的运算,其实都会经历一个操作叫做:整形提升
,整形提升的详细介绍在另一篇文章里👉点击跳转
char的类型
当听到char的类型这句话时,第一反应应该会是:“char的类型不就是char嘛”
其实不然,char
类型实际上分区为有符号的signed char
和无符号的unsigned char
你可能对有无符号可能会陌生,对于有无符号我在另一篇文章里详细介绍了👉点击跳转
对于char
的有无符号位比较特殊的是:
char
与signed char
不一定等价char
默认是signed char
还是unsigned char
取决于编译器- 在常见的编译器里,
char
类型都默认为signed char
char的取值范围
char
类型占1个字节,也就是8个比特位
所以char
在内存中以00000000
开始,逐渐递增,到011111111
,在增加到100000000
,最后到11111111
,如下图:
对于signed char
来说:
00000000
为0,逐渐递增到011111111
为127,因为第一位是符号位,所以再+1后的100000000
为负数。
从最下面的开始算,11111111
为-1,向上逐渐递减,到100000001
时,为-127,所以100000000
为-128。
所以,有符号的char
的取值范围是:-128 ~ 127
对于unsigned char
来说:
当二进制最高好比特位的数为0时,无符号的char与有符号的char相同,当制最高好比特位的数为1时,因为是无符号的char,所以
100000000
为128,直到11111111
为255
所以,无符号的char
的取值范围是:0 ~ 255
下面这幅图可以形象地表示出char类型数据范围
其实,这个图还可以体现出
char
类型的“循环”
在给char
类型赋值为超过它的取值范围的值时,在char
中的会按照图中的循环方向进行存储值,这其实是由于整形提升导致的,但是通过照着这个图会比分析整形提升的过程更方便得出实际char
中的值
int main() { char c = 129; printf("%d", c); return 0; }
这个程序输出是-127,而不是129
此代码中,char
类型默认是有符号的char
,它的取值范围是-128 ~ 127,但是给c
赋值为129,超出了取值范围
所以照着图就可以看出:129超了127两位,在图里127向后走两位就是-127
无符号整形也是如此。
例题
例1
//输出什么? #include <stdio.h> int main() { char a= -1; signed char b=-1; unsigned char c=-1; printf("a=%d,b=%d,c=%d",a,b,c); return 0; }
在这里char
和signed char
是一个意思,有符号的char
取值范围是-128 ~ 127,-1在这个范围中,所以a,b 都输出 -1
无符号的范围是0 ~ 255,-1不在这个范围里,根据起面的循环图,c中存放的是255
例2
//输出结果是什么? int main() { char a[1000]; int i; for(i=0; i<1000; i++) { a[i] = -1-i; } printf("%d",strlen(a)); return 0; }
答案是:255
因为strlen
是遇到\0
就结束,也就是遇到0就结束
a[i]
的值从-1,-2,-3到-128,再到127,126……0
这之间一共有255个数,所以结果是255
例3
//输出结果是什么? #include <stdio.h> unsigned char i = 0; int main() { for(i = 0;i<=255;i++) { printf("hello world\n"); } return 0; }
答案是:死循环
因为这里的i
是无符号的char
,范围是0 ~255,随着for循环的进行,当i==255
时,再加1,i
变为0,仍然小于255,所以是死循环
附:关于转义字符的内容
void main() { //char a = '\'',b='\\',c='\r';// \是转义符 //cout << a << endl; //cout << b<< endl; //cout << c << endl; //int x = 'avb'; //int y = 'a'; //int z = 'v'; //int f = 'b'; //int h = y*z*f; }
char a = ‘’’,b=’\’,c=’\r’; \是转义符
通过转义符可以得到某些特殊的字符的本身
如果只是简单赋值如:char ch=‘’‘;想得到一个单引号字符,这样的操作是无法通过编译的。
例如我们想要在字符串中输入一个特殊的名字如:“c++“hm”
如果简单的写为:char str[30]={" llj “c++ "hm "};这样是无法得到正确的答案的
我们需要使用转义符
char str[30]={" llj \“c++ \"hm "}
这样使用转义符,就可以把某些界限符的意义转为其他含义,如’ ‘是字符的界限符,” “是字符串的界限符。
再举一个例子:int x='4';那么x的值为字符4对应的ascii值
但是如果写为 int x=’\4’;那么x的值就为4。
int x="\1\2\3\4\5\6\7"[2];
上面x的值为3;
首先整个字符串通过转义变为了“1234567”这样七个字符,而后面的[2]则是代表着下标访问第二个数据,所以得到的刚好是第三个字符3;之所以能访问是因为,在这个字符串中\1\2\3等每个数都为一个字节,那么下标2,相当于第三个数,也就是第三个字节的内容。
总结
到此这篇关于C语言char类型中的存储的文章就介绍到这了,更多相关C语言char类型存储内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!