进阶C语言——数据的存储

admin • 2023-08-07 19:05 • C/C++

Hello，时间过的好快，从我一开始在csdn写的第一篇文章，距离现在已经过去一个多月了，我也在csdn收获了一些粉丝，你们的点赞就是我的动力，希望大家也越来越强，好了，进入我们的正题，初阶C语言也更完了，现在我们要开始我们的进阶C语言，在这里，小编带大家一起沉浸在C语言当中吧，让我们开始学习吧

本章重点

数据类型详细介绍

整形在内存中的存储：原码、反码、补码

大小端字节序介绍及判断

浮点型在内存中的存储解析

1. 数据类型介绍

char        //字符数据类型
short       //短整型
int         //整形
long        //长整型
long long   //更长的整形
float       //单精度浮点数
double      //双精度浮点数

前面我们已经学习上面的这些内置类型，也知道他们占了多少字节大小，我们可以用sizeof来计算它们的大小

类型的意义

使用这个类型开辟内存空间的大小（大小决定了使用范围）。

如何看待内存空间的视角

不同的类型在我们存储的时候占的字节也不同，这样就决定我们改什么时候来使用他们

1.1 类型的基本归类

整型家族

char
 unsigned char
 signed char
short
 unsigned short [int]
 signed short [int]
int
 unsigned int
 signed int
long
 unsigned long [int]
 signed long [int]

大家可能会对char这个类型有疑问，但是我们要知道其实字符的ASCii码都是我们的整数，所以给它规划到我们的整型家族中

unsigned是代表无符号，大家可以认为它就是正数

浮点型家族

float
double

构造类型：

> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union

指针类型

int *pi;
char *pc;
float* pf;
void* pv;

空类型

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型

2. 整形在内存中的存储
我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。接下来我们谈谈数据在所开辟内存中到底是如何存储的？

int a = 20;
int b = -10;

我们知道为 a 分配四个字节的空间。
那如何存储？
知道他们我们就要先知道三个东西，那就是我们的原码反码补码，这些虽然之前讲过，今天在这里就简单的叙述一下了
2.1 原码、反码、补码
计算机中的整数有三种2进制表示方法，即原码、反码和补码。
三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位
正数的原、反、补码都相同。
负整数的三种表示方法各不相同。

原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码
将原码的符号位不变，其他位依次按位取反就可以得到反码。

补码
反码+1就得到补码。

补充
补码变成原码可以先按位取反，然后再加一，当然也可以先减一，然后再按位取反，我们这些都是针对有符号位数的整型，其中这些操作都是符号位不变，而且操作的是二进制，我们计算机中存储的是他们的补码

大家可能对为什么我们存的是补码可能有疑问，下面这个解释大家可能听的明白一点

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统
一处理；
同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程
是相同的，不需要额外的硬件电路。

可以看到我们的CPU只有加法，另外的都是模拟实现

我们可以调试来观察一下

#include<stdio.h>
int main()
{
	int a = 10;
	int b = -20;
	return 0;
}

第一张图是我们变量a的地址，第二个是我们变量b的地址
我们可以看到的是它的16进制存储，0x表示16进制

看到这里大家有没有一个疑问，那这些16进制在我们存储的时候顺序是怎样的，大家是不是有疑问呢，虽然我们可以看到那些？？？？就是我们的顺序，我没有把他显示出来，这里我就要引出一个新知识点，那就是我们的大小端

2.2 大小端介绍

什么大端小端：
大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址
中；
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地
址中。

为什么有大端和小端???

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

那我们的编译器其实是小端字节序存储，我画张图让大家更好的理解吧

简单来说就是数据的低位放在低地址出就是小端，数据的高位放在高地址出就是大端

那竟然大家已经知道大小端，我们是否能用一个代码来证明我们的机器是大端还是小端呢

这里我给大家来提示一下，我们在我们进行存储的时候，存储的是它的补码，因此我们可以取出他们的地址，并且取出他们的低地址或者是高地址，这样我们只取出一个字节就要进行强转，取出的地址如果是1，那么就是小端，如果是0，就是大端

#include<stdio.h>
int check_sys()
{
	int i = 1;
	return *((char*)&i);
}
int main()
{
	int ret = check_sys();
	if (1 == ret)
	{
		printf("小端n");
	}
	else
	{
		printf("大端n");
	}
	return 0;
}

上面的代码就可以说明我们的vs机器存储方式是小端字节序存储

练习题

#include <stdio.h>
int main()
{
    char a= -1;
    signed char b=-1;
    unsigned char c=-1;
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0;
}

我们的char默认也是有符号的至少在vs当中，不过少数的编译器中可能会出现无符号，整型家族中就char没有明确规定
第一个和第二个很好看，就是按原数字输出，但是我们无符号输出的应该是255，因为我们的-1的补码是11111111，然而无符号默认就是正数，正数的补码就是原码，所以我们打印的是十进制数，下面看结果


#include <stdio.h>
int main()
{
	char a = -128;
	printf("%un", a);
	return 0;
}

我们看这两个图就可以明白其实我们的结果就是上面那个二进制位

分析
首先我们的-128是个四字节的整型，然后我们存储到一个字节当中的char，首先会发生截断-128的原码是1000 0000 0000 0000 0000 0000 1000 0000
反码就是1111 1111 1111 1111 1111 1111 0111 1111
补码就是1111 1111 1111 1111 1111 1111 1000 0000
那我们截断就是1000 0000
在按照我们的无符号整型输出那么要整型提升提升是符号位，所以就变成
1111 1111 1111 1111 1111 1111 1000 0000
所以我们通过计算机算出结果，其中的第32位可不是符号位

3.
#include <stdio.h>
int main()
{
    char a = 128;
    printf("%un",a);
    return 0;
}

这题就更简单了，我们的正数128的二进制是1111 1111 1111 1111 1111 1111 1000 0000
我们发生截断就是1000 0000，那我们在继续整型提升就是 1111 1111 1111 1111 1111 1111 1000 0000，
再按照无符号输出，他就是一个正数，那补码就是原码，所以我们的结果就是1111 1111 1111 1111 1111 1111 1000 0000转为十进制，和上面那题答案一样

#include<stdio.h>
int main()
{

	int i = -20;
	unsigned int j= 10;
	printf("%dn", i + j);
	//按照补码的形式进行运算，最后格式化成为有符号整数
	return 0;
}

#include<stdio.h>
int main()
{
	unsigned int i;
	for (i = 9; i >= 0; i--)
	{
		printf("%un", i);
	}
	return 0;
}

这题其实我们直接分析就行 9到0是正常打印，因为无符号整数就是正数，当他i–来到-1的时候，我们还是认为它是一个无符号数，这样的话就会进入死循环，且是从2的32方往下减，减到0的时候又来到-1，因此是死循环

int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
   {
        a[i] = -1-i;
   }
    printf("%d",strlen(a));
    return 0;
}

这里我们也可以直接思考，有符号的char范围是-128–127 ，而我们的strlen是统计前面的长度，这样的话，我们a[i]第一个是-1 然是是-2 一直下去到-128 然后会变成127 一直循环到0，strlen遇到0结束

#include <stdio.h>
unsigned char i = 0;
int main()
{
	for (i = 0; i <= 255; i++)
	{
		printf("hello worldn");
	}
	return 0;
}

死循环我们的无符号char 范围是0到255 当等于256的时候会强制变成0，所以进入死循环

3. 浮点型在内存中的存储
常见的浮点数：

3.14159
1E10
浮点数家族包括： float、double、long double 类型。
浮点数表示的范围，float.h的定义

3.1 一个例子

int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%dn",n);
 printf("*pFloat的值为：%fn",*pFloat);
 *pFloat = 9.0;
 printf("num的值为：%dn",n);
 printf("*pFloat的值为：%fn",*pFloat);
 return 0;
}

我们可以看到我们的结果是不是有点令人意想不到，这是为什么呢，原因是我们的浮点数存储和整型的存储方式不一样，那让我们来探究一下吧

3.2 浮点数存储规则
num 和 *pFloat 在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？
要理解这个结果，一定要搞懂浮点数在计算机内部的表示方法。
详细解读：
根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

-1)^S * M * 2^E
(-1)^S表示符号位，当S=0，V为正数；当S=1，V为负数。
M表示有效数字，大于等于1，小于2。
2^E表示指数位。左移为正，右移为负

举例来说：
十进制的5.0，写成二进制是 101.0 ，相当于 1.01×2^2 。
那么，按照上面V的格式，可以得出S=0，M=1.01，E=2。
十进制的-5.0，写成二进制是 -101.0 ，相当于 -1.01×2^2 。那么，S=1，M=1.01，E=2。
IEEE 754规定：
对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M

IEEE 754对有效数字M和指数E，还有一些特别规定。
前面说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中xxxxxx表示小数部分。
IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的
xxxxxx部分。比如保存1.01的时
候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位
浮点数为例，留给M只有23位，
将第一位的1舍去以后，等于可以保存24位有效数字。

至于指数E，情况就比较复杂。
首先，E为一个无符号整数（unsigned int）
这意味着，如果E为8位，它的取值范围为0_{255；如果E为11位，它的取值范围为0}2047。但是，我们
知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

然后，指数E从内存中取出还可以再分成三种情况

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将
有效数字M前加上第一位的1。
比如：
0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为
1.0*2^(-1)，其阶码为-1+127=126，表示为
01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000000000000000000，则其二进
制表示形式为:0 01111110 00000000000000000000000

E全为0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，
有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于
0的很小的数字

E全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；
好了，关于浮点数的表示规则，就说到这里。

那我们现在来解释前面的题目

#include<stdio.h>
int main()
{
	int n = 9;
	//00000000000000000000000000001001--9的补码

	float* pFloat = (float*)&n;
	printf("n的值为：%dn", n);
	printf("*pFloat的值为：%fn", *pFloat);
	//当我们用浮点数来打印我们的9的时候
	//0 就是我们的符号位
	//我们的后八位都是0 默认E就是-126
	//那我们的写成浮点数就是 （-1）^0*0.00000000000000000001001*2^-126
	//最终结果就是0.000000
	*pFloat = 9.0;
	printf("num的值为：%dn", n);
	printf("*pFloat的值为：%fn", *pFloat);
	//9我们我们用浮点数存储就是（-1）^0*1.001*2^3
	//0 10000010 001 0000 0000 0000 0000 0000
	//变成我们的十进制就是1091567616
	return 0;
}

解释都写在代码当中了，那我们今天的分享就到这，谢谢大家！！！

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

开发语言算法

二维码

关于vs2022 C6031 “scanf返回值被忽略”的解决办法

< <上一篇

)">

npm : 无法将“npm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。

下一篇>>

搜索内容

进阶C语言——数据的存储

最新文章

分类

标签云