途牛网站大数据建设,小小视频免费观看高清,怎么做自己的个人网站,论坛网站建设推广优化大小端存在的意义
大小端字节存储方式#xff08;Big-Endian 和 Little-Endian#xff09;的存在主要是由于不同计算机体系结构和网络通信标准对数据表示方式的差异所导致的。大小端字节存储方式的存在具有以下意义#xff1a; 1. 兼容性#xff1a;不同的计算机系统和网络…
大小端存在的意义
大小端字节存储方式Big-Endian 和 Little-Endian的存在主要是由于不同计算机体系结构和网络通信标准对数据表示方式的差异所导致的。大小端字节存储方式的存在具有以下意义 1. 兼容性不同的计算机系统和网络协议可能采用不同的字节顺序。大小端字节存储方式允许不同系统之间的数据交换和通信只要各方都遵守相同的字节顺序约定。 2. 性能在某些计算机体系结构中例如x86架构小端字节存储方式有助于优化性能因为处理器通常从最低地址开始访问数据这与小端字节顺序相匹配。 3. 历史原因早期的一些计算机系统如IBM的System/360系列采用了大端字节存储方式而其他系统如 Motorola 68000系列则采用了小端字节存储方式。这些早期的设计选择在后来的技术发展中继续被一些新的系统采用。 4. 可移植代码在编写可移植的代码时程序员需要考虑字节顺序的问题并可能需要使用字节交换或掩码操作来确保代码在不同的系统上都能正确运行。 5. 数据交换在网络通信和数据交换中大小端字节顺序的正确处理确保了数据的正确解释。例如TCP/IP协议栈中的数据包需要按照网络字节顺序Big-Endian来处理。 6. 架构设计计算机体系结构的设计者可以根据系统内部的数据处理方式来选择合适的字节顺序以便于实现高效的数据访问和处理。 总之大小端字节存储方式的存在是为了适应不同的系统设计、通信协议和性能需求。正确处理字节顺序对于确保数据的一致性和正确性至关重要。———————————————————————————————————————————
什么是大小端
大小端Big-Endian 和 Little-Endian是指计算机系统中多字节数据类型的存储顺序。这种存储方式影响数据的读取和写入特别是对于有符号整数和浮点数的字节顺序。 1. 大端 - 在大端字节存储方式中数据的高位字节Most Significant ByteMSB存储在内存的低地址端而低位字节Least Significant ByteLSB存储在内存的高地址端。 - 例如对于一个四个字节的整数305419896二进制为00110000 00001010 00001001 00001000在Big-Endian系统中它会被存储为0011 0000 0000 1010 0000 1001 0000 1000。 2. 小端 - 在小端字节存储方式中数据的低位字节LSB存储在内存的低地址端而高位字节MSB存储在内存的高地址端。 - 继续上面的例子在Little-Endian系统中整数305419896会被存储为0000 1000 0000 1001 0000 1010 0000 1000。 字节顺序对于二进制数据的处理非常重要特别是在涉及到网络传输和不同计算机体系结构之间的数据交换时。网络传输通常遵循Big-Endian字节顺序而某些计算机体系结构如x86架构使用的是Little-Endian字节顺序。 程序员在处理跨平台或跨网络的数据时需要考虑字节顺序的差异并可能需要进行相应的转换。在编程语言中有一些函数库或方法可以帮助开发者处理字节顺序的转换。例如在C语言中可以使用memcpy函数来复制内存块而htons、htonl、ntohs和ntohl函数用于网络字节顺序与主机字节顺序之间的转换。———————————————————————————————————————————
简单的说就是
什么是⼤⼩端
其实超过⼀个字节的数据在内存中存储的时候就有存储顺序的问题按照不同的存储顺序我们分为⼤端字节序存储和⼩端字节序存储下⾯是具体的概念
⼤端存储模式是指数据的低位字节内容保存在内存的⾼地址处⽽数据的⾼位字节内容保存在内存的低地址处。
⼩端存储模式是指数据的低位字节内容保存在内存的低地址处⽽数据的⾼位字节内容保存在内存的⾼地址处。上述概念需要记住⽅便分辨⼤⼩端。———————————————————————————————————————————
具体举例
小端存储 在内存里面的存储是倒过来的 那么大端的存储在内存里面是按照顺序进行存储的
也就是顺着存储也就是大端存储逆着存就是小端存储
———————————————————————————————————————————
图解
首先我们知道 在计算机的存储里面
如果你给一个类型是int类型那么这个是四个字节
这四个字节是按照大小端进行存储的
这里如果我们给一个数值1
存放在数值里面那么
如果是小端存储 此时在监视内存里面可以看到四个字节的排序方式是 01 00 00 00 逆着存储
如果是大端存储 此时在监视内存里面可以看到四个字节的排序方式是 00 00 00 01顺序存储
如果我们按照逻辑进行推论 那么 首先 我们是知道的是
地址是从低地址到高地址累计的
字节的高位和低位
是从右到左 依次是个十百千万
所以我们得知 123里面 1是个位也就是低位3是百位也就是高位
同理我们上述图推理出来
小端字节序存储低位字节放到低地址处高位字节放到高地址处。
大端字节序存储高位字节放在低地址处低位字节放到高地址处。 小端字节序Little-Endian和大端字节序Big-Endian是两种不同的字节存储顺序方式它们在多字节数据类型如整数、浮点数等的存储上存在差异 - **小端字节序Little-Endian**在小端字节序中数值的最低位字节被存储在最低的地址中而最高位字节被存储在最高的地址中。换句话说数据的高位字节到低位字节是按照地址从低到高进行存储的。这种存储方式在现代计算机体系结构中较为常见包括x86、ARM等处理器。 - **大端字节序Big-Endian**在大端字节序中数值的最高位字节被存储在最低的地址中而最低位字节被存储在最高的地址中。这意味着数据的高位字节到低位字节是按照地址从高到低进行存储的。这种存储方式在一些早期的计算机系统中较为常见例如IBM的System/360。 在网络通信中通常使用大端字节序来保证数据的统一性和可交换性。例如IP地址、端口号、网络字节顺序如UTF-8编码的字符串等都是使用大端字节序进行存储和传输的。 在编程中操作系统和编译器通常会处理字节序的问题但在跨平台编程或网络编程中程序员可能需要手动进行字节序的转换以确保数据在不同系统或网络之间正确地传输和解读。
———————————————————————————————————————————
为什么会有⼤⼩端模式之分呢以及大小端会怎么出现。
这是因为在计算机系统中我们是以字节为单位的每个地址单元都对应着⼀个字节⼀个字节为8bit位但是在C语⾔中除了8bit的 char 之外还有16bit的 short 型32bit的 long 型要看具体的编译器另外对于位数⼤于8位的处理器例如16位或者32位的处理器由于寄存器宽度⼤于⼀个字节那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了⼤端存储模式和⼩端存储模式。
例如⼀个 16bit 的 short 型 x 在内存中的地址为 0x0010 x 的值为 0x1122 那么0x11 为⾼字节 0x22 为低字节。对于⼤端模式就将 0x11 放在低地址中即 0x0010 中0x22 放在⾼地址中即 0x0011 中。⼩端模式刚好相反。我们常⽤的 X86 结构是⼩端模式⽽KEIL C51 则为⼤端模式。很多的ARMDSP都为⼩端模式。
有些ARM处理器还可以由硬件来选择是⼤端模式还是⼩端模式。
也就是一般情况下 x86也就是小端模式
⽽KEIL C51 则为⼤端模式
———————————————————————————————————————————
大小端的练习1
练习1 设计一个小程序 判断大小端
这里必须拿到a的地址 然后向后四个字节 直接只是强制类型是不行的 或者 简化
强制类型转化是先按出来 然后拿出最后一个字节 n的地址取出来是int*
但是我想访问一个字节不是四个字节
所以强制类型转化 指向第一个字节
这里补充一下 如果强制类型转化的时候 直接进行强制类型转化 长字节转化为短字节 此时也就是只取最后一个 #define _CRT_SECURE_NO_WARNINGS 1
#includestdio.h
//判断大小端
int main()
{int a 1;//首先这里给出一个数值//这里需要进行强制类型转化 为什么呢 // 因为这里给出的是一个整形 内存的存储是一个字节 一个字节进行存储的 也就是 //大端00 00 00 01//小端01 00 00 00//此时我们不知道这个编译器是大端 还是小端 所以 此时需要我们进行判断//假设是小端 此时我们取地址取出的是整个int类型的 首元素的地址 不是单独指向 四个字节大小的其中一个字节//所以我们需要进行强制类型转化 强制转化为 一个字节的类型 //同时因为这里是取地址 需要用指针进行接收 //所以我们强制类型转化为char*类型//同时他是一个指针 取出a的地址 是一个指针 从而判断第一个字节是00 还是01 从而判断是不是大小端if (*(char*)a 1){printf(小端);}else{printf(大端);}return 0;
} ———————————————————————————————————————————
大小端的练习2
代码
#include stdio.h
int main()
{char a -1;signed char b-1;unsigned char c-1;printf(a%d,b%d,c%d,a,b,c);return 0;
}
代码的讲解
首先我们需要知道
整形在内存的存储是补码储存原码进行计算补码进行存储
正数原码反码补码是一样的
负数的原码需要取反1
所以也就是
这里计算是需要补满32位的 因为int类型是4个字节 也就是32比特位
在进行转化之后 因为是char类型的 所以需要进行整形截断
然后 打印的时候再进行整形提升 char a -1;
进行计算
//因为是负数 所以首位是1
//10000000 00000000 00000000 00000001这里是补码 但是我们计算需要进行原码进行计算 所以
//11111111 11111111 11111111 11111110这里是反码 反码就是除了符号位 其他都是按位取反
//11111111 11111111 11111111 11111111这里计算出原码 反码1 也就是原码
//11111111 最后因为是char类型的 产生截断 只保留 一个字节 也就是八个比特位
//最后打印的时候要进行整形提升 因为是打印的是整数 所以按照符号位进行整形提升
//所以也就是
//11111111 11111111 11111111 11111111signed char b-1;
//这里是有符号整形
//所以这里是计算方式是一样是 也就是
//因为是负数 所以首位是1
//10000000 00000000 00000000 00000001这里是补码 但是我们计算需要进行原码进行计算 所以
//11111111 11111111 11111111 11111110这里是反码 反码就是除了符号位 其他都是按位取反
//11111111 11111111 11111111 11111111这里计算出原码 反码1 也就是原码
//11111111 最后因为是char类型的 产生截断 只保留 一个字节 也就是八个比特位
//最后打印的时候要进行整形提升 因为是打印的是整数 所以按照符号位进行整形提升
//所以也就是
//11111111 11111111 11111111 11111111unsigned char c-1;
//这个是无符号整形
//无符号整形的计算方式很有意思
//无符号整数的计算方式前面换算的时候是按照负数进行换算的 也就是
//10000000 00000000 00000000 00000001原码
//11111111 11111111 11111111 11111110反码
//11111111 11111111 11111111 11111111补码
//11111111截断
//此时有意思的来了
//因为的无符号整形 所以整形提升的时候 他补的符号位是0
//也就是
//00000000 00000000 00000000 11111111
//所以也就是255的数值
//也就是说
// c 的二进制表示补码为 11111111最高位为 1但是因为是无符号类型不进行符号位的判断
// 当打印 c 时直接打印出其数值即 255
关于大小端的问题 需要知道 大小端本质是计算机是一种存储方式
拿出来使用的时候也就没有大小端的问题
让你看的时候才有大小端的问题
不理解整形提升的 可以看一下这个博客
整形提升和算数转换-CSDN博客https://blog.csdn.net/Jason_from_China/article/details/135875481
———————————————————————————————————————————
大小端的练习2 知识点的补充 有符号整形和和无符号整形的取值区间
这里是画图是有符号整形和无符号整形的取值范围
在 C 语言中整数类型分为有符号整数和无符号整数它们的取值范围如下 有符号整数 - signed char取值范围是从 -128 到 127。 - short取值范围是从 -32768 到 32767。 - int取值范围是从 -2147483648 到 2147483647。 - long取值范围取决于编译器的实现通常是 -2147483648 到 2147483647 或者更大。 - long long取值范围是从 -9223372036854775808 到 9223372036854775807。 无符号整数 - unsigned char取值范围是从 0 到 255。 - unsigned short取值范围是从 0 到 65535。 - unsigned int取值范围是从 0 到 4294967295。 - unsigned long取值范围取决于编译器的实现通常是 0 到 4294967295 或者更大。 - unsigned long long取值范围是从 0 到 18446744073709551615。 需要注意的是这些取值范围是在标准状况下具体实现的取值范围可能会因为编译器的不同而有所差异。此外int 类型通常会被推广promoted到 long 类型而 long 类型会被推广到 long long 类型当进行这些类型转换时取值范围也会相应改变。
有符号整形的图解 这里只能存放127 128放不下 所以 直接让10000000固定为-128 所以有符号整形的取值范围是取值是-128--127 ———————————————————————————————————————————
无符号整形的图解
无符号char类型举例
对于无符号 没有正负之分
所以这里的取值范围是0-255 整形提升的补充
1的补码是全11111111111111111111111111111111
整形打印不满足32位 要进行整形提升
———————————————————————————————————————————
大小端的练习3 代码
#include stdio.h
int main()
{char a -128;printf(%u\n,a);return 0;
}
代码解析
#include stdio.h
int main()
{char a -128;
//10000000 00000000 00000000 10000000补码
//11111111 11111111 11111111 01111111反码
//11111111 11111111 11111111 10000000补码
//10000000截断
//%u无符号打印 a是char类型 因为发生截断 所以先进行整形提升
//按照符号位进行整形提升 也就是
//11111111 11111111 11111111 10000000打印
//但是
//%u无符号打印
//所以 打印的时候 还是会不打印正负号
//所以结果他也就是 很大的数字 4294967168
//printf(%u\n,a);return 0;
}———————————————————————————————————————————
大小端的练习4
#include stdio.h
int main()
{char a 128;printf(%u\n,a);return 0;
}
代码解释
#include stdio.h
int main()
{char a 128;
//00000000 00000000 00000000 10000000补码
//00000000 00000000 00000000 10000000反码
//00000000 00000000 00000000 10000000补码
//10000000截断
//%u无符号打印 a是char类型 因为发生截断 所以先进行整形提升
//按照符号位进行整形提升 也就是
//11111111 11111111 11111111 10000000整形提升 按照符号位进行提升
//但是
//%u无符号打印
//所以 打印的时候 还是会不打印正负号
//所以结果他也就是 很大的数字 4294967168
//printf(%u\n,a);return 0;
} ———————————————————————————————————————————
大小端的练习5
#include stdio.h
int main()
{char a[1000];int i;for(i0; i1000; i){a[i] -1-i;}printf(%zd,strlen(a));return 0;
}
代码的讲解
首先我们需要知道这里是char类型 而且是有符号类型的
也就char类型占据一个比特位
他的最大值也就是11111111
他的最小值也就是00000000
所以 我们画个图可以理解为 对于代码的图解 所以结果是255
同理我们也可以知道
既然我们可以推算出有符号char类型的最大值是-127~127
那么我们也可以推算出其他类型的大小
也就是说明计算机里面 类型的大小是有边界的
不同的类型的大小是不一样的
char: 标准规定 char 类型至少为8位1字节可以是有符号或无符号的。
有符号 char 的取值范围是从 -128 到 127
无符号 char 的取值范围是从 0 到 255。
11111111
10000000-01111111short: 标准规定 short int 类型至少为16位2字节可以是有符号或无符号的。
有符号 short 的取值范围是从 -32768 到 32767
无符号 short 的取值范围是从 0 到 65535。
11111111 11111111-0
10000000 00000000-01111111 1111111int: 标准规定 int 类型至少为16位2字节但通常在32位系统上使用32位4字节。
有符号 int 的取值范围是从 -2147483648 到 2147483647
符号 int 的取值范围是从 0 到 4294967295。
11111111 11111111 11111111 11111111-0
10000000 00000000 00000000 00000000-01111111 11111111 11111111 11111111int: 标准规定 int 类型至少为16位2字节但通常在32位系统上使用32位4字节。有符号 int 的取值范围是从 -2147483648 到 2147483647无符号 int 的取值范围是从 0 到 4294967295。但是要注意的是32位系统上的 int 通常是这样表示的
11111111 11111111 11111111 11111111 - 0
10000000 00000000 00000000 00000000 - 0
代码的总结
#include stdio.h
int main()
{char a[1000];
//首先我们知道 这里是char字节 也就是 01111111-10000000 这也就是取值区间
//但是我们需要知道的是 这里打印的方式是无符号打印的方式
//需要知道的是 就算是无符号整形打印 本质这里面还是按照-127~128进行计算的
//计算和打印是区分开的int i;for(i0; i1000; i){a[i] -1-i;
//这里进行循环的计算 也就是-1,-2,-3,-4,-5.......-127,....128.....-2.进行循环 直到循环结束}
//关键点在这里 这里strlen计算的是\0之前的字符的个数 这里也就是一直进行循环也就是 -127~128
//所以也就是255printf(%zd,strlen(a));
//zd的打印整形return 0;
} ———————————————————————————————————————————
大小端的练习6
#include stdio.h
unsigned char i 0;
int main()
{for(i 0;i255;i){printf(hello world\n);}return 0;
}
代码的解析
#include stdio.h
//首先 根据上面的讲解 我们知道 有符号整形的取值范围和无符号整形的取值范围
//很显然 这里是无符号整形 取值范围是0~255
unsigned char i 0;
int main()
{
//接下来我们看这个循环 这个循环一直是小于地等于255的
//什么意思呢 也就是 这个循环条件一直满足 所以导致不停打印 导致死循环for(i 0;i255;i){printf(hello world\n);}return 0;
} 当数值等于255的时候还是小于等于255 继续开始新的循环 所以这个代码是死循环代码 是错误代码
———————————————————————————————————————————
大小端的练习7
#include stdio.h
int main()
{unsigned int i;for(i 9; i 0; i--){printf(%u\n,i);}return 0;
}代码的解析
#include stdio.h
int main()
{unsigned int i;
//首先 这里是无符号整形
//所以计算的范围是大于0 的//加下来我们看看循环条件
//这个循环条件是 只要大于0 就会一直进行 循环 所以一直满足条件 导致死循环for(i 9; i 0; i--){printf(%u\n,i);}return 0;
}同理也是死循环 ———————————————————————————————————————————
大小端的练习8
#include stdio.h
int main()
{int a[4] { 1, 2, 3, 4 };int *ptr1 (int *)(a 1);int *ptr2 (int *)((int)a 1);printf(%x,%x, ptr1[-1], *ptr2);return 0;
}图解 指针1 是取决于整形类型
整形1 就是1
这里是强制类型转化为整形也就是1
再次强制转化为int* 四个字节也就是此时变成这样 所以指向的是这四个字节 这四个字节按照小端内存的方式存储
低位放在低地址高位放在高地址 所以结果就是 0x4,0x2000000 代码的解析
#include stdio.h
int main()
{
//这里是一个整形数组 1 2 3 4int a[4] { 1, 2, 3, 4 };//这里是一个指针首先是取地址 整个数组的地址 1 并且强制转化为整形指针 所以指向的是最后一个地址1
int *ptr1 (int *)(a 1);//这里是整形进行1 并且强制转化为整形指针 也就是指向的是2
//指针1 是取决于整形类型
//整形1 就是1
int *ptr2 (int *)((int)a 1);//这里第一个 ptr1[-1]等价于*ptr-1 所以指向的从 最后一个地址1 变成最后一个地址 也就是4
//第二个打印的是2 上面已经解释printf(%x,%x, ptr1[-1], *ptr2);return 0;
}所以结果是 ———————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————— 有符号整形和和无符号整形的取值区间和计算
这里是画图是有符号整形和无符号整形的取值范围
在 C 语言中整数类型分为有符号整数和无符号整数它们的取值范围如下 有符号整数 - signed char取值范围是从 -128 到 127。 - short取值范围是从 -32768 到 32767。 - int取值范围是从 -2147483648 到 2147483647。 - long取值范围取决于编译器的实现通常是 -2147483648 到 2147483647 或者更大。 - long long取值范围是从 -9223372036854775808 到 9223372036854775807。 无符号整数 - unsigned char取值范围是从 0 到 255。 - unsigned short取值范围是从 0 到 65535。 - unsigned int取值范围是从 0 到 4294967295。 - unsigned long取值范围取决于编译器的实现通常是 0 到 4294967295 或者更大。 - unsigned long long取值范围是从 0 到 18446744073709551615。 需要注意的是这些取值范围是在标准状况下具体实现的取值范围可能会因为编译器的不同而有所差异。此外int 类型通常会被推广promoted到 long 类型而 long 类型会被推广到 long long 类型当进行这些类型转换时取值范围也会相应改变。
有符号整形的图解 这里只能存放127 128放不下 所以 直接让10000000固定为-128 所以有符号整形的取值范围是取值是-128--127 ———————————————————————————————————————————
无符号整形的图解
无符号char类型举例
对于无符号 没有正负之分
所以这里的取值范围是0-255 整形提升的补充
1的补码是全11111111111111111111111111111111
整形打印不满足32位 要进行整形提升
———————————————————————————————————————————