建设厅官方网站新资质标准,企业管理培训公司排行榜,万网科技,企业网站推广的渠道在计算机内部#xff0c;都是每8位组成的一个个字节#xff0c;比如我们使用abc.encode()把abc转化成二进制byte类型#xff0c;注意byte是不可变类型#xff1a; 编码过程 abc.encode() # 把str字符变为bytes字节类型#xff1b;字符是一个个连接… 在计算机内部都是每8位组成的一个个字节比如我们使用abc.encode()把abc转化成二进制byte类型注意byte是不可变类型 编码过程 abc.encode() # 把str字符变为bytes字节类型字符是一个个连接的转化出来的bytes也是一个个连续的。
babc阿.encode(utf-8) # 一个汉字 uft-8里多是3个字节
bxe9x98xbf阿.encode(gbk) # 一个汉字 gbk里是2个字节
bxb0xa2解码过程 bxe9x98xbf.decode() #使用默认的utf-8 进行解码
阿bxb0xa2.decode(gbk) # 因为刚才是用gbk编码的我们就用gbk解码否则就会乱码
阿babc.decode()
# **这里要注意不要看这里的abc**这里的abc只是一种展现形式
#因为这只是二进制的展示形式
abcASCII 码从0到127共128种变化。它是用1个字节(1个字节有8位)表示的。 关于8位就是从0000 0000到1111 1111组成的数字最高位不动剩下的低7位变化所以共有2的8次方1 0000 0000即128种状态即0-127其中127对应的就是0FFF FFFF。为了用计算机表达字符人们建了对照表。 比如1对于计算机来说计算机里原本是0000 0001我们告诉计算机不要把0100 0001当65看了请把它当a看计算机中内存只能保存数字那对于文字该怎么办呢 对于文字 我们告诉内存这个东西请当做文字处理而不是数字 那么我们就要给计算机一个表这个表的本质就是数值和字符的对应映射关系类似这样比较常见建议背诵的有 - 09 TAB c t # 转义字符的tabc
tc x09 # 十六进制的9c
t0d0a 回车换行 # 即十进制的1310 d rnd
rnd x0dx0ad
rn0x20空格 即decimal 32 e ee x20e阿拉伯数字0x31 字符1 即decimal 49 c 1 # 整数1与ascii码表无关d 1 # 字符1那就要查表d
1d x31d
1 A 0x41 即 65 a 0x61 即97 x x41x
Ay x61y
a
# 举例z ax09bx0dx0ac x31x41x61
# 相当于z atbrnc 1Aaz
atbrnc 1Aa大小规则 常见ASCII码的大小规则09AZa~z。 1数字比字母要小。如 “7”“F” 2数字0比数字9要小并按0到9顺序递增。如 “3”“8” 3字母A比字母Z要小并按A到Z顺序递增。如“A”“Z” 4同个字母的大写字母比小写字母要小32。如“A”“a” 。 几个常见字母的ASCII码大小 “A”为65“a”为97“0”为 48 [4] 。单字节的故事欧美国家ASCII码0-127低8位解决了英语问题欧洲法国德国俄国西班牙等就用了高8位各自解决了自己的信息化问题即低8位兼容ascii码高8位各自为政 高八位加低八位共一个字节。 双字节的中文GB2312GBK仅仅能够解决英美国家拉丁文等字母文字的编码但无法解决中文体系的方块字因为方块字的数量太多了。一个字节不够于是我们开始使用2个字节即65536种状态表达汉字。 为了兼容ASCII码汉字是把双字节的每一个0x80之前的都让过的。比如啊xb0xa1,每个字节都高于0x800x80。 GB2312汉字数量较少也包含了部分日文最后发展成了GBK现在window内部使用额就是双字节的GBK。双字节的统一unicodeUnicode和iso都可以实现用双字节把全世界已知字符收录后来合二为一成为Unicode。 Unicode和GBK之间存在映射关系互联网时代双字节的进化-utf-8Unicode始终是双字节这样本来用单字节表达的字母也需要用双字节,影响了网络时代的网络传输。 于是适应网络时代的utf-8出现了utf-8有1-6个字节兼容了所有字节ascii码依然是单字节中文字符大多落在3个字节。last not the least: str在字符的世界中,是有编码的,要查编码表 bytes在字节的世界里,只有一个个字节,没有编码。今日鸡汤 标准之争才是至高争夺。