当前位置：首页 > news >正文

潍坊市建设一体化平台网站网上停车场做施工图人员网站

news 2025/12/23 21:41:34

潍坊市建设一体化平台网站,网上停车场做施工图人员网站,桑葚 wordpress,免费制作链接的软件背景众所周知#xff0c;计算机只能识别二进制#xff0c;它是由逻辑电路组成#xff0c;逻辑电路通常只有两个状态#xff0c;开关的接通与断开#xff0c;这两种状态正好可以用二进制数的0和1表示。但是现实中存在着其他的字符#xff1a;数字、字母、中文、特殊符号…背景众所周知计算机只能识别二进制它是由逻辑电路组成逻辑电路通常只有两个状态开关的接通与断开这两种状态正好可以用二进制数的0和1表示。但是现实中存在着其他的字符数字、字母、中文、特殊符号等。因此就需要将这些字符转化成计算器可以识别的二进制编码。而我们在开发过程中也常常会遇到各种各样的编码例如ACSII、utf-8、base64等编码接下来让我们来看一下这些常见编码。编码方式 ASCII 我们知道在计算机存储数据时要使用二进制进行表示。而最初计算机只在美国使用因此人们要考虑如何使用二进制来表达 52 个英文字母(包括大小写)、阿拉伯数字(0-9)以及常用的符号(如! # $ 等)。于是便有从电报码发展而来的 ASCIIAmerican Standard Code for Information Interchange美国信息交换标准代码(发音 /ˈæski/)编码。它定义了英文字符和二进制的对应关系一直沿用至今。标准的ASCII字符总计有128个字符(2^7)字节的最高位一般设置为0。按照字符是否可见可分为33个不可见字符95个可见字符。 ● 不可见字符0-31 和 127 (0x00-0x1F 和 0x7F) 为不可见字符也是控制字符共 33 个。用于进行终端的换行、响铃、删除等动作。 ● 可见字符32-126 (0x20-0x7E) 为可见字符共 95 个存储了空格、0-9 十个阿拉伯数字、52 个大小写英文字母以及标点、运算符号等。虽然现代英语使用 128 个字符就足够了但表示其他语言就远远不够了。因此当 ASCII 进入欧洲后又被扩展为了 EASCII(Extended ASCII)将 7 bit 扩展为 8 bit从128为扩展成256位并且前 127 个编码含义和ASCII 保持一致。编码我们要知道一个字符对应的二进制可以先找到它对应的十进制然后再转化为二进制。例如‘d’字符它对应的十进制是100转二进制的口诀是除2倒取余法”即将十进制整数除以2得到一个商和一个余数再将商除以2又得到一个商和一个余数以此类推直到商等于零为止。计算如下倒取余数可以得到110 0100 解码可以看到以下的编码使用 ASCII 码进行映射时下面的二进制编码可以翻译成“Hello world”。 01001000 01100101 01101100 01101100 01101111 00100000 01110111 01101111 01110010 01101100 01100100我们列举一下第一个二进制的0100100的转化对应十进制的转法是把二进制数按权展开、相加即得十进制数。 2^62^364872可以算出它对应的十进制是72从表格上对应到的字符就是H。 ASCII的主要缺点是它只能表示256个不同的字符因为它只有8位。这意味着ASCII无法编码世界上许多其他语言中的字符。如果想要在计算机上使用中文、俄语、日语等语言就需要另一种不同的字符编码标准。Unicode进一步扩展为UTF-8、UTF-16、UTF-32等编码方案以便能够编码各种类型的字符。因此ASCII和Unicode之间的主要区别在于所使用的位数进行编码。接下来我们来看一下Unicode的概念和使用方式。 Unicode 统一码Unicode也叫万国码、单一码它为每种语言中的每个字符设定了统一并且唯一的二进制编码以满足跨语言、垮平台进行文本转换、处理的要求是国际组织制定的用于收纳世界上所有文字和符号的字符集方案。前128个字符同ASCII一样进行扩充后使用数字0-0x10FFFF来映射这些字符。 ● 码点 Unicode 规定了每个字符的数字编号这个编号被称为码点(code point)。码点以 Uhex 的形式表示U是代表Unicode的前缀而 hex 是一个16进制数。取值范围是从 U0000 到 U10FFFF。每个码点对应一个字符绝大部分的常见字符在最前面的 65536 2^16个字符范围是 U0000到UFFFF。 ● 字符平面目前的Unicode分成了17个编组也称平面每个平面有65536个码点。 ○ 基本平面U0000 - UFFFF多数常见字符都在该区间其他平面则为辅助平面。 ○ 辅助平面U10000 到 U10FFFF如我们在网上常见 Emoji 表情。 Unicode通常为两个字节对于英文字符的一个字节即可表示高位字节补0这样对比ASCII编码存储空间就会翻倍在存储和传输上就十分不划算。这就会使得Unicode编码一时间很难推广。于是为了较好的解决 Unicode 的编码问题 UTF-8 和 UTF-16、UTF-32 应运而生UTF-8是8位的单字节码元UTF-16是16位的双字节码元UTF-32是32位的四字节码元。UTF是Unicode TransferFormat的缩写。 Unicode和ASCII的区别如下 UTF-8 UTF-8是一种可变长度字符编码其第一个字节仍与ASCII相容使得原来处理ASCII字符的软件无须或只进行少部分修改后便可继续使用。因此它逐渐成为电子邮件、网页及其他存储或传送文字的应用中优先采用的编码。计算机在读取 UTF-8 中以 0 开头的内容时就知道只需要读取一个字节并显示 Unicode 中 0-127 范围内的正确字符即可。如果遇到两个 1就需要读取 2 个字节范围为128-20473 个 1 在一起表示需要读取三个字节。十六进制二进制范围0000 0000 - 0000 007F0xxxxxxx0-1270000 0080 - 0000 07FF110xxxxx 10xxxxxx128-20470000 0800 - 0000 FFFF1110xxxx 10xxxxxx 10xxxxxx2048-655350001 0000 - 0010 FFFF1110xxxx 10xxxxxx 10xxxxxx 10xxxxxx65536-2098151 应用 1. URL编码在前端常接触的网页中URL链接编码也是非常常见的。因为URL 只能包含标准的 ASCII 字符所以必须对其他特殊字符进行编码。 JavaScript提供了四个URL的编码/解码方法可以用于将非ASCII码的字符如中文字符、特殊字符、表情字符等进行UTF-8的编解码操作 ● 编码encodeURI() 和 encodeURIComponent() ● 解码decodeURI() 和 decodeURIComponent() 转换方式为先转为UTF-8的字节码然后前面加个 % 进行拼接得到编码结果。 encodeURI( 12 33)---%2012%2033 decodeURI(%2012%2033)--- 12 33注意encodeURL有11个字符不能进行编码只能使用encodeURLComponent进行编码 encodeURI与encodeURIComponent区别 ○ encodeURI encodeURI通常用于转码整个 URL不会对URL 元字符以及语义字符进行转码URL元字符 URL 元字符分号;逗号,斜杠/问号?冒号:at等号加号美元符号$井号#语义字符a-zA-Z0-9连词号-下划线_点.感叹号!波浪线~星号*单引号圆括号() ○ encodeURIComponent encodeURIComponent()通常只用于转码URL组成部分如URL中?后的一串会转码除了语义字符之外的所有字符即元字符也会被转码 2. 指定编码如果没有显式指定编码方式浏览器假定任何程序的源代码都是用本地字符集编写的这会因国家/地区而异可能会出现意料之外的情况。因此给 JavaScript 文档设置字符集非常重要可以使用以下三种方式进行设定 ○ 获取文件时可以在Content-type指定 Content-Type: application/javascript; charsetutf-8○ 在script标签设置charset script src./app.js charsetutf-8○ 嵌入head中 !DOCTYPE html html langzh-CN headmeta charsetutf-8 /head在前端开发中Javascript程序是使用Unicode字符集Javascript源码文本通常是基于UTF-8编码。但js代码中的字符串类型是UTF-16编码的正如 ECMAScript 标准所说JavaScript 字符串都是 UTF-16 序列。这也是解释了api接口返回字符串在前端出现乱码因为多数服务都使用utf-8编码前后编码方式不一致。 3. ‘锟斤拷’乱码问题由于 Unicode 字符集在不断更新中因此会出现 A 系统发送的字符在 B 系统中无法识别的情况。于是 Unicode 规定对于无法识别的字符一律使用 0xFFFD 字符来代替。将FFFD转utf-8时我们可以先将其转十进制等于65534发现其在三个字节内的因此先将其转成二进制。从低位开始分成六位一组得到三组 1111 111111 111110。后两组前面补10第一组补1110。最后得到utf-8编码 11101111 10111111 10111110。 //十六进制 -》十进制 FFFD - 15*16^315*16^215*161465534 -〉 1111 111111 11111011101111 10111111 10111110EF BF BD 然后再将其转成十六得到EF BF BD即 0xFFFD 在 UTF-8 编码下为 0xEF 0xBF 0xBD当多出现时就会产生连续的 0xEF 0xBF 0xBD 0xEF 0xBF 0xBD。如果这些字符又被使用了 GB 编码的程序中打开就会按照 GB 双字节编码将其解析。这样刚好就对应了「0xEFBF 锟」「0xBDEF 斤」「0xBFBD 拷」这几个字。 base64 Base64 也称为 Base64 内容传输编码。Base64 是将二进制数据编码为 ASCII 文本。Base64 一个字节只能表示 64 种情况且编码格式每个字节的前两位都只能是 0使用剩下的 6 位表示内容。再加上大多数字符集中存在的一个填充字符。所以它是一种仅使用可打印字符表示二进制数据的方法。Base64 常用于在通常处理文本数据的场景表示、传输、存储一些二进制数据包括MIME的电子邮件及XML的一些复杂数据、以及图片地址。这种编码格式无法充分利用存储资源效能较低。那为什么还会成为网络中的普遍用法呢 ----其实 Base64 最早是应用在邮件传输协议中的。当时邮件传输协议只支持 ASCII 字符传递使用 ASCII 码来表示所有的英文字符和数字还有一些符号。这里有一个问题如果邮件中只传输英文数字等那么 ASCII 可以直接支持。但是如果要在文件中传输图片、视频等资源的话这些资源转成 ASCII 的时候会出现非英文数字的情况。而且邮件中还存在很多控制字符这些控制字符又会成为不可见字符。非英文字符和控制字符在传输过程中很容易产生错误影响邮件的正确传输。为此才有了诞生了一个新的编码规则把二进制以 3 个字节为一组再把每组的 3 个字节24 位转换成 4 个 6 位每 6 位根据查以下映射表对应一个 ASCII 符号。不够6位使用000000 字节值在末尾补足使其字节数能够被 3 整除补位用表示每2个额外的0由1个字符表示并在解码时自动去除这就是 Base64。编码例如我们要编译hello首先将其转成ASCII码01001000 01100101 01101100 01101100 01101111 Hello– 01001000 01100101 01101100 01101100 01101111 然后将其从前往后三个字节为一组后面两个字节也自成一组。每一组按照六位为一组不够六位补0。算出每组对应的十进制然后到表格中找出对应的符号对应的转化如下由于最后的一组补充了两个0因此需要补充1个填充字符 010010 000110 010101 101100 011011 000110 111100 18 6 21 44 27 6 60 S G V s b G 8即编码后hello-》SGVsbG8 解码了解了编码我们来看一下解码还是用上面的例如对于编码后的字符SGVsbk8。四个字符为一组并且删除每一组尾部的。将每一个字符对应的十进制找到然后再转化为二进制。从高到低每8位为一组可得到01001000 01100101 01101100 01101100 01101111对应ASCII表格对应的字符即可得到Hello S G V s b k 8 18 6 21 44 27 10 60 010010 000110 010101 101100 011011 000110 111100 01001000 01100101 01101100 01101100 01101111应用 ● javascript对应的base64编解码方法在JavaScript 中可以使用 btoabinary to ASCII和 atobASCII to binary方法来做 Base64 的编码和解码。例如对‘Hello’做 Base64 的编码与解码对于中文的base64编解码由于ASCII 无法表示中文因此要先做 UTF-8 编码然后再做Base64 编码解码方式为先做 Base64 解码再做UTF-8 解码 const encodedData btoa(encodeURI(你好)); // JUU0JUJEJUEwJUU1JUE1JUJE const decodedData decodeURI(atob(encodedData)); // 你好 ● base64图片地址通常在图片比较多的情况为了减少http请求图片地址我们会用base64编码。前端拿到这个data字符串后先拼接一下前缀:data:图片类型 ; 编码类型, data字符串数据 data:image/png;base64,iVBORw0KGgoAA… 有两种方式显示图片 css方式-背景图片 img {background-image: url(data:image/png;base64,iVBORw0KG......); } img标签方式 img width900 height450 srcdata:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAGMAAAAqCAYAAA..../ 参考资料 ● 聊聊前端字符编码ASCII、Unicode、Base64、UTF-8、UTF-16、UTF-32-51CTO.COM ● Base64 编码知识一文打尽 ● 关于编码的那些事——前端应该了解的字符编码_winty~~的博客-CSDN博客 ● 前端开发中需要搞懂的字符编码知识_前端的字符和字节_jh035的博客-CSDN博客

查看全文

http://www.pierceye.com/news/38904/