当前位置：首页 > news >正文

微网站建设费用网络架构动态

news 2025/12/20 11:06:09

微网站建设费用,网络架构动态,html演示网站,哪个网站可以做会计题尽管现在呼吁所有的程序都使用unicode编码#xff0c;所有的网站都使用utf-8编码#xff0c;来一个统一的国际规范。但仍然有很多#xff0c;包括国内及国外#xff08;特别是非英语国家#xff09;的一些cms#xff0c;仍然使用着自己国家的一套编码#xff0c;比如gbk…尽管现在呼吁所有的程序都使用unicode编码所有的网站都使用utf-8编码来一个统一的国际规范。但仍然有很多包括国内及国外特别是非英语国家的一些cms仍然使用着自己国家的一套编码比如gbk作为自己默认的编码类型。也有一些cms为了考虑老用户所以出了gbk和utf-8两个版本。我们就以gbk字符编码为示范拉开帷幕。gbk是一种多字符编码具体定义自行百度。但有一个地方尤其要注意通常来说一个gbk编码汉字占用2个字节。一个utf-8编码的汉字占用3个字节。在php中我们可以通过输出 echo strlen(和); 来测试。当将页面编码保存为gbk时输出2utf-8时输出3。除了gbk以外所有ANSI编码都是2个字节。ansi只是一个标准在不用的电脑上它代表的编码可能不相同比如简体中文系统中ANSI就代表是GBK。以上是一点关于多字节编码的小知识只有我们足够了解它的组成及特性以后才能更好地去分析它身上存在的问题。说了这么多废话现在来研究一下在SQL注入中字符编码带来的各种问题。 0×01 MYSQL中的宽字符注入这是一个老话题了也被人玩过无数遍。但作为我们这篇文章的序幕也是基础是必须要提的。我们先搭建一个实验环境。暂且称之为phithon内容管理系统v1.0首先先新建一个数据库把如下压缩包中的sql文件导入测试代码及数据库百度网盘请输入提取码提取密码:75tu 之后的phithon内容管理系统会逐步完善但会一直使用这个数据表。源码很简单注意先关闭自己php环境的magic_quotes_gpc 01 ?php 02 //连接数据库部分注意使用了gbk编码把数据库信息填写进去 03 $conn mysql_connect(localhost, root, toor!#$) or die(bad!); 04 mysql_query(SET NAMES gbk); 05 mysql_select_db(test, $conn) OR emMsg(连接数据库失败未找到您填写的数据库); 06 //执行sql语句 07 $id isset($_GET[id]) ? addslashes($_GET[id]) : 1; 08 $sql SELECT * FROM news WHERE tid{$id}; 09 $result mysql_query($sql, $conn) or die(mysql_error()); //sql出错会报错方便观察 10 ? 11 !DOCTYPE html 12 html 13 head 14 meta charsetgbk / 15 title新闻/title 16 /head 17 body 18 ?php 19 $row mysql_fetch_array($result, MYSQL_ASSOC); 20 echo h2{$row[title]}/h2p{$row[content]}p\n; 21 mysql_free_result($result); 22 ? 23 /body 24 /html SQL语句是SELECT * FROM news WHERE tid{$id}就是根据文章的id把文章从news表中取出来。在这个sql语句前面我们使用了一个addslashes函数将$id的值转义。这是通常cms中对sql注入进行的操作只要我们的输入参数在单引号中就逃逸不出单引号的限制无法注入如下图那么怎么逃过addslashes的限制众所周知addslashes函数产生的效果就是让’变成\’让引号变得不再是“单引号”只是一撇而已。一般绕过方式就是想办法处理\’前面的\ 1.想办法给\前面再加一个\或单数个即可变成\\’这样\被转义了’逃出了限制 2.想办法把\弄没有。我们这里的宽字节注入是利用mysql的一个特性mysql在使用GBK编码的时候会认为两个字符是一个汉字前一个ascii码要大于128才到汉字的范围。如果我们输入%df’看会怎样我们可以看到已经报错了。我们看到报错说明sql语句出错看到出错说明可以注入了。为什么从刚才到现在只是在’也就是%27前面加了一个%df就报错了而且从图中可以看到报错的原因就是多了一个单引号而单引号前面的反斜杠不见了。这就是mysql的特性因为gbk是多字节编码他认为两个字节代表一个汉字所以%df和后面的\也就是%5c变成了一个汉字“運”而’逃逸了出来。因为两个字节代表一个汉字所以我们可以试试“%df%df%27” 不报错了。因为%df%df是一个汉字%5c%27不是汉字仍然是\’。那么mysql怎么判断一个字符是不是汉字根据gbk编码第一个字节ascii码大于128基本上就可以了。比如我们不用%df用%a1也可以 %a1%5c他可能不是汉字但一定会被mysql认为是一个宽字符就能够让后面的%27逃逸了出来。于是我可以构造一个exp出来查询管理员账号密码 0×02 GB2312与GBK的不同曾经有一个问题一直困扰我很久。 gb2312和gbk应该都是宽字节家族的一员。但我们来做个小实验。把phithon内容管理系统中set names修改成gb2312: 结果就是不能注入了有些同学不信的话也可以把数据库编码也改成gb2312也是不成功的。为什么这归结于gb2312编码的取值范围。它的高位范围是0xA1~0xF7低位范围是0xA1~0xFE而\是0x5c是不在低位范围中的。所以0x5c根本不是gb2312中的编码所以自然也是不会被吃掉的。所以把这个思路扩展到世界上所有多字节编码我们可以这样认为只要低位的范围中含有0x5c的编码就可以进行宽字符注入。 0×03 mysql_real_escape_string解决问题部分cms对宽字节注入有所了解于是寻求解决方案。在php文档中大家会发现一个函数mysql_real_escape_string文档里说了考虑到连接的当前字符集。于是有的cms就把addslashes替换成mysql_real_escape_string来抵御宽字符注入。我们继续做试验phithon内容管理系统v1.2:就用mysql_real_escape_string来过滤输入我们来试试能不能注入一样没压力注入。为什么明明我用了mysql_real_escape_string但却仍然不能抵御宽字符注入。原因就是你没有指定php连接mysql的字符集。我们需要在执行sql语句之前调用一下mysql_set_charset函数设置当前连接的字符集为gbk。就可以避免这个问题了 0×04 宽字符注入的修复在3中我们说到了一种修复方法就是先调用mysql_set_charset函数设置连接所使用的字符集为gbk再调用mysql_real_escape_string来过滤用户输入。这个方式是可行的但有部分老的cms在多处使用addslashes来过滤字符串我们不可能去一个一个把addslashes都修改成mysql_real_escape_string。我们第二个解决方案就是将character_set_client设置为binary二进制。只需在所有sql语句前指定一下连接的形式是二进制 mysql_query(SET character_set_connectiongbk, character_set_resultsgbk,character_set_clientbinary, $conn); 这几个变量是什么意思当我们的mysql接受到客户端的数据后会认为他的编码是character_set_client然后会将之将换成character_set_connection的编码然后进入具体表和字段后再转换成字段对应的编码。然后当查询结果产生后会从表和字段的编码转换成character_set_results编码返回给客户端。所以我们将character_set_client设置成binary就不存在宽字节或多字节的问题了所有数据以二进制的形式传递就能有效避免宽字符注入。比如我们的phithon内容管理系统v2.0版本更新如下已经不能够注入了在我审计过的代码中大部分cms是以这样的方式来避免宽字符注入的。这个方法可以说是有效的但如果开发者画蛇添足地增加一些东西会让之前的努力前功尽弃。 1|10×05 iconv导致的致命后果很多cms不止一个我就不提名字了他们的gbk版本都存在因为字符编码造成的注入。但有的同学说自己测试了这些cms的宽字符注入没有效果呢难道是自己姿势不对当然不是。实际上这一章说的已经不再是宽字符注入了因为问题并不是出在mysql上而是出在php中了。很多cms真的很多哦不信大家自己网上找找会将接收到数据调用这样一个函数转换其编码 iconv(‘utf-8’, ‘gbk’, $_GET[‘word’]); 目的一般是为了避免乱码特别是在搜索框的位置。比如我们的phithon内容管理系统v3.0 我们可以看到它在sql语句执行前将character_set_client设置成了binary所以可以避免宽字符注入的问题。但之后其调用了iconv将已经过滤过的参数$id给转换了一下。那我们来试试此时能不能注入居然报错了。说明可以注入。而我只是输入了一个“ 錦‘ ”。这是什么原因我们来分析一下。“錦”这个字它的utf-8编码是0xe98ca6它的gbk编码是0xe55c。有的同学可能就领悟了。\的ascii码正是5c。那么当我们的錦被iconv从utf-8转换成gbk后变成了%e5%5c而后面的’被addslashes变成了%5c%27这样组合起来就是%e5%5c%5c%27两个%5c就是\\正好把反斜杠转义了导致’逃逸出单引号产生注入。这正利用了我之前说的绕过addslashes的两种方式的第一种将\转义掉。那么如果我是用iconv将gbk转换成utf-8呢我们来试试果然又成功了。这次直接用宽字符注入的姿势来的但实际上问题出在php而不是mysql。我们知道一个gbk汉字2字节utf-8汉字3字节如果我们把gbk转换成utf-8则php会每两个字节一转换。所以如果\’前面的字符是奇数的话势必会吞掉\’逃出限制。那么为什么之前utf-8转换成gbk的时候没有使用这个姿势这跟utf-8的规则有关UTF-8的编码规则很简单只有二条 1对于单字节的符号字节的第一位设为0后面7位为这个符号的unicode码。因此对于英语字母UTF-8编码和ASCII码是相同的。 2对于n字节的符号n1第一个字节的前n位都设为1第n1位设为0后面字节的前两位一律设为10。剩下的没有提及的二进制位全部为这个符号的unicode码。从2我们可以看到对于多字节的符号其第2、3、4字节的前两位都是10也就是说\0x0000005c不会出现在utf-8编码中所以utf-8转换成gbk时如果有\则php会报错但因为gbk编码中包含了\所以仍然可以利用只是利用方式不同罢了。总而言之在我们处理了mysql的宽字符注入以后也别认为就可以高枕无忧了。调用iconv时千万要小心避免出现不必要的麻烦。 0×06 总结在逐渐国际化的今天推行utf-8编码是大趋势。如果就安全性来说的话我也觉得使用utf-8编码能够避免很多多字节造成的问题。不光是gbk我只是习惯性地把gbk作为一个典型的例子在文中与大家说明。世界上的多字节编码有很多特别是韩国、日本及一些非英语国家的cms都可能存在由字符编码造成的安全问题大家应该有扩展性的思维。总结一下全文中提到的由字符编码引发的安全问题及其解决方案 1.gbk编码造成的宽字符注入问题解决方法是设置character_set_clientbinary。 2.矫正人们对于mysql_real_escape_string的误解单独调用set namegbk和mysql_real_escape_string是无法避免宽字符注入问题的。还得调用mysql_set_charset来设置一下字符集。 3.谨慎使用iconv来转换字符串编码很容易出现问题。只要我们把前端html/js/css所有编码设置成gbkmysql/php编码设置成gbk就不会出现乱码问题。不用画蛇添足地去调用iconv转换编码造成不必要的麻烦。这篇文章是我对于自己白盒审计经验的一点小总结但自己确实在很多方面存在欠缺文中所提到的姿势难免存在纰漏和错误希望有相同爱好的同学能与我指出共同进步。这篇文章不像上篇xss的能够举出很多0day实例来论证宽字符造成的危害。原因有二 1.宽字符问题确实不如富文本xss那么普遍gbk编码的cms所占的比例也比较小怪我才疏学浅并不能每一章都找到相应的实例。 ‍‍2.注入的危害比xss大得多如果作为0day发出来影响很坏。但我确实在写文章以及以前的审计过程中找到不少cms存在的编码问题。

查看全文

http://www.pierceye.com/news/488569/