PHP代码安全杂谈

虽然PHP是世界上最好的语言,但是也有一些因为弱类型语言的安全性问题出现。WordPress历史上就出现过由于PHP本身的缺陷而造成的一些安全性问题,如CVE-2014-0166 中的cookie伪造就是利用了PHP Hash比较的缺陷。 当然一般这种情况实战中用到的不是很多,但是在CTF竞赛中却是一个值得去考察的一个知识点,特此记录总结之。

一、精度绕过缺陷

理论

在用PHP进行浮点数的运算中,经常会出现一些和预期结果不一样的值,这是由于浮点数的精度有限。尽管取决于系统,PHP 通常使用 IEEE 754 双精度格式,则由于取整而导致的最大相对误差为 1.11e-16。非基本数学运算可能会给出更大误差,并且要考虑到进行复合运算时的误差传递。下面看一个有趣的例子:

以十进制能够精确表示的有理数如 0.10.7,无论有多少尾数都不能被内部所使用的二进制精确表示,因此不能在不丢失一点点精度的情况下转换为二进制的格式。这就会造成混乱的结果:例如,floor((0.1+0.7)*10) 通常会返回 7 而不是预期中的 8,因为该结果内部的表示其实是类似 7.9999999999999991118…

实践

问鼎杯2017 老眼昏花网上很多write-up感觉就像是看着答案写write-up,个人感觉真正的write-up中应该体现自己的思考在里面。

题目描述

题目言简意赅,让我们把2017这个值传递给服务器。

考察点

  • PHP浮点精确度

write-up

what year is this?所以第一反应是直接给year参数赋值为2017:

?year=2017

然而结果如下:

有提示了,说明year这个参数是对的,但是2017中不可以出现7,这里如果不了解php精度的话,肯定是对2017进行各种编码绕过,但是这里对编码也进行过滤了:

所以最后一种可能就是利用PHP精度来绕过:

?year=2016.99999999999

二、类型转换的缺陷

理论

PHP提供了is_numeric函数,用来变量判断是否为数字。PHP弱类型语言的一个特性,当一个整形和一个其他类型行比较的时候,会先把其他类型intval数字化再比。

实践

is_numeric()用于判断是否是数字,通常配合数值判断。

案例代码

考察点

  • PHP类型转换缺陷

write-up

分析下代码:首先对GET方式提交的参数id的值进行检验。id通过is_numeric函数来判断是否为数字,如果为数字的话,GG。如果不是数字的话,和665进行比较,id的值大于665的时候输出flag。 乍看上去又好像不可能这里,但是如果知道PHP弱类型语言的一个特性,当一个整形和一个其他类型行比较的时候,会先把其他类型intval数字化再比。这个特性的话就可以很好的绕过。

http://localhost/?id=666gg

三、松散比较符的缺陷

理论

php比较相等性的运算符有两种,一种是严格比较,另一种是松散比较。

如果比较一个数字和字符串或者比较涉及到数字内容的字符串,则字符串会被转换成数值并且比较按照数值来进行

严格比较符严格比较符,会先判断两种字符串的类型是否相等,再比较。

===   //全等
!==   //不全等

松散比较符松散比较符,会先将字符串类型转换成相同,再比较。

==   //等于
!=   //不等

PHP 会根据变量的值,自动把变量转换为正确的数据类型。这一点和C 和 C++ 以及 Java 之类的语言明显不同。虽然这样PHP方便了程序员,但是随之而来却会带来一些安全性的问题。

一个简单的例子

由于php对变量自动转换的特性,这里面的

$a==$b 与 $c==$d 均为真

所以页面输出的结果为:

一个深入的例子

下面结合PHP 相等性比较缺陷再解释下会好懂一点:

var_dump(0=="gg");  //true
var_dump(0==="gg"); //false
var_dump(1=="gg");  //false

0gg进行松散性质的不严格比较,会将gg转换为数值,强制转换,由于gg是字符串,转化的结果是0,所以 输出 true 0gg进行严格 性质的严格比较,这里的gg是字符串类型,和int类型的0不相等,所以输出 false 0gg进行松散性质的不严格比较,会将gg转换为数值,强制转换,由于gg是字符串,转化的结果是0,不等于1,所以输出 false

var_dump(1=="1gg"); //true 
var_dump(1=="gg1"); //false

11gg进行松散性质的不严格比较,这里1gg被强制转换为int类型的时候会从字符串的第一位开始做判断进行转换,这里的1gg第一位是1,所以这里1gg被转换为1,所以输出 true 1gg1进行严格 性质的严格比较,字符串gg1的第一位不是数字,所以它被强制转换为0,所以输出 false

var_dump("0e123" == "0e456");  //true
var_dump("0e123" == "0eabc");  //flase

这里比较特殊,字符串中出现了0e,PHP手册介绍如下:

当一个字符串欸当作一个数值来取值,其结果和类型如下:如果该字符串没有包含'.','e','E'并且其数值值在整形的范围之内 该字符串被当作int来取值,其他所有情况下都被作为float来取值, 该字符串的开始部分决定了它的值,如果该字符串以合法的数值开始,则使用该数值,否则其值为0。

实践

md5绕过(Hash比较缺陷)南京邮电大学网络攻防训练平台中一道比较经典的md5 collision题,关于这道题目的WriteUp网上很多,但是真正深入分析的少之又少~~

题目描述

md5 collision源码

考察点

  • 简单的PHP代码审计
  • PHP弱类型的Hash比较缺陷

write-up

从源码中可以得输入一个a的参数的变量,a首先不等于QNKCDZO并且a得md5值必须等于QNKCDZO加密后的md5值。 乍一看好像不可能存在这样的值,但是这里QNKCDZO加密后的md5值为0e830400451993494058024219903391 这里是0e开头的,在进行等于比较的时候,PHP把它当作科学计数法,0的无论多少次方都是零。 所以这里利用上面的弱类型的比较的缺陷来进行解题:?a=s155964671a

字符串加密后md5为0exxxx的字符串(x必须是10进制数字)列表

| 字符串 | md5 | | —- | —- | | QNKCDZO | 0e830400451993494058024219903391 | | 240610708 | 0e462097431906509019562988736854 | | aabg7XSs | 0e087386482136013740957780965295 | | aabC9RqS | 0e041022518165728065344349536299 | | s878926199a | 0e545993274517709034328855841020 |

四、sha1() md5()加密函数漏洞缺陷

理论

md5()sha1()对一个数组进行加密将返回 NULL

实践

Boston Key Party CTF 2015: Prudential

题目描述

I dont think sha1 isbroken.Prove me wrong.

题目给了一个登陆框:

考察点

  • sha1()函数漏洞缺陷

write-up

源代码给出如下:

分析一下核心登录代码如下:

GET类型提交了两个字段namepassword,获得flag要求的条件是:

  • name != password
  • sha1(name) == sha1(password)

这个乍看起来这是不可能的,但是这里利用sha1()函数在处理数组的时候由于无法处理将返回NULL可以绕过if语句的验证,if条件成立将获得flag。 构造语句如下:

?name[]=a&password[]=b

这里符合了2个拿到flag的条件:

  • a不等于b
  • name和password由于是数组,经过sha1()函数嫁给后都返回NULL

拿到flag: I_think_that_I_just_broke_sha1

拓展总结

经过验证,不仅sha1()函数无法处理数组,这里md5()函数也有同样的问题,在处理数组的时候,都将返回NULL 测试代码如下:

这里面的核心代码如下:

同样利用md5()函数无法处理数组的这个漏洞,构造get请求拿到flag:

?username[]=a&password[]=b

五、字符串处理函数漏洞缺陷

理论

  • strcmp()函数:比较两个字符串(区分大小写).

用法如下:

int strcmp ( string $str1 , string $str2 )

具体的用法解释如下:

参数 `str1`第一个字符串。
参数 `str2`第二个字符串。
如果 `str1` 小于 `str2` 返回 `< 0`;
如果 `str1` 大于 `str2` 返回 `> 0`;
如果两者相等,返回 0。

这个函数接受到了不符合的类型,例如数组类型,函数将发生错误。但是在5.3之前的php中,显示了报错的警告信息后,将return 0 !!!! 也就是虽然报了错,但却判定其相等了。

  • ereg()函数:字符串正则匹配。
  • strpos()函数:查找字符串在另一字符串中第一次出现的位置,对大小写敏感。

这2个函数都是用来处理字符串的,但是在传入数组参数后都将返回NULL

实践

Boston Key Party CTF 2015: Northeastern Univ

题目描述

Of course, a timing attack might be the answer, but Im quite sure that you can do better than that. 题目给了一个登陆框:

考察点

  • 字符串处理函数漏洞缺陷

write-up

给出源代码如下:

分析一下核心登录代码如下:

if (strcmp($_GET['password'], $flag) == 0)

这里使用了==松散比较了$flag和通过GET方式提交的password的值,如果想等的话,拿到flag。这里用的是==松散性质的比较,再利用字符串处理数组时将会报错,在5.3之前的php中,显示了报错的警告信息后,将return 0。所有这里将password参数指定为数组,利用函数漏洞拿到flag:

拓展总结

除了strcmp()函数外,ereg()strpos()函数在处理数组的时候也会异常,返回NULL。测试代码如下:

将参数password赋值一个数组传递进去:

http://localhost/?password[]=gg

ereg()函数是处理字符串的,传入数组后返回NULLNULLFALSE,是不恒等(===)的,满足第一个if条件;而strpos()函数也是处理字符串的,传入数组后返回NULL,NULL!==FALSE,满足条件,拿到flag:

六、parse_str函数变量覆盖缺陷

理论

parse_str函数的作用就是解析字符串并注册成变量,在注册变量之前不会验证当前变量是否存在,所以直接覆盖掉已有变量。

void parse_str ( string $str [, array &$arr ] )

str 输入的字符串。 arr 如果设置了第二个变量 arr,变量将会以数组元素的形式存入到这个数组,作为替代。

实践

测试代码:

考察点

  • parse_str变量覆盖缺陷

write-up

找到核心代码:

因为这里用到了parse_str函数来传递b,if的语句的条件是拿$a[0]来比较的,有因为这里的变量a的值已经三是固定的了:

$a = "www.sqlsec.com";

这里其实是我博客的地址~~ 不过不重要。 整体代码乍看起来又不可能,但是利用变量覆盖函数的缺陷这里可以对a的变量进行重新赋值,后面的的if语句再利用本文前面提到的md5()比较缺陷进行绕过:

http://localhost/?b=a[0]=240610708

参考文献

  • PHP 比较运算符
  • PHP Float 浮点型
  • PHP 类型比较表
  • PHP 弱类型总结
  • PHP Hash比较存在缺陷,影响大量Web网站登录认证、忘记密码等关键业务
  • PHP代码审计片段讲解(入门代码审计、CTF必备)
  • 浅谈PHP弱类型安全
  • NJCTF2017 线上赛 web 题解
  • CTF之PHP黑魔法总结
  • Some features of PHP in CTF
  • PHP浮点数运算精度的问题
  • php strcmp()漏洞
  • 危险的is_numeric——PHPYun 2015-06-26 二次注入漏洞分析
  • 【代码审计】变量覆盖漏洞详解

*本文作者:国光,转载请注明FreeBuf.COM

原文发布于微信公众号 - FreeBuf(freebuf)

原文发表时间:2018-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏python3

python3--面向对象--综合练习

3  解释生成器(generator)与函数的不同,并实现且使用简单generator

16520
来自专栏性能与架构

nginx location配置

location在nginx中起着重要作用,对nginx接收到的请求字符串进行处理,如地址定向、数据缓存、应答控制、代理转发等 location语法 locat...

34360
来自专栏CDA数据分析师

Python | 十个Python程序员易犯的错误

不管是在学习还是工作过程中,人都会犯错。虽然Python的语法简单、灵活,但也一样存在一些不小的坑,一不小心,初学者和资深Python程序员都有可能会栽跟头。本...

308100
来自专栏xingoo, 一个梦想做发明家的程序员

const指南

基本词义  意思就就是说利用const进行修饰的变量的值在程序的任意位置将不能再被修改,就如同常数一样使用!  使用方法 const int a=1;//这里定...

205100
来自专栏PHP在线

mysql数据类型详解(1)

优化设计不良或索引不佳的架构能把性能提升几个数量级。如果需要高性能,就必须运行特定的查询设计架构和索引,还要评估不同类型查询的性能要求,因为更改某个查询或架构的...

36480
来自专栏C语言及其他语言

Python程序员最常犯的十个错误

来源:编程派 ? 不管是在学习还是工作过程中,人都会犯错。虽然Python的语法简单、灵活,但也一样存在一些不小的坑,一不小心,初学者和资深Python程序...

33870
来自专栏程序员互动联盟

【答疑释惑】C++异常处理是咋回事?

疑惑一 C++的异常处理 一、什么是异常处理 一句话:异常处理就是处理程序中的错误。 二、为什么需要异常处理,以及异常处理的基本思想 C++ 之父Bjarne ...

33550
来自专栏前端下午茶

JS 利用高阶函数实现函数缓存(备忘模式)

高阶函数就是那种输入参数里面有一个或者多个函数,输出也是函数的函数,这个在js里面主要是利用闭包实现的,最简单的就是经常看到的在一个函数内部输出另一个函数,比如

82530
来自专栏C/C++基础

Google C++编程风格指南(二)之函数的相关规范

定义:内联函数是指用inline关键字修饰的函数。在类内定义的函数被默认成内联函数。

10420
来自专栏机器学习算法与Python学习

10个Python面试常问的问题

源 | segmentfault,小象学院 文 | xiaochao 概述 Python是个非常受欢迎的编程语言,随着近些年机器学习、云计算等技术的发展...

54390

扫码关注云+社区

领取腾讯云代金券