前言

在看代码的时候遇到了PHP的一些函数,有些函数的特性很魔性,并不好理解。

于是尝试搭建环境对PHP源码进行调试,希望更加深入的一些理解PHP的特性。

必备安装

目标:在Windows环境下,构建PHP7.2的源代码编译和调试环境

安装VisualStudio

首先需要安装最强IDEVisual Studio,这个软件的版本有很多,我选择的是Visual Studio Professional 2017 (version 15.7)。
下载链接:
ed2k://|file|mu_visual_studio_professional_2017_version_15.3_x86_x64_11100064.exe|1069960|900673A59F0798822207F72FAA0DA6A9|/
需要其他版本(VS2015等),可以到MSDN上的开发人员工具栏目自行选择下载即可。安装过程非常简单,注意两个调试必备勾选,其他的选项根据自己需求选择
PHP SDK是用于Windows PHP构建的工具包,也是必不可少的工具。
下载地址:
https://github.com/Microsoft/php-sdk-binary-tools
我选择的版本为最新版php-sdk-2.1.7。

 PHP

本文主角,我选择的版本为PHP 7.2.1。
下载地址:
https://github.com/php/php-src
下载完成后使用Git Bash切换分支

cd php-src
git checkout PHP-7.2.1

 编译PHP

进入php-sdk的目录,可以看到目录下面有4个Windows批处理文件
前面安装的是Visual Studio 2017,操作系统也是64位的,因此这里选择phpsdk-vc15-x64.bat,打算编译64位的。
在php-sdk目录打开CMD窗口,运行phpsdk-vc15-x64.bat。
可以发现有了新的Shell提示符$。继续在新的shell下运行命令

phpsdk_buildtree phpdev
这时候我们会发现php-sdk这个目录下面会多一个名为phpdev的文件夹。
注意Shell的运行路径也发生了变化php-sdk\phpdev\vc15\x64\。
再将php-src整个文件夹移动至php-sdk\phpdev\vc15\x64\下面。
然后shell中进入php-src目录,执行命令,下载依赖关系组件。

phpsdk_deps --update --branch maste
成功信息如下:
运行buildconf.bat生成的configure文件,配置好参数,执行命令如下

configure --disable-all --enable-cli --enable-debug
成功信息如下:
执行编译命令nmake
编译成功信息为:

SAPI sapi\cli build complete
可执行的二进制文件路径为

php-sdk\phpdev\vc15\x64\php-src\x64\Debug_TS\php.exe
观察是否输出php信息,编译成功则输出

php.exe -v

调试配置

断点调试的需要一个趁手的工具,可以使用之前安装的Visual Studio 2017,但我个人选择的是轻量级的Vs code。安装Vs code,然后这里需要安装C/C++的拓展,调试的方式为启动调试。
点击调试 –> 打开配置,设置配置文件launch.json的参数如下

  • program,二进制可执行文件路径。
  • args,同目录下运行的PHP文件,也就是我们要调试的文件
  • cwd,二进制可执行文件目录
点击调试按钮,即可开始调试。

调试getimagesize函数

这里选择getimagesize这个函数进行断点调试。
探究为何这个函数如何加载网络图片资源;为何这个函数在Windows下<为通配符,

修改调试的1.php内容如下

<?php
getimagesize("http://www.rai4over.cn/images/avatar.jpg");
#getimagesize("./avatar.jpg");
?>
在php-sdk\phpdev\vc15\x64\php-src\ext\standard\image.c中设置getimagesize的断点
点击调试后程序会停在这里则表示断点成功。
通常会使用F10,F11进行调试。
– F10,单步跳过,调试时不进入函数内部。
– F11,单步调试,调试时进入函数内部。
比较麻烦的,单纯的F11调试耗费时间,而F10又可能跳过函数关键函数,难以定位。于是我便采F10为主,提升调试效率,一边F10,一边打开Wireshark观察HTTP请求流量。当过某个函数产生流量后,再F11进入函数内部进行调试。
最终得到函数调用栈(由下至上):
  • send
  • php_sockop_write
  • _php_stream_write_buffer
  • _php_stream_write
  • php_stream_url_wrap_http_ex
  • php_stream_url_wrap_http
  • _php_stream_open_wrapper_ex
  • php_getimagesize_from_any
  • PHP_FUNCTION
send()是Windows Api,能够通过已经建立的连接发送数据。在phpdev\vc15\x64\php-src\main\streams\xp_socket.c第77行被调用。

didwrite = send(sock->socket, buf, XP_SOCK_BUF_SIZE(count), (sock->is_blocked && ptimeout) ? MSG_DONTWAIT : 0);
这也是这个函数加载网络图片资源的原因,之前印象中一直以为只能获取本地资源,踩过大坑。修改为获取本地图片资源

<?php
#getimagesize("http://www.rai4over.cn/images/avatar.jpg");
getimagesize("./avatar.jpg");
?>
函数栈调用
在php-sdk\phpdev\vc15\x64\php-src\Zend\zend_virtual_cwd.c第841行,发现调用了FindFirstFileExW()函数。

hFind = FindFirstFileExW(pathw, FindExInfoBasic, &dataw, FindExSearchNameMatch, NULL, 0);
这个函数就是<为通配符的原因,因此其他调用FindFirstFileExW()的函数应该也同样存在该问题。