深入理解PHP原理之变量生命期(一)

对于PHP的中的数据来源, 不外乎有俩种:

  1. 1. 来自代码中
  2. 2. 来自外部(GET/POST/DB)

对于代码中的变量(也就是直接量)来说, 变量分配/赋值在编译期, 活跃在执行器, 在请求关闭期被销毁.对于这些变量来说, 使用APC进行Opcode缓存, 则会缓存这部分变量的值.

而对于来自外部的变量, 变量分配/赋值在编译器后, 执行期前, 在请求关闭期被销毁,对于这些变量来说, 使用APC进行OpCode缓存, 是不会被缓存的.

今天就着重关注下外部变量的一个部分,GET来的数据的整个生命周期.

假设, 有如下请求到来:

  1.      GET /index.php?name=laruence&career[]=yahoo&career[]=baidu

而, 在index.php中:

  1. <?php
  2.      $name      = $_GET['name'];
  3.      $career = $_GET['career']; //array

我们知道, 在最后的执行期, $_GET数组必然包含如下片段:

  1.      $_GET = array(
  2.           'name' => 'laruence',
  3.           'career' => array(
  4.                'yahoo', 'baidu',
  5.           ),
  6.      )

那么, 我们今天就重点关注下, Query String是如何构建成_GET数组的(关于GET变量的生成, 请一并阅读我之前的文章: “PHP的GET/POST等大变量生成过程“):

在请求到来时刻,php_request_startup(定义在main.c)被调用,来做初始化现场. 在这个过程中包括设置超时值,调用各个模块的请求初始化函数. 当然也包括我们关心的, 创建变量环境.

php_hash_environment根据php.ini中的variables_order来依次初始化各个预定义大变量, 那么对于$_GET来说:

  1. ...
  2. case 'g':
  3. case 'G':
  4.      if (!_gpc_flags[2]) {
  5.           sapi_module.treat_data(PARSE_GET, NULL, NULL TSRMLS_CC);
  6.           _gpc_flags[2] = 1;
  7.           if (PG(register_globals)) {
  8.                php_autoglobal_merge(&EG(symbol_table),
  9.                     Z_ARRVAL_P(PG(http_globals)[TRACK_VARS_GET]) TSRMLS_CC);
  10.           }
  11.      }
  12. break;
  13. ...

大体可以看出,这段逻辑,首先通过treat_data来生成变量hash(PG(http_globals)[TRACK_VARS_GET]), 如果打开了auto_register_globals,则再把$_GET数组中的变量加入到符号表中.

treat_data是属于sapi_module_struct中的一个成员:

  1.  注意:     本文基于apache2handler方式的sapi, 这个启动过程和之前的文章sapi
  2. 原理中的启动过程略有不同, php5通过注册apache2的ap_hook_post_config挂钩,
  3. 在apache server启动的时候启动php(php_apache_server_startup,定义在
  4. sapi/apache2hander/sapi_apache2.c中), 在这个函数中调用sapi_startup启动sapi,
  5. 继而通过调用php_apache2_startup来注册sapi module struct,
  6. 然后调用php_module_startup来初始化PHP, 其中又会初始化ZEND引擎,
  7. 以及填充zend_module_struct中的treat_data成员(通过php_startup_sapi_content_types)
  8. 为php_default_treat_data

现在回过头来继续看treat_data(也就是php_default_treat_data):

  1. ....
  2. if (arg == PARSE_GET) { /* GET data */
  3.      c_var = SG(request_info).query_string;
  4.      if (c_var && *c_var) {
  5.           res = (char *) estrdup(c_var);
  6.           free_buffer = 1;
  7.      } else {
  8.           free_buffer = 0;
  9.      }
  10. } else if (arg == PARSE_COOKIE) { /* Cookie data */
  11. ....

在上面的逻辑中, 给res复制为query_string, SG(request_info)是一个代表了当前请求信息的结构体, 其中query_string是在php_apache_request_ctor中通过复制apache的reqeust_rec结构体中的args而 来的.

对于本文的例子来说, 此时res即为”name=laruence&career[]=yahoo&career[]=baidu”,

继续在treat_data中, 随后的逻辑是:

  1. var = php_strtok_r(res, separator, &strtok_buf);
  2. ...
  3. while (var) {
  4.      val = strchr(var, '=');
  5.      if (arg == PARSE_COOKIE) {
  6.           /* Remove leading spaces from cookie names,
  7.                needed for multi-cookie header where ; can be followed by a space */
  8.           while (isspace(*var)) {
  9.                var++;
  10.           }
  11.           if (var == val || *var == '\0') {
  12.                goto next_cookie;
  13.           }
  14.      }
  15.      if (val) { /* have a value */
  16.           int val_len;
  17.           unsigned int new_val_len;
  18.           *val++ = '\0';
  19.           php_url_decode(var, strlen(var));
  20.           val_len = php_url_decode(val, strlen(val));
  21.           val = estrndup(val, val_len);
  22.           if (sapi_module.input_filter(arg, var, &val, val_len, &new_val_len TSRMLS_CC)) {
  23.                php_register_variable_safe(var, val, new_val_len, array_ptr TSRMLS_CC);
  24.           }
  25.           efree(val);
  26.      } else {
  27. ...

首先, 通过php_strtok_r把res根据”&”分割成一个一个的”key=value”段, 接下来分别为var和val复制为key和value, 注意到这个过程中会分别对var和val做php_url_decode.

最后通过php_register_variable_safe, 给array_ptr(此时指向PG(http_globals)[TRACK_VARS_GET], 也就是$_GET)添加一个名为var值为val的成员.

到了这一步, 我们的$_GET数组中, 就包含了如下的成员:

  1. 'name' => 'laruence',
  2. 'career' => array(
  3.      'yahoo', 'baidu',
  4. ),

未完待续(变量的销毁过程)…