码迷,mamicode.com
首页 > 其他好文 > 详细

nginx源码分析--模块分类

时间:2014-05-25 23:14:00      阅读:242      评论:0      收藏:0      [点我收藏+]

标签:nginx

ngx-modules

Nginx 主要的模块大致可以分为四类:

  • handler – 协同完成客户端请求的处理、产生响应数据。比如模块, ngx_http_rewrite_module, ngx_http_log_module, ngx_http_static_module

  • filter – 对 handler 产生的响应数据做各种过滤处理。比如模块, ngx_http_not_modified_filter_module, ngx_http_header_filter_module

  • upstream – upstream 模块使 Nginx 可以充当反向代理,只对客户端请求进行转发。比 如,ngx_http_proxy_module, ngx_http_fastcgi_module

  • loadbalance – 在 Nginx 充当反向代理时,通过 loadbalance 模块的策略选择处理某次 请求的后端服务器节点。

比如,对一个普通的访问本地静态文件的请求处理,从 Nginx 收到请求并开始处理,到处 理结果的响应包体发送到网络上结束,整个过程的两个步骤 – 请求处理和响应处理 – 分别 由 handler 和 filter 处理完成。

严格来说,upstream 模块 (proxy, fastcgi 等),也是请求处理的一部分,它们从网络获 取请求的响应内容。

下面只分析一下 handler 模块和 filter 模块的注册和调用逻辑。

handler 模块

Nginx 将请求的处理阶段分为了下面列出的11个 phase ,如果某个 handler 模块需要在某 个 phase 中被调用时,需要在 postconfiguration 时将 handler 模块的入口函数注册到 Nginx 中。

    -----------http/ngx_http_core_module.h:86-------------
    typedef enum {
        NGX_HTTP_POST_READ_PHASE = 0,
        NGX_HTTP_SERVER_REWRITE_PHASE,
        NGX_HTTP_FIND_CONFIG_PHASE,
        NGX_HTTP_REWRITE_PHASE,
        NGX_HTTP_POST_REWRITE_PHASE,
        NGX_HTTP_PREACCESS_PHASE,
        NGX_HTTP_ACCESS_PHASE,
        NGX_HTTP_POST_ACCESS_PHASE,
        NGX_HTTP_TRY_FILES_PHASE,
        NGX_HTTP_CONTENT_PHASE,
        NGX_HTTP_LOG_PHASE
    } ngx_http_phases;

一个请求对应的 phase 会随着程序的执行发生变化。同时,在请求的实际处理过程中, 会因等待事件或者子请求等导致请求在不同的 phase 反复处理,但是在任意时刻,对某个 指定的客户端请求而言,它总是处于某个确定的 phase 中。这里先暂时将这个 phase 的转 化过程称为 phase machine。整个 phase machine 的退出点就是请求的完全处理结束。

处理函数注册

所有的 phase 和在各 phase 注册的入口函数,都临时保存在 ngx_http_core_modulemain conf 中的配置结构体 ngx_http_core_main_conf_tphases 成员中:

    ----------http/ngx_http_core_module.h:125-------------
    typedef struct {
        ngx_array_t                 handlers;
    } ngx_http_phase_t;

    typedef struct {
        ...
        ngx_http_phase_engine_t     phase_engine;
        ...
        ngx_http_phase_t            phases[NGX_HTTP_LOG_PHASE + 1]
    } ngx_http_core_main_conf_t;

ngx_http_rewrite_module 举例,其模块的 postconfiguration 对应回调函数 ngx_http_rewrite_init

    -----------http/modules/ngx_http_rewrite_module.c:104-----
    static ngx_http_module_t ngx_http_rewrite_module_ctx = {
        NULL,                               /* preconfiguration */
        ngx_http_rewrite_init,              /* postconfiguration */
        NULL,                               /* create main configuration */
        NULL,                               /* init main configuration */
        NULL,                               /* create server configuration */
        NULL,                               /* merge server configuration */
        ngx_http_rewrite_create_loc_conf,   /* create location configuration */
        ngx_http_rewrite_merge_loc_conf,    /* merge location configuration */
    };

ngx_http_rewrite_init 中,将 ngx_http_rewrite_module 的入口函数注册到了 NGX_HTTP_SERVER_REWRITE_PHASENGX_HTTP_REWRITE_PHASE 两个 phase 中:

    -----------http/modules/ngx_http_rewrite_module.c:266-------
    static ngx_int_t
    ngx_http_rewrite_init(ngx_conf_t *cf)
    {
        ...
        cmcf = ngx_http_conf_get_module_main_conf(cf, ngx_http_core_module);

        h = ngx_array_push(&cmcf->phases[NGX_HTTP_SERVER_REWRITE_PHASE].handlers;
        ...
        *h = ngx_http_rewrite_handler;

        h = ngx_array_push(&cmcf->phases[NGX_HTTP_REWRITE_PHASE].handlers;
        ...
        *h = ngx_http_rewrite_handler;
        ...
    }

然后,在所有 handler 模块的入口函数都注册完毕后,ngx_http_core_module 会将所有 入口函数封装成 ngx_http_phase_handler_t 类型变量后,线性化存储到 cmcf->phase_engine 中,同时在连续内存基础上,使用 next 成员再次生成一个链表 (通过数组索引链接)。ngx_http_phase_handler_t 类型变量的 checker 成员函数,决 定一个请求在 phase machine 中,在当前 phase 的当前 handler 函数处理完后,是该 调用同一 phase 中的下一个 handler 函数处理,还是直接进行下一个 phase (checker 可以认为是 phase 的调度函数)。

同时,在线性化过程中,还加入了 Nginx 内建 phase (find_config, post_rewrite, post_access, try_files)的 checker 函数,这些 phase 原本身并不和任何模块的 handler 处理函数相对应 。

    ---------http/ngx_http_core_module.h:111--------------
    sturct ngx_http_phase_handler_s {
        ngx_http_phase_handler_pt   checker;
        ngx_http_handler_pt         handler;
        ngx_uint_t                  next;
    };

    typedef struct {
        ngx_http_phase_handler_t    *handlers;
        ngx_uint_t                  server_rewrite_index;
        ngx_uint_t                  location_rewrite_index;
    } ngx_http_phase_engine_t;

线性化处理由函数 ngx_http_init_phase_handlers 完成,它在所有 http 模块的 postconfiguration 被调用完成后执行:

    ---------http/ngx_http.c:328------
    for (m = 0; ngx_modules[m]; m++) {
        ...
        if (module->postconfiguration) {
            if (module->postconfiguration(cf) != NGX_OK) {
                return NGX_CONF_ERROR;
            }
        }
    }
    ...
    if (ngx_http_init_phase_handlers(cf, cmcf) != NGX_OK) {
        return NGX_CONF_ERROR;
    }

ngx_http_init_phase_handlers 执行完后,各 phase 中注册的回调函数被封装成 ngx_http_phase_handler_t 类型的变量,其字段的 checker 和 next 最终值总结如下:

    phase                   checker                             next        
    ------------------------------------------------------------------------
    POST_READ       ngx_http_core_generic_phase         下一个 phase
    SERVER_REWRITE  ngx_http_core_generic_phase         下一个 phase
    FIND_CONFIG     ngx_http_core_find_config_phase     0
    REWRITE         ngx_http_core_generic_phase         下一个 phase
    POST_REWRITE    ngx_http_core_post_rewrite_phase    FIND_CONFIG phase
    PREACCESS       ngx_http_core_generic_phase         下一个 phase
    ACCESS          ngx_http_core_access_phase          下下一个 phase (跳过 post_access phrase)
    POST_ACCESS     ngx_http_core_post_access_phase     下一个 phase
    TRY_FILES       ngx_http_core_try_files_phase       0
    CONTENT         ngx_http_core_content_phase         NULL
    ------------------------------------------------------------------------

其中,各个 phase 的 checker 的行为如下:

    checker                             behavior
    ------------------------------------------------------------------------
    ngx_http_core_generic_phase         NGX_OK时,进入下一个 phase, 
                                        NGX_DECLINED时,下一个 handler
    ngx_http_core_find_config_phase     下一个 handler
    ngx_http_core_post_rewrite_phase    下一个 phase,即 FIND_CONFIG_PHASE
    ngx_http_core_access_phase          NGX_OK时,进入下一个 phase
                                        NGX_DECLINED, NGX_HTTP_FORBIDDEN, 
                                        NGX_HTTP_UNAUTHORIZED时,下一个 handler
    ngx_http_core_post_access_phase     r->access_code 不为0时,结束请求
                                        否则,继续下一个 handler
    ngx_http_core_try_files_phase       下一个 handler
    ngx_http_core_content_phase         下一个 handler,或者结束请求
    ------------------------------------------------------------------------

另外一个需要注意的地方是,在 ngx_http_init_phase_handlers 中,只给 cmcf->phase_engine.handlers 分配了多余的 sizeof(void *) 个字节用于存储 handlers 结束标识 NULL:

    ---------http/ngx_http.c:488---------------
    n = use_rewrite + use_access + cmcf->try_files + 1 /* find config phase */;

    for (i = 0; i < NGX_HTTP_LOG_PHASE; i++) {
        n += cmcf->phases[i].handlers.nelts;
    }

    ph = ngx_pcalloc(cf->pool, n * sizeof(ngx_http_phase_handler_t) + sizeof(void *));

而在随后的使用中,只检查了 ngx_http_phase_handler_t 的第一个字段,即 checker, 来判断是否到了 ngx_http_phase_handler_t 数组的末尾。这是有意为之,还是疏忽的地 方? 虽然代码可以正常运行,但是…

    --------http/ngx_http_core_module.c:836---------
    void 
    ngx_http_core_run_phases(ngx_http_request_t *r)
    {
        ...
        while (ph[r->phase_handler].checker) {
            rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]);
            ...
        }  
    } 

处理函数调用

在 Nginx 正常启动后,开始处理客户端请求。在处理客户端请求的过程中,就会根据请求 处于的 phase ,调用已注册到相应 phase 的回调函数,对请求进行处理。

当一个 HTTP 请求到达 Nginx 后,Nginx 会依次调用下面的处理函数 (先简单列出,等专 门再辟出一文对 HTTP 请求的“一生”进行详细描述):

    - ngx_http_init_connection
    - ngx_http_init_request
    - ngx_http_process_request_line
    - ngx_http_process_request_headers
    - ngx_http_process_request
    - ngx_http_handler
    - ngx_http_core_run_phasess

最后一个函数 ngx_http_core_run_phases 就是这个 phase machine 的驱动函数:

    -----------http/ngx_http_core_module.c:836--------
    void 
    ngx_http_core_run_phases(ngx_http_request_t *r)
    {
        ...
        cmcf = ngx_http_get_module_main_conf(r, ngx_http_core_module);

        ph = cmcf->phase_engine.handlers;

        while (ph[r->phase_handler].checker) {
            rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]);
            if (rc == NGX_OK) {
                return;
            }
        }
    }

随后,整个请求处理的主要逻辑都是在这个 phase machine 中完成的。详细的处理逻辑 以后再分析,这篇关注的是 handler 模块的注册和调用逻辑。

filter 模块

filter 模块的初始化时间和 handler 模块一样,都是在模块的 postconfiguration 回 调函数中完成。但是,与 handler 模块函数的注册方式不同的时,filter 模块的入口函数 不需要区分 phase,同时,所有的 filter 入口函数组成 output filter chain。每个请 求的响应数据都经过 output filter chain 中的每个 filter 入口函数进行处理,然后 才会发向网络。

响应数据由响应头和响应体两部分组成,分别经过响应头对应的 header output filter chain 和响应体对应的 body output filter chain 处理。

处理函数注册

output filter chain,使用两个全局变量 ngx_http_top_header ngx_http_top_body_filter 分别保存第一个 header filter 和 body filter 入口函数 的地址。每个 filter 模块的局部变量 ngx_http_next_header_filterngx_http_next_body_filter 保存当前 filter 模块执行完后需要调用的下一个 filter 模块的入口函数地址。这个 filter 链条在 Nginx初始化模块时完成, 比如ngx_http_addition_filter 模块的初始化函数如下:

    static ngx_int_t
    ngx_http_addition_filter_init(ngx_conf_t *cf)
    {
        ngx_http_next_header_filter = ngx_http_top_header_filter;
        ngx_http_top_header_filter = ngx_http_addition_header_filter;

        ngx_http_next_body_filter = ngx_http_top_body_filter;
        ngx_http_top_body_filter = ngx_http_addition_body_filter;

        return NGX_OK;
    }

header output filter chain 为例,Nginx在开始返回响应数据时,调用 ngx_http_top_header_filterngx_http_top_header_filter 指向的第一个 filter 模块的入口函数,第一个 filter 模块的入口函数处理完成以后,会调用其模块局部变量 ngx_http_next_header_filterngx_http_next_header_filter 指向的下一个 filter 模块的入口函数,以此类推,直到 ngx_http_header_filterngx_http_write_filter 模块将数据发回客户端,这个处理过程就完成了。

filter 模块入口函数的调用顺序由 filter 模块的初始化顺序决定,并且方向相反。模块 初始化顺序在 objs/ngx_modules.c 中定义:

     34 extern ngx_module_t  ngx_http_write_filter_module;
     35 extern ngx_module_t  ngx_http_header_filter_module;
     36 extern ngx_module_t  ngx_http_chunked_filter_module;
     37 extern ngx_module_t  ngx_http_range_header_filter_module;
     38 extern ngx_module_t  ngx_http_gzip_filter_module;
     39 extern ngx_module_t  ngx_http_postpone_filter_module;
     40 extern ngx_module_t  ngx_http_charset_filter_module;
     41 extern ngx_module_t  ngx_http_ssi_filter_module;
     42 extern ngx_module_t  ngx_http_userid_filter_module;
     43 extern ngx_module_t  ngx_http_headers_filter_module;
     44 extern ngx_module_t  ngx_http_copy_filter_module;
     45 extern ngx_module_t  ngx_http_range_body_filter_module;
     46 extern ngx_module_t  ngx_http_not_modified_filter_module;

可见,ngx_http_header_filter_modulengx_http_write_filter_module 最先被初 始化,那么,其提供的filter处理函数在整个响应处理过程中被最后调用。

body output filter chain 的生成方式和 header output filter chain 类似。

处理函数调用

在请求的响应内容准备完毕,开始向客户端发送响应数据时,Nginx 会使用 ngx_http_send_header将响应包头数据交给 header output filter chain 处理。包头 数据发送完成后,再使用 ngx_http_output_filter 将响应包体数据交给 body output filter chain 处理。

    -----------http/ngx_http_core_module.c:1702-----------
    ngx_int_t
    ngx_http_send_header(ngx_http_request_t *r)
    {
        if (r->err_status) {
            r->headers_out.status = r->err_status;
            r->headers_out.status_line.len = 0;
        }

        return ngx_http_top_header_filter(r);
    }

    ----------http/ngx_http_core_module.c:1713-------------
    ngx_int_t
    ngx_http_output_filter(ngx_http_request_t *r, ngx_chain_t *in)
    {
        ...
        rc = ngx_http_top_body_filter(r, in);
    }

随后的处理流程,就是按照 处理函数注册 中构造的 output filter chain 的顺序调用 各个 filter 模块的入口函数一步一步完成的。具体的逻辑,就和各个 filter 模块本身的 功能相关了。

nginx源码分析--模块分类,布布扣,bubuko.com

nginx源码分析--模块分类

标签:nginx

原文地址:http://blog.csdn.net/yusiguyuan/article/details/26953273

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!