chumeng 2011-06-04
前言:某些目标初始化开销较大,例如从磁盘读取一个大文件,并关联到目标,可能耗时较久.在CGI环境下,每个请求都要new()一次目标,就会性能低下.而mod_perl的多进程预创建目标模式,可以很好的解决这个问题.
(一)安装mod_perl
这里使用主流的apache2.0和modperl2版本.
默认安装的Apache2都支持DSO方式加载第三方模块,在编译modperl2时只须指定对应的apxs即可.
另外Perl对线程的支持一直有问题,因此Apache2在编译时最好指定以prefork方式运行(--with-mpm=prefork).
从http://perl.apache.org/download/下载modperl,解开后进入其目录,如下安装:
perlMakefile.PLMP_APXS=/path/apache2/bin/apxs
make
maketest
makeinstall
这里假设apache2.0已安装在/path/apache2下.检查/path/apache2/conf/httpd.conf,确认modperl安装后添加了该行:
LoadModuleperl_modulemodules/mod_perl.so
表示Apache启动时加载mod_perl模块.
(二)安装Apache2::Request
Apache2::Request是包含modperl2下的请求处理方式的类库.它的作用类似于CGI.pm,但用C语言写成,比CGI.pm快很多.
以root用户运行CPANshell:perl-MCPAN-eshell
然后在CPANshell里输入:installApache2::Request进行安装.安装过程中一般会有提示,须手工指定apache2的apxs文件的路径.如果在maketest时不成功,那么forceinstall即可:
cpan>lookApache2::Request
#installApache2::Request
安装完后修改apache2的httpd.conf,增加一行如下:
LoadModuleapreq_modulemodules/mod_apreq2.so
表示Apache启动时加载mod_apreq2模块.
另外,设置LD_LIBRARY_PATH环境变量,对Linux系统,最简单的做法是在/etc/ld.so.conf里加进:
/usr/local/lib#默认makeinstall的libapreq2安装在/usr/local下
/path/apache2/lib#apache2安装目录
然后执行ldconfig使其生效.
最后restartapache,查看error_log,若有如下提示:
Apache/2.0.59(Unix)mod_apreq2-20051231/2.6.0mod_perl/2.0.3Perl/v5.8.5configured
则表示modperl2和Apache2::Request已安装成功(当然httpd.conf里的ServerTokens须设置为Full).
(三)开始编程之前
在开始modperl编码之前,需要做一些基本的配置工作.
首先在/path/apache2下创建一个子目录,该目录用于存放自己编写的modperl库文件,并且将该目录添加进modperl运行环境的@INC变量.这个变量包含了modperl需要引用的库路径.
mkdir/path/apache2/run
这里假设创建的子目录名为run.将run添加进modperl的@INC有好几种方法,一般的做法是写进modperl的启动配置文件(通常名为startup.pl).startup.pl还会预加载一些modperl常用类库,这些类库会被多个Apache子进程共享,避免启动后的重复加载.
在run子目录下,创建startup.pl,内容如下:
usestrict;
uselibqw(/path/apache2/run);
useApache2::RequestRec();
useApache2::RequestIO();
useApache2::Request();
1;
uselib这一行即将run子目录添加进modperl运行环境的@INC中.
其他三个Apache2::*库是modperl2常用的几个类库.Apache2::*名字空间下有很多类库,除上述外,还有:
Apache2::Connection();
Apache2::RequestUtil();
Apache2::ServerUtil();
Apache2::ServerRec();
Apache2:og();
之类...详情可参考它们在cpan上的文档.
不要忘记最后的那个1,它表示返回一个真值给调用者.
修改httpd.conf,增加一行:
PerlPostConfigRequire/path/apache2/run/startup.pl
表示在Apache启动过程中,(尽可能晚的)执行上述modperl配置脚本.
补充一点,在手工运行modperl脚本时,由于@INC不包含这个目录,就会造成问题.可以在运行脚本前,
exportPERL5LIB=/path/apache2/run
来解决问题.但每次都敲这个命令也很烦,因此直接将这句写进/etc/profile,就一劳永逸了.
(四)创建一个目标
从CPAN下载安装本人所写的IP::ChinaISP模块,该模块的作用是对指定的中国IP,返回对应的ISP.因为在中国,不同ISP之间的互联互通非常慢,所以利用该模块,可实现一些基于用户访问IP的CDN系统.
模块使用方法很简单:
useIP::ChinaISP;
my$cnisp=IP::ChinaISP->new;
my$isp=$cnisp->ip_isp('12.34.56.78');
$isp变量即存储了12.34.56.78这个IP对应的ISP(如果有的话).
IP::ChinaISP->new表示创建一个对象,这个过程中,会解析IP-ISP的数据文件,并将数据绑定到对象,因此耗时较久.测试了1000次new()过程,平均每次创建对象耗时16.103毫秒.若用该模块提供CGIweb服务,则每个用户请求都会创建一个对象,效率无疑低下.
下面描述如何利用modperl来提高效率.
(五)mod_perl的多进程预创建目标
在mod_perl环境下,Apache启动时可以预创建目标,并且该目标在Apachefork子进程时,被所有子进程复制一份.这样在每个子进程里,直接使用已创建好的目标,不用重复创建.
前面已经描述,可以在startup.pl里预加载类库,同样也可以在这个文件里预创建目标.但是,简单在startup.pl里写:
useIP::ChinaISP;
our$cnisp=IP::ChinaISP->new;
不行.由于没有独立的包空间,从外部无法访问这个对象.
因此,有必要把创建目标的陈述放在独立的package里.前面已经定义好/path/apache2/run为modperl运行的库目录,在该目录下创建package即可.如下执行:
cd/path/apache2/run
mkdirIP
cdIP
viInitdb.pm
Initdb.pm即为初始化目标的package,内容如下:
packageIP::Initdb;
usestrict;
useIP::ChinaISP;
our$cnisp=IP::ChinaISP->new;
subinitdb{$cnisp}
1;
这里的our$cnisp=IP::ChinaISP->new;即表示创建IP::ChinaISP对象,并将其储藏在包变量$cnisp里.然后在外部可以直接通过包变量来访问这个对象,或通过方法initdb来返回对象.
修改startup.pl,加进一句:
useIP::Initdb;
这样在Apache启动时,对象就被创建好,并复制到所有Apache子进程.
(六)如何使用预创建目标
可以在自定义的Apache处理器里,使用上述对象.假设对目标站点的/iploc路径的请求,都由自己的Apachehandler来处理,则如下做.
修改httpd.conf,加进如下配置:
<Location/iploc>
SetHandlermodperl
PerlResponseHandlerIP:uery
</Location>
IP:uery即是一个modperl处理器,它同样位于前面定义好的库目录/path/apache2/run下.
进入/path/apache2/run/IP,创建Query.pm,内容如下:
packageIP:uery;
usestrict;
useApache2::RequestRec();
useApache2::RequestIO();
useApache2::Const-compile=>qw(OK);
useApache2::Request();
useIP::Initdb;
subhandler{
my$r=shift;
my$req=Apache2::Request->new($r);
my$ip=$req->param('ip');
my$cnisp=IP::Initdb->initdb;
my$isp=$cnisp->ip_isp($ip);
$r->content_type('text/plain');
$r->print($isp);
returnApache2::Const::OK;
}
1;
my$cnisp=IP::Initdb->initdb;表示获取预创建目标.my$isp=$cnisp->ip_isp($ip);表示调用目标方法,根据IP取得ISP.
配置好上述所有后,restartApache.然后从浏览器发布请求,例如:
http://example.com/iploc/?ip=202.96.128.68
可看到返回结果.
该WEB服务效率极高,用Apache自带的压力测试工具ab进行测试,共发起100个请求,并发10个,全部处理完只用了0.125秒.测试结果摘录如下:
DocumentPath:/iploc/?ip=202.96.128.68
DocumentLength:11bytes
ConcurrencyLevel:10
Timetakenfortests:0.125seconds
Completerequests:100
Failedrequests:0
Brokenpipeerrors:0
Totaltransferred:19500bytes
HTMLtransferred:1100bytes
Requestspersecond:800.00[#/sec](mean)
Timeperrequest:12.50[ms](mean)
Timeperrequest:1.25[ms](mean,acrossallconcurrentrequests)
Transferrate:156.00[Kbytes/sec]received