浮生终有醒 2010-07-16
本文和大家重点讨论一下Perl文件系统的概念,本文所讲的函数多数使用了UNIX操作系统的特性,在非UNIX系统中,一些函数可能没有定义或有不同的工作方式,使用时请查看Perl联机文档。
Perl文件系统
本文所讲的函数多数使用了UNIX操作系统的特性,在非UNIX系统中,一些函数可能没有定义或有不同的工作方式,使用时请查看Perl联机文档。
一、Perl文件输入/输出函数
本节讲述从Perl文件中读取信息和向Perl文件写入信息的内置库函数。
1、基本I/O函数
一些I/O函数在前面的章节中已有讲述,如
open:允许程序访问Perl文件
close:终止Perl文件访问
print:Perl文件写入字符串
write:向Perl文件写入格式化信息
printf:格式化字符串并输出到Perl文件
这里简单回顾一下,再讲一些前面未提到的函数。
1)open函数
open函数将Perl文件变量与某Perl文件联系起来,提供访问Perl文件的接口,例如:open(MYVAR,"/u/file");如果Perl文件打开成功,则返回非零值,否则返回零。缺省地,open打开Perl文件用以读取其内容,若想打开Perl文件以写入内容,则在Perl文件名前加个大于号:open(MYVAR,">/u/file");向已有的Perl文件末尾添加内容用两个大于号:open(MYVAR,">>/u/file");若想打开Perl文件作为数据导向的命令,则在命令前加上管道符(|):open(MAIL,"|maildave");
2)用open重定向输入
可以把打开的Perl文件句柄用作向程序输入数据的命令,方法是在命令后加管道符(|),如:
open(CAT,"catfile*|");
对open的调用运行命令catfile*,此命令创建一个临时Perl文件,这个Perl文件的内容是所有以file打头的Perl文件的内容连接而成,此Perl文件看作输入Perl文件,可用Perl文件变量CAT访问,如:
$input=;
下面的例子使用命令w的输出来列出当前登录的所有用户名。
1:#!/usr/local/bin/perl 2: 3:open(WOUT,"w|"); 4:$time=<WOUT>; 5:$time=~s/^*//; 6:$time=~s/.*//; 7:;#skipheadingsline 8:@users=; 9:close(WOUT); 10:foreach$user(@users){ 11:$user=~s/.*//; 12:} 13:print("Currenttime:$time"); 14:print("Usersloggedon:\n"); 15:$prevuser=""; 16:foreach$user(sort@users){ 17:if($userne$prevuser){ 18:print("\t$user"); 19:$prevuser=$user; 20:} 21:}
结果输出如下:
Currenttime:4:25pm
Usersloggedon:
dave
kilroy
root
zarquon
w命令列出当前时间、系统负载和登录的用户,以及每个用户的作业时间和当前运行的命令,如:
4:25pmup1day,6:37,6users,loadaverage:0.79,0.36,0.28 Userttylogin@idleJCPUPCPUwhat davettyp02:26pm273w kilroyttyp19:01am2:271:0411-csh kilroyttyp29:02am431:4627rn rootttyp34:22pm2-csh zarquonttyp41:26pm44316ccmyprog.c kilroyttyp59:03am2:1448/usr/games/hack
上例中从w命令的输出中取出所需的信息:当前时间和登录的用户名。第3行运行w命令,此处对open的调用指定w的输出用作程序的输入,用Perl文件变量WOUT来访问该输入。第4行读取第一行信息,即:
4:25pmup1day,6:37,6users,loadaverage:0.79,0.36,0.28
接下来的两行从这行中抽取出时间。首先,第5行删除起始的空格,然后第6行删去除时间和结尾换行符之间的所有字符,存入变量$time。
第7行从WOUT读取第二行,这行中无有用信息,故不作处理。第8行把剩下的行赋给数组@users,然后第9行关闭WOUT,终止运行w命令的进程。
@users中的每个元素都是一行用户信息,因为本程序只需要每行的第一个单词,即用户名,故10~12行去掉除换行符外的其它字符,这一循环结束后,@users中只剩下用户名的列表。
第13行输出存贮在$time中的时间,注意这时print不需要加上换行符,因为$time中有。16~21行对@users中的用户名排序并输出。因为同一个用户可以多次登录,所以用$preuser存贮输出的最后一个用户名,下次输出数组元素$user时,如果其与$preser相等,则不输出。
3)Perl文件重定向
许多UNIXshell可以把标准输出Perl文件(STDOUT)和标准错误Perl文件(STDERR)都重定向到同一个Perl文件,例如在BourneShell(sh)中,命令
$foo>file12>&1
运行命令foo并把输出到标准输出Perl文件和标准错误Perl文件的内容存贮到Perl文件file1中。下面是用Perl实现这一功能的例子:
1:#!/usr/local/bin/perl 2: 3:open(STDOUT,">file1")||die("openSTDOUTfailed"); 4:open(STDERR,">&STDOUT")||die("openSTDERRfailed"); 5:printSTDOUT("line1\n"); 6:printSTDERR("line2\n"); 7:close(STDOUT); 8:close(STDERR);
运行后,Perl文件file1中的内容为:
line2
line1
可以看到,这两行并未按我们想象的顺序存贮,为什么呢?我们来分析一下这段程序。
第3行重定向标准输出Perl文件,方法是打开Perl文件file1将它与Perl文件变量STDOUT关联,这也关闭了标准输出Perl文件。第4行重定向标准错误Perl文件,参数>&STDOUT告诉Perl解释器使用已打开并与STDOUT关联的Perl文件,即Perl文件变量STDERR指向与STDOUT相同的Perl文件。第5、6行分别向STDOUT和STDERR写入数据,因为这两个Perl文件变量指向同一个Perl文件,故两行字符串均写到Perl文件file1中,但顺序却是错误的,怎么回事呢?
问题在于UNIX对输出的处理上。当使用print(或其它函数)写入STDOUT等Perl文件时,UNIX操作系统真正所做的是把数据拷贝到一片特殊的内存即缓冲区中,接下来的输出操作继续写入缓冲区直到写满,当缓冲区满了,就把全部数据实际输出。象这样先写入缓冲区再把整个缓冲区的内容输出比每次都实际输出所花费的时间要少得多,因为一般来说,I/O比内存操作慢得多。
程序结束时,任何非空的缓冲区都被输出,然而,系统为STDOUT和STDERR分别维护一片缓冲区,并且先输出STDERR的内容,因此存贮在STDERR的缓冲区中的内容line2出现在存贮在STDOUT的缓冲区中的内容line1之前。
为了解决这个问题,可以告诉Perl解释器不对Perl文件使用缓冲,方法为:
1、用select函数选择Perl文件
2、把值1赋给系统变量$|
系统变量$|指定Perl文件是否进行缓冲而不管其是否应该使用缓冲。如果$|为非零值则不使用缓冲。$|与系统变量$~和$^协同工作,当未调用select函数时,$|影响当前缺省Perl文件。下例保证了输出的次序:
1:#!/usr/local/bin/perl 2: 3:open(STDOUT,">file1")||die("openSTDOUTfailed"); 4:open(STDERR,">&STDOUT")||die("openSTDERRfailed"); 5:$|=1; 6:select(STDERR); 7:$|=1; 8:printSTDOUT("line1\n"); 9:printSTDERR("line2\n"); 10:close(STDOUT); 11:close(STDERR);
程序运行后,Perl文件file1中内容为:
line1
line2
第5行将$|赋成1,告诉Perl解释器当前缺省Perl文件不进行缓冲,因为未调用select,当前的缺省Perl文件为重定向到Perl文件file1的STDOUT。第6行将当前缺省Perl文件设为STDERR,第7行又设置$|为1,关掉了重定向到file1的标准错误Perl文件的缓冲。由于STDOUT和STDERR的缓冲均被关掉,向其的输出立刻被写到Perl文件中,因此line1出现在第一行。
4)指定读写权限
打开一个既可读又可写的Perl文件方法是在Perl文件名前加上"+>",如下:
open(READWRITE,"+>file1");
此语句打开既可读又可写的Perl文件file1,即可以重写其中的内容。Perl文件读写操作最好与库函数seek和tell一起使用,这样可以跳到Perl文件任何一点。
注:也可用前缀"+<"指定可读写权限。
5)close函数
用于关闭打开的Perl文件。当用close关闭管道,即重定向的命令时,程序等待重定向的命令结束,如:
open(MYPIPE,"catfile*|");
close(MYPIPE);
当关闭此Perl文件变量时,程序暂停运行,直到命令catfile*运行完毕。
6)print,printf和write函数
print是这三个函数中最简单的,它向指定的Perl文件输出,如果未指定,则输出到当前缺省Perl文件中,如:
print("Hello,there!\n");
printOUTFILE("Hello,there!\n");
第一句输出到当前缺省Perl文件中,若未调用select,则为STDOUT。第二句输出到由Perl文件变量OUTFILE指定的Perl文件中。
printf函数先格式化字符串再输出到指定Perl文件或当前缺省Perl文件中,如:
printfOUTFILE(“Youoweme%8.2f",$owing);
此语句取出变量$owing的值并替换掉串中的%8.2f,%8.2f是域格式的例子,把$owing的值看作浮点数。
write函数使用输出格式把信息输出到Perl文件中,如:
select(OUTFILE);
$~="MYFORMAT";
write;
关于printf和write,详见《第x章格式化输出》。
7)select函数
select函数将通过参数传递的Perl文件变量指定为新的当前缺省Perl文件,如:
select(MYFILE);
这样,MYFILE就成了当前缺省Perl文件,当对print、write和printf的调用未指定Perl文件时,就输出到MYFILE中。
8)eof函数
eof函数查看最后一次读Perl文件操作是否为Perl文件最后一个记录,如果是,则返回非零值,如果Perl文件还有内容,返回零。
一般情况下,对eof的调用不加括号,因为eof和eof()是等效的,但与<>操作符一起使用时,eof和eof()就不同了。现在我们来创建两个Perl文件,分别叫做file1和file2。file1的内容为:
Thisisalinefromthefirstfile.
Hereisthelastlineofthefirstfile.
file2的内容为:
Thisisalinefromthesecondandlastfile.
Hereisthelastlineofthelastfile.
下面就来看一下eof和eof()的区别,第一个程序为:
1:#!/usr/local/bin/perl 2: 3:while($line=<>){ 4:print($line); 5:if(eof){ 6:print("--endofcurrentfile--\n"); 7:} 8:}
运行结果如下:
$programfile1file2 Thisisalinefromthefirstfile. Hereisthelastlineofthefirstfile. --endofcurrentfile-- Thisisalinefromthesecondandlastfile. Hereisthelastlineofthelastfile. --endofcurrentfile-- $