haoweilaizoule 2013-02-05
用Open() 函数打开文件
打开文件的常用方法是:
代码如下:
open(FH, "< $filename") or die "Couldn't open $filename for reading: $!";
open() 函数通常带有两个参数,第一个为文件句柄,用于指向打开的文件,第二个参数是文件名及模式(文件的打开模式)的混合体,如果文件被成功打开,open()函数返回true,否则为false。我们用“or”来测试该条件。
上述代码中的模式由小于字符(<)来表示。如果文件不存在,open()将返回false。此时,你可以读文件句柄,但不可以写。
大于字符表示写。如果文件不存在,就会被创建。如果文件存在,文件被清除,以前的数据将会丢失。你可以写入文件句柄,但不可以读入。
代码如下:
# 如果文件不存在,就创建它 open(FH, "> $filename") or die "Couldn't open $filename for writing: $!";
如果文件不存在,添加模式(用两个大于符号表示)可以用来创建新文件,如果文件存在,该模式并不会清除原来的数据。
同“<”或“读”模式一样,你只能对文件句柄进行写操作。 (所以的写入内容都添加到文件尾)。企图进行读操作,会产生运行错误。
代码如下:
open(FH, ">> $filename") or die "Couldn't open $filename for appending: $!";
通过“+<”模式,你可以既可以读文件,又可以写文件。你可以通过tell() 函数在文件内部移动,通过seek()函数进行定位。如果文件不存在,就会被创建。如果文件已经存在,原来的数据不会被清除。
如果你打算清除原来的文件内容,或者自己调用truncate() 函数,或者使用“+>”模式。
代码如下:
open(FH, "+> $filename") or die "Couldn't open $filename for reading and writing: $!";
注意“+<”和“+>”的区别,两者都可以可读可写。前者为非破坏性写,后者为破坏性写。
错误
错误是如何出现的?很多地方都会出现错误:如目录不存在,文件不可写入,你的程序丢失了文件句柄等等。
你应该检查系统调用的结果 (如open() 和sysopen()),看看是否调用成功。
为了帮助用户查错,通常使用“or die()”,你应记住这些用法。首先,应写出系统调用失败(“open”)的信息。其次,应写出文件名的信息,以便修正错误时更容易地定位。第三,要写出打开文件的方式, (“for writing,”“for appending”)。第四,输出操作系统的出错信息(包含在$!中)。这样,一旦出现文件不能打开的问题,使用你的程序的用户会大体上知道为什么不能打开。有时,我们把第一个和第三个合并在一起:
or die "unable to append to $filename: $!";
如果在open() 和出错信息中都写了文件的全名,你会冒改变了open() 的风险,使得出错信息不合时宜或不正确。
代码如下:
# 下面会出现虚假的出错信息 open(FH, "</var/run/file.pid") or die "Can't open /var/log/file.pod for writing : $!";
代码如下:
use Fcntl; sysopen(FH, $filename, O_RDWR|O_CREAT, 0666) or die "Can't open $filename for reading/writing/creating : $!";
当你需要小心行事的时候,就使用sysopen() 函数,例如,如果你打算添加内容到文件中,如果文件不存在,不创建新文件,你可以这样写:
sysopen(LOG, "/var/log/myprog.log", O_APPEND, 0666)
or die "Can't open /var/log/myprog.log for appending: $!";
读入单个记录
有一个容易的方法读入filehandles:用 <FH> 操作符。在标量内容下,它返回文件中的下一个记录,或者返回未定义出错信息。我们可以使用它来把一行读入到一个变量中:
$line = <FH>;
die "Unexpected end-of-file" unless defined $line;
在循环语句中,我们可以这样写:
代码如下:
while (defined ($record = <FH>)) { # long-winded # $record is set to each record in the file, one at a time }
代码如下:
while (<FH>) { # $_ 每次为文件中的一个记录 } 在Perl 5.004_04中,我们可以这样做: while ($record = <FH>) { # $record 每次为文件中的一个记录 }
代码如下:
@records = <FH>; if (@records) { print "There were ", scalar(@records), " records read. "; }
代码如下:
if (@records = <FH>) { print "There were ", scalar(@records), " records read. "; }
什么是记录?
记录的缺省定义为:“行”。
记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“ ”。
例如,你可以用任何你想要替换的符号来代替“ ”。
$/ = ";";
$record = <FH>; # 读入下一个用分号分隔的记录
$/可以取其它两个有趣的值:空串("") 和undef。
读入段落
$/ =""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为" ",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“text ”,你既可以把它解释为一个段落 ("text"),也可以解释为两个段落 ("text", 后面跟两个换行符,以及一个空段落,后面跟两个空行。)
在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。
代码如下:
$/ = " "; while (<FH>) { chomp; next unless length; # 跳过空段 # ... }
读入整个文件
$/ 的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:
代码如下:
undef $/; $file = <FH>;
代码如下:
{ local $/ = undef; $file = <FH>; }
代码如下:
undef $/; $line = <FH>; if ($line =~ /(b.*grass)$/) { print "found "; }
代码如下:
while (<FH>) { if (/19(.*)$/) { if ( < 20) { $year = 2000+; } else { $year = 1900+; } } }
代码如下:
if (ms) { print "Found bold text: "; }
代码如下:
if (m{^<FONT COLOR="red">(.*?)</FONT>}sm) { # ... }