awk用法小结

misszc 2012-11-14

awk用法小结

awk 用法:awk ' pattern {action} ' 

变量名含义

ARGC命令行变元个数

ARGV命令行变元数组

FILENAME当前输入文件名

FNR当前文件中的记录号

FS输入域分隔符,默认为一个空格

RS输入记录分隔符

NF当前记录里域个数

NR到目前为止记录数

OFS输出域分隔符

ORS输出记录分隔符

1、awk'/101/'file显示文件file中包含101的匹配行。

awk'/101/,/105/'file

awk'$1==5'file

awk'$1=="CT"'file注意必须带双引号

awk'$1*$2>100'file

awk'$2>5&&$2<=15'file

2、awk'{printNR,NF,$1,$NF,}'file显示文件file的当前记录号、域数和每一行的第一个和最后一个域。

awk'/101/{print$1,$2+10}'file显示文件file的匹配行的第一、二个域加10。

awk'/101/{print$1$2}'file

awk'/101/{print$1$2}'file显示文件file的匹配行的第一、二个域,但显示时域中间没有分隔符。

3、df|awk'$4>1000000'通过管道符获得输入,如:显示第4个域满足条件的行。

4、awk-F"|"'{print$1}'file按照新的分隔符“|”进行操作。

awk'BEGIN{FS="[:\t|]"}

{print$1,$2,$3}'file通过设置输入分隔符(FS="[:\t|]")修改输入分隔符。

Sep="|"

awk-F$Sep'{print$1}'file按照环境变量Sep的值做为分隔符。

awk-F'[:\t|]''{print$1}'file按照正则表达式的值做为分隔符,这里代表空格、:、TAB、|同时做为分隔符。

awk-F'[][]''{print$1}'file按照正则表达式的值做为分隔符,这里代表[、]

5、awk-fawkfilefile通过文件awkfile的内容依次进行控制。

catawkfile

/101/{print"\047Hello!\047"}--遇到匹配行以后打印'Hello!'.\047代表单引号。

{print$1,$2}--因为没有模式控制,打印每一行的前两个域。

6、awk'$1~/101/{print$1}'file显示文件中第一个域匹配101的行(记录)。

7、awk'BEGIN{OFS="%"}

{print$1,$2}'file通过设置输出分隔符(OFS="%")修改输出格式。

8、awk'BEGIN{max=100;print"max="max}BEGIN表示在处理任意行之前进行的操作。

{max=($1>max?$1:max);print$1,"Nowmaxis"max}'file取得文件第一个域的最大值。

(表达式1?表达式2:表达式3相当于:

if(表达式1)

表达式2

else

表达式3

awk'{print($1>4?"high"$1:"low"$1)}'file

9、awk'$1*$2>100{print$1}'file显示文件中第一个域匹配101的行(记录)。

10、awk'{$1=='Chi'{$3='China';print}'file找到匹配行后先将第3个域替换后再显示该行(记录)。

awk'{$7%=3;print$7}'file将第7域被3除,并将余数赋给第7域再打印。

11、awk'/tom/{wage=$2+$3;printfwage}'file找到匹配行后为变量wage赋值并打印该变量。

12、awk'/tom/{count++;}

END{print"tomwasfound"count"times"}'fileEND表示在所有输入行处理完后进行处理。

13、awk'gsub(/\$/,"");gsub(/,/,"");cost+=$4;

END{print"Thetotalis$"cost>"filename"}'filegsub函数用空串替换$和,再将结果输出到filename中。

123$1,200.00

123$2,300.00

123$4,000.00

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>1000&&$4<2000)c1+=$4;

elseif($4>2000&&$4<3000)c2+=$4;

elseif($4>3000&&$4<4000)c3+=$4;

elsec4+=$4;}

END{printf"c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"'file

通过if和elseif完成条件语句

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>3000&&$4<4000)exit;

elsec4+=$4;}

END{printf"c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"'file

通过exit在某条件时退出,但是仍执行END操作。

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>3000)next;

elsec4+=$4;}

END{printf"c4=[%d]\n",c4}"'file

通过next在某条件时跳过该行,对下一行执行操作。

14、awk'{printFILENAME,$0}'file1file2file3>fileall把file1、file2、file3的文件内容全部写到fileall中,格式为

打印文件并前置文件名。

15、awk'$1!=previous{close(previous);previous=$1}

{printsubstr($0,index($0,"")+1)>$1}'fileall把合并后的文件重新分拆为3个文件。并与原文件一致。

16、awk'BEGIN{"date"|getlined;printd}'通过管道把date的执行结果送给getline,并赋给变量d,然后打印。

17、awk'BEGIN{system("echo\"Inputyourname:\\c\"");getlined;print"\nYournameis",d,"\b!\n"}'

通过getline命令交互输入name,并显示出来。

awk'BEGIN{FS=":";while(getline<"/etc/passwd">0){if($1~"050[0-9]_")print$1}}'

打印/etc/passwd文件中用户名包含050x_的用户名。

18、awk'{i=1;while(i<NF){printNF,$i;i++}}'file通过while语句实现循环。

awk'{for(i=1;i<NF;i++){printNF,$i}}'file通过for语句实现循环。

typefile|awk-F"/"'

{for(i=1;i<NF;i++)

{if(i==NF-1){printf"%s",$i}

else{printf"%s/",$i}}}'显示一个文件的全路径。

用for和if显示日期

awk'BEGIN{

for(j=1;j<=12;j++)

{flag=0;

printf"\n%d月份\n",j;

for(i=1;i<=31;i++)

{

if(j==2&&i>28)flag=1;

if((j==4||j==6||j==9||j==11)&&i>30)flag=1;

if(flag==0){printf"%02d%02d",j,i}

}

}

}'

19、在awk中调用系统变量必须用单引号,如果是双引号,则表示字符串

Flag=abcd

awk'{print'$Flag'}'结果为abcd

awk '{print  "$Flag"}'   结果为$Flag

Shell String operations

shell字符串的截取

shell字符串的截取

Filed under: Shell |  

shell字符串的截取的问题:

一、Linuxshell截取字符变量的前8位,有方法如下:

1.exprsubstr“$a”18

2.echo$a|awk‘{printsubstr(,1,8)}’

3.echo$a|cut-c1-8

4.echo$

5.expr$a:‘\(.\\).*’

6.echo $a|dd bs=1 count=8 2>/dev/null

二、按指定的字符串截取

1、第一种方法:

${varible##*string}从左向右截取最后一个string后的字符串

${varible#*string}从左向右截取第一个string后的字符串

${varible%%string*}从右向左截取最后一个string后的字符串

${varible%string*}从右向左截取第一个string后的字符串

“*”只是一个通配符可以不要

例子:

$MYVAR=foodforthought.jpg

$echo${MYVAR##*fo}

rthought.jpg

$echo${MYVAR#*fo}

odforthought.jpg

2、第二种方法:${varible:n1:n2}:截取变量varible从n1到n2之间的字符串。

可以根据特定字符偏移和长度,使用另一种形式的变量扩展,来选择特定子字符串。试着在 bash 中输入以下行:

$EXCLAIM=cowabunga

$echo${EXCLAIM:0:3}

cow

$echo${EXCLAIM:3:7}

abunga

这种形式的字符串截断非常简便,只需用冒号分开来指定起始字符和子字符串长度。

三、按照指定要求分割:

比如获取后缀名

ls -al | cut -d “.” -f2

reference document

http://www.chinaunix.net/old_jh/24/691456.html

http://tech.foolpig.com/2008/07/09/linux-shell-char/

相关推荐