拒绝基本的小笔记 2018-04-07
cut命令
cut命令主要用于裁剪文本每行中的数据
-b:以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了-n标志。
-c:以字符为单位进行分割。
-d:自定义分隔符,默认为制表符。
-f:与-d一起使用,指定显示哪个区域。
-n:取消分割多字节字符。仅和-b标志一起使用。如果字符的最后一个字节落在由-b标志的List参数指示的范围之内,该字符将被写出;否则,该字符将被排除。
-s表示不包括那些不含分隔符的行,只切割和显示匹配的字符
-c和-f参数可以跟以下子参数:
m第m个字符或字段
m-从第m个字符或字段到文件结束
m-n从第m个到第n个字符或字段
-n从第1个到第n个字符或字段
[jeck@localhost ~]$ cat test
aa aa
bb aa
cc aa
dd AA
[jeck@localhost ~]$ cut -b 1 test
a
b
c
d
[jeck@localhost ~]$ cat test
星期一
星期二
星期三
星期四
[jeck@localhost ~]$ cut -b 3 test
?
?
?
?
[jeck@localhost ~]$ cut -c 3 test
一
二
三
四
-c处理的是一个字符,而-b处理的是一个字节。所以。当出现汉字时,使用-b就会乱码,可以加-n,使不拆分字节
[jeck@localhost ~]$ cat test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
[jeck@localhost ~]$ cut -d : -f 2 test
b
2
11
nn
[root@localhost tmp]# cut -d : -f1,2 test
a:b
1:2
aa:11
dd:nn
[root@localhost tmp]# cut -d : -f1-3 test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
[root@localhost tmp]# cat test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
vv-aa-22
dd-44-55
[root@localhost tmp]# cut -d : -f1 test下面两行不匹配,会全部打印
a
1
aa
dd
vv-aa-22
dd-44-55
[root@localhost tmp]# cut -d : -f1-s test加-s之后,只切割匹配的
a
1
aa
dd
[root@localhost tmp]# cut -d : -f1,3-s --output-delimiter="****" test
a****c
1****3
aa****bb
dd****mm
使用sort -n l即可
[jeck@localhost ~]$ cat test1
aa bb
1122
[jeck@localhost ~]$ sed-n l test1
aa bb$
11\t22$
如果是制表符(TAB),那么会显示为\t符号,如果是空格,就会原样显示