RuoShangM 2020-04-06
grep:基于正则表达式查找到满足条件的行
grep patttern file
grep- i pattern file 忽略大小写
grep -v pattern file 不显示匹配行
grep -o pattern file 把每个匹配的内容用独立的行显示
grep -E pattern file 使用扩展正则表达式
grep -A -B -C pattern file 打印命中数据的上下文
grep pattern -r dir/ 递归搜索
ps:一般不会过滤文件,而是用管道|从上游获取输入
创建一个hello.txt文件,文件内容如下:
MINGW64 /e/shell/file_folder $ cat hello.txt hello from hogwarts Hello from hogwarts hello from sevenriby hello from testerhome
(1) 最简单的用法:查找包含“hello”关键词的行
MINGW64 /e/shell/file_folder $ grep hello hello.txt hello from hogwarts hello from sevenriby hello from testerhome
(2) grep -i ,不区分大小写
MINGW64 /e/shell/file_folder $ grep -i hello hello.txt hello from hogwarts Hello from hogwarts hello from sevenriby hello from testerhome
(3)grep -v:查找不包含关键词的行
MINGW64 /e/shell/file_folder $ grep -v hello hello.txt Hello from hogwarts
(4) grep -o :只把该行匹配的内容输出
MINGW64 /e/shell/file_folder $ grep -o hello hello.txt hello hello hello
(5)grep pattern -r dir/ 递归搜索:当要在某在目录下查找时
MINGW64 /e/shell $ grep hello -r file_folder/ file_folder/hello.txt:hello from hogwarts file_folder/hello.txt:hello from sevenriby file_folder/hello.txt:hello from testerhome
以上例子都是根据字符串进行查找,下面学习一下匹配正则表达式来查找。
我把正则表达式分为两类,第一类称为基本表达式,基本表达式包括了典型的正则标识符。
^表示开头;
$表示结尾;
[]表示任意匹配项;
*表示0个或多个;
.表示任意字符。
第二类是扩展表达式,它在基础表达式的基础上做了一些扩展,支持了更高级的语法和更复杂的条件。
?表示非贪婪匹配;
+表示一个或多个;
() 表示分组;
{} 表示一个范围的约束;
| 表示匹配多个表达式中的任何一个。
1 输出包含href的行
MINGW64 /e/shell/file_folder $ curl https://testing-studio.com/ | grep href
MINGW64 /e/shell/file_folder $ grep href filtering.txt
2 只显示匹配内容
MINGW64 /e/shell/file_folder $ curl https://testing-studio.com/ | grep -o href
3 查询该页面包含的所有链接
MINGW64 /e/shell/file_folder $ curl https://testing-studio.com/ | grep href | grep -o "http[^\"‘]*"
4 grep 同时满足多个关键字
① grep -E "word1|word2|word3" file.txt
满足任意条件(word1、word2和word3之一)将匹配。
② grep word1 file.txt | grep word2 |grep word3
必须同时满足三个条件(word1、word2和word3)才匹配。
5 grep 同时排除多个关键字
排除 abc.txt 中的 mmm nnn
grep -v ‘mmm|nnn‘ abc.txt