Linux 正则表达式笔记

bianhuakairi 2011-08-03

什么是正则表达式

Regular Expression

简单的说,正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为, 正则表达式透过一些特殊符号的辅助,可以让使用者轻易的达到『搜寻/删除/取代』某特定字符串的处理程序!

基础/延伸正则表达式 

 正则表达式的字符串表示方式依照不同的严谨度而分为: 基础正则表达式与延伸正则表达式

延伸正则表达式除了简单的一组字符串处理之外,还可以作群组的字符串处理, 例如进行搜寻 VBird 或 netman 或 lman 的搜寻,注意,是『或(or)』而不是『和(and)』的处理, 此时就需要延伸正则表达式的帮助啦!藉由特殊的『 ( 』与『 | 』等字符的协助, 就能够达到这样的目的!

Tips: 有一点要向大家报告的,那就是:『正规表示法与通配符是完全不一样的东西!』 这很重要喔!因为『通配符 (wildcard) 代表的是 bash 操作接口的一个功能』,但正则表达式是一种字符串处理的表示方式! 这两者要分的很清楚才行喔!所以,学习本章,请将前一章 bash 的通配符意义先忘掉吧!

支持正则表达式的工具

grep:一个最简单的字符串截取功能的工具程序

编码方式对正则表达式的影响

为什么编码方式会影响到正则表达式的输出结果呢?

由于不同编码方式编码数据并不相同,所以就会造成数据截取结果的差异了

使用正则表达式时,需要特别留意当时环境的编码方式为何, 否则可能会发现与别人不相同的截取结果喔!

相关推荐