本文共 2961 字,大约阅读时间需要 9 分钟。
-- Start
如果你还不知道什么是正则表达式或者不是很清楚,请先阅读。
ksh 的正则表达式和其他语言有一些区别,最重要的区别是,在 ksh 中, ? 代表任意一个字符,* 代表任意多个字符,那么它如何匹配次数呢?看看下面的表格吧。
操作符 描述*(exp) 贪婪匹配,匹配任意次+(exp) 贪婪匹配,匹配 1次或多次?(exp) 贪婪匹配,匹配 0或1次{N}(exp) 贪婪匹配,匹配 N 次{N,M}(exp) 贪婪匹配,匹配 N 到 M 次@(exp1|exp2|...) 贪婪匹配,匹配 exp1 或 exp2 ...*-(exp) 非贪婪匹配,匹配任意次+-(exp) 非贪婪匹配,匹配 1次或多次?-(exp) 非贪婪匹配,匹配 0或1次{N}-(exp) 非贪婪匹配,匹配 N 次{N,M}-(exp) 非贪婪匹配,匹配 N 到 M 次@-(exp1|exp2|...) 非贪婪匹配,匹配 exp1 或 exp2 ...!(exp) 匹配非 exp 的任何东西[:word:] 匹配字母或下划线\d 匹配数字,同[[:digit:]]\D 匹配非数字,同[![:digit:]]\s 匹配空白字符,同[[:space:]]\S 匹配非空白字符,同[![:space:]]\w 匹配匹配字母或下划线,同[[:word:]]\W 匹配非匹配字母或下划线,同[![:word:]]下面是使用正则表达式的一个简单例子。
#!/bin/ksh ################################ 匹配typeset brithday='2013-06-25';if [[ ${brithday} = {4}(\d)-{2}(\d)-{2}(\d) ]]; then print "legal date" fi ################################ 替换typeset str="Zhang yi, zhang er, Zhuang Si, ZHANG WU"; # ${xx/pattern/replace} pattern 是个正则表达式,将变量 xx 中 pattern 匹配的字串替换成 replace 指定的字符串,非贪婪模式 print "\${xx/pattern/replace} : ${str/Z*(\w)/C\1}";# ${xx//pattern/replace} 同上,贪婪模式 print "\${xx//pattern/replace} : ${str//Z*(\w)/C\1}";# ~(+i:pattern) 表示 pattern使用忽略大小写匹配模式print "\${xx//pattern/replace} : ${str//~(+i:Z*(\w))/C\1}";# ksh 不支持 行首,行尾,单词边界 正则表达式,下面的方式实现了类似功能# ${xx/#pattern/replace} pattern 是个正则表达式,从变量 xx 开头查找 pattern 匹配的字串替,如果找到则换成 replace 指定的字符串,非贪婪模式print "\${xx/#pattern/replace} : ${str/#Z*(\w)/C\1}";# ${xx/%pattern/replace} pattern 是个正则表达式,查找变量 xx 是否以 pattern 匹配的字串替结尾,如果找到则换成 replace 指定的字符串,非贪婪模式print "\${xx/%pattern/replace} : ${str/%?(\w)/*}";################################ 删除子串# ${xx/pattern} pattern 是个正则表达式,删除变量 xx 中 pattern 匹配的子串,非贪婪模式 print "\${xx/pattern} : ${str/Z*(\w)}";# ksh 不支持 行首,行尾,单词边界 正则表达式,下面的方式实现了类似功能# ${xx#pattern} pattern 是个正则表达式,从变量 xx 开头查找 pattern 匹配的字串替,如果找到则删除,非贪婪模式print "\${xx#pattern} : ${str#Z*(\w)}";# ${xx##pattern} 同上,贪婪模式print "\${xx##pattern} : ${str##Z*(\w)}";# ${xx%pattern} pattern 是个正则表达式,查找变量 xx 是否以 pattern 匹配的字串替结尾,如果找到则删除,非贪婪模式print "\${xx%pattern} : ${str%W*(\w)}";# ${xx%%pattern} 同上,贪婪模式print "\${xx%%pattern} : ${str%%W*(\w)}";上面介绍的正则表达式有个缺陷,它只能匹配英语,如果你想匹配其他语言,你可以使用标准的 POSIX 语法,如下。
元字符(Metacharacter) 匹配(Matches)[[:alnum:]] 字母和数字[[:alpha:]] 字母[[:lower:]] 小写字母[[:upper:]] 大写字母[[:digit:]] 数字[[:blank:]] 空格和制表符[[:space:]] 空白字符[[:graph:]] 非空白字符[[:print:]] 类似[[:graph:]],但是包含空白字符[[:punct:]] 标点符号[[:cntrl:]] 控制字符[[:xdigit:]] 十六进制中容许出现的数字(例如 0-9a-fA-f)[. xx .] 将 xx 作为一个整体匹配, xx 可以是任何字母[= e =] 认为等价,在法语中匹配 e, è, 或 é
-- 更多参见:
-- 声 明:转载请注明出处
-- Last Updated on 2015-10-10
-- Written by ShangBo on 2015-09-25 -- End