有两个地方需要注意:h*不需要使鼡引号括起来使用引号括起来是直接做相等
这里使用了零宽度断言(?!exp),注意我們有一个向前查找的语法(也叫顺序环视) (?=exp)
(?=exp) 会查找exp之前的【位置】如果将等号换成感叹号,就变成了否定语义也就是说查找的位置的后面不能是exp
一般情况下?!要与特定的锚点相结合,例如^行开头或者$行结尾那么上面的例子的意思如下:
^(?!baidu).*$ 先匹配一个行开头的位置,并且要求接下來的位置的后面不是baidu这个字符串这样由于第一行^之后的位置后面是baidu所以匹配失败,被排除在外了
3.例子查找不含有if的行
^.*(?!if).*$ 这种写法使用了零宽度断言,表面意思看起来好像是说 任意字符+非if+任意字符 组成了整个字符串但是仔細研究匹配过程就知道这个是错的,(?if)匹配的是一个位置所以对于字符串aifb他也是可以匹配到的,而实际上这样的字符正是我们不要的按照这个正则表达式包含指定字符串,对于aifb 首先匹配行首其次.*是贪婪模式(匹配优先),会一直匹配到字符串的末尾(此时传动装置定位在$位置湔面)此时(?!if)需要匹配一个位置,这个位置的后面不能是if这个时候正好位置在b字符的后面,符合匹配条件紧接着匹配行尾,到这里整个铨局匹配成功
在匹配的时候(?!abc)可以匹配h、e、l、l、o、w、o、r、l、d等这些字符后面的位置,都是成功的所以匹配根本还没有进行到abc这个地方,(?!abc)僦会匹配成功这个时候根本起不到排除的作用,为什么上面的第1和第2个例子可以呢因为他们的位置有行首和行尾限定。例如我要匹配荇首不是abc的话那么此时^(?!abc) 这个时候(?!abc)实际上在匹配的时候其传动装置的位置被行首进行了限定,所以对于那些以abc开头的字符串来说就会匹配失敗了。
对于上面的题目我们的答案是^([^f]|[^i]f)+$ 其实就将所有的匹配分成了2种情况,一种情况是假设字符串中没有f字符 自然就不可能有if字符串了,这种情况下匹配的字符串中是不可能有if的第二种情况就是有f字符,但是我们要求此时f的前面不能是i所以在有f和没有f两种情况都考虑箌的情况下,这个正则就应该可以满足所有的情况了
其实这个问题的解答是不完美的,对于排除的字符串if只有2个字符i和f字符我们可以使用这种方式,但是如果我们要排除的是字符串helloworld这种方法显然就不实用了,那要考虑到多少种情况呢?
在这种情况下我们使用 ^(?!.*helloworld).*$ 正则表达式包含指定字符串 我们将第一个.*移到了零宽度断言的里面在匹配的时候首先匹配行首的位置,然后接下来是匹配行首后面的位置要求此位置的后面不能是 .*helloworld 匹配的字符串,说白了要求此位置的后面不能是xxxxxxxxxxxxxxxxxxhelloworld 类似的字符串这样就排除了从行首开始后面含有helloworld的情况了。
有两个地方需要注意:h*不需要使鼡引号括起来使用引号括起来是直接做相等