正则表达式高阶技巧之环视的组合(使用python实现)
创始人
2024-05-31 23:59:10
0

环视的组合

    • 介绍
    • 环视的组合
      • 环视中包含环视
      • 并列多个环视
        • 注意:
      • 环视作为多选分支排列在多选结构中
      • 断言与反向引用之间的关系

介绍

在我们日常使用的编程语言都是支持环视的,但是语言不同,支持程度也就不同,下面具体介绍一下在python中的支持:

  • 一般来说,所有语言都是支持环视的,而且是没有限制。也就是说,无论你是使用肯定顺序环视,还是否定顺序环视,都可以在结构中使用各种复杂的表达式
  • 但是在python中规定:逆序环视中的表达式能匹配的文本长度必须是固定的,也就是说,(?<=cat)是合法的, (?<=(cat|dog))也是合法的,因为环视中的子表达式能匹配的文本都是固定的; 而((?<=(cats|dog)))(?<=dogs?) 则都是不合法的,因为环视的子表达式能匹配的文本长度是不确定的
  • 要解决上诉问题:可以使用多选结构来改造表达式,比如,cats?等价于(dog|dogs),所以可以将上述的环视结构改写为((?<=cat)|(?<=cats)),同样是,((?<=(cats|dog)))也可以修改为((?<=cats)|(?<=dog));但是上述的方法的应用场景是非常有限的,如果逆序环视的表达式较为复杂,使用多选结构列出就略显不便;而且一旦表达式中出现了*+这类的量词,就不能再使用多选结构列出了

环视的组合

  • 环视匹配的并不是字符,而是位置。在正则表达式匹配时,表示环视结构匹配成功,并不会更改“当前的位置”,所以多个还是可以组合在一起,实现在同一位置的多种判断

环视中包含环视

  • 如我们在匹配主机名时,限定了主机长度不能超过255个字符,使用表达式(?=[-a-zA-Z0-9.]{0,255}(?![-a-zA-Z0-9.]))。其中的(?![-a-zA-Z0-9.])是包含在外层的环视中的,它要求在这个位置(也就是正确的主机名字符串之后),不能再出现属于主机名字符串的字符,也就是保证之前的表达式匹配的是整个主机名字符串,而不是“可能的主机名字符串的一部分”;综合起来,(?=[-a-zA-Z0-9.]{0,255}(?![-a-zA-Z0-9.]))保证的是“整个主机名字字符串的长度为255字符以内”,逻辑如下图:
    在这里插入图片描述

并列多个环视

  • 并列多个环视,他要求在当前位置,所有的环视判断都必须成功。比如:要知道一个这样的位置,它之后必须是一个数字字符串,但是不能是以999开头的数字字符串。这个时候就必须并列这两个环视
  • 表示数字字符串的表达式为\d+,对应的环视结构为(?=\d+);表示“不能以999开头”的表达式的环视结构为(?!999)。我们要做的是将两个环视结构并列起来,得到(?=\d+)(?!999)。因为环视结构不会更改当前位置,所以先后顺序没有影响,无论是(?=\d+)(?!999)还是(?!999)(?=\d+),效果是相同的,都是必须要求两个环视条件必须同时满足
  • 在当前位置,之后必须出现数字字符串;在当前位置,之后不能是出现999,最终的结果是两个环视做“与(and)”运算,就是说,两个条件必须同时满足才能进行匹配成功,否则失败,如下测试:
import re
# 查找这样的起始位置:它之后必须是数字字符串,且不能以999开头
# 数字字符串
re.search(r"^(?=\d+)(?!999)", '123456') is not None
# 非数字字符串
re.search(r"^(?=\d+)(?!999)", 'wywy') is not None
# 数字字符串但是以999开头
re.search(r"^(?=\d+)(?!999)", '999123456') is not None

在这里插入图片描述
逻辑如下图:
在这里插入图片描述

注意:

  • 仔细观察上述(!?999)这个环视结构会发现,字符串99999的开始位置也是不能匹配的,这是因为(!?999)不允许出现的其实是字符串999,而不是数值999,如果要更加准确的表示数值999,应该使用(!?999)(?!\d)这个环视

环视作为多选分支排列在多选结构中

  • 最后常见的环视结构就是将若干环视作为多选分支排列在多选结构中(或(or))。如要找到这样的一个位置:它之后要么不是数字字符,要么是一个数字字符和一个非数字字符(比如3w)。“不是数字字符”对应的环视为(?!\d);而“一个数字字符和一个非数字字符”对应的环视为(?=\d\D),所以最终组合后的环视为(?!\d)|(?=\d\D)。虽然我们在上面我们也探讨过并列多个环视组合,但是在多选结构中列出多个环视结构的意义与上面不太一样。使用多选环视结构,列出的多个环视只要有一个成立,整个判断都是成功的;不使用多选结构时,所有列出的环视都必须成立,整个判断才能成功,如下测试:
import re
# 查找这样的起始位置:它之后要么不是数字字符,要么是一个数字字符和一个非数字字符
# 不是数字字符
re.search(r"^((?!\d)|(?=\d\D))","ab") is not None
# 一个数字字符与一个非数字字符
re.search(r"^((?!\d)|(?=\d\D))","3w") is not None
# 单个数字字符
re.search(r"^((?!\d)|(?=\d\D))","6") is not None
# 连续的数字字符
re.search(r"^((?!\d)|(?=\d\D))","6666") is not None

在这里插入图片描述
逻辑如下图:
在这里插入图片描述

断言与反向引用之间的关系

  • 断言不匹配任何字符,只匹配位置;而反向引用只引用之前的捕获分组匹配的文本,之前捕获分组中锚点表示的文职信息,在反向引用时并不会保留下来
  • 举例来说,如果正则表达式为(\bcat\b)\s\1\1所匹配的,就不只有单独出现的cat,还有包括在单词内部的cat,比如(category中的cat),如果要验证单词cat是否在字符串中出现了两次,正确的做法是在反向引用的两端也加上单词边界\b,变成(\bcat\b.*?\b\1\b),如下举例:
import re
# 未加单词边界\b
re.search(r"(\bcat\b)\s+\1", 'cat category') is not None
# 加单词边界\b
re.search(r"(\bcat\b)\s+\b\1\b", 'cat category') is not None
# 加单词边界\b
re.search(r"(\bcat\b)\s+\b\1\b", 'cat cat') is not None

在这里插入图片描述

  • 在后续使用正则中一定要注意:使用(\bcat\b)\s+\1来匹配“重复的单词”是不对的,应该使用(\bcat\b)\s+\b\1\b

相关内容

热门资讯

安卓系统的地图怎样下载,下载与... 你有没有发现,现在不管去哪里,手机地图都成了我们的好帮手?尤其是安卓系统的地图,功能强大,用起来超级...
安卓9.0系统挂机游戏,轻松享... 你有没有发现,自从安卓9.0系统更新后,手机里的游戏体验简直就像坐上了火箭!今天,就让我带你一起探索...
安卓系统怎么用迅雷下载,安卓系... 你有没有想过,在安卓系统上下载文件竟然也能这么简单?没错,今天就要来给你揭秘,如何用迅雷在安卓系统上...
安卓手机刷成学生系统,探索全新... 你有没有想过,你的安卓手机其实可以变身成一个充满学习氛围的学生系统呢?没错,就是那种看起来简洁、功能...
ios能迁移安卓系统吗,iOS... 你有没有想过,你的iPhone里的那些宝贝应用,能不能搬到安卓手机上继续使用呢?这可是不少手机用户的...
荣耀10安卓11系统,畅享极致... 你知道吗?最近手机界可是热闹非凡呢!荣耀10这款手机,自从升级到了安卓11系统,简直就像脱胎换骨了一...
安卓系统pc版电脑配置,打造流... 你有没有想过,安卓系统竟然也能在电脑上运行呢?没错,就是那个我们手机上常用的安卓系统,现在也能在PC...
tcllinux系统刷安卓系统... 你有没有想过,你的TCL Linux系统竟然也能升级成安卓系统呢?没错,就是那个我们日常使用的安卓系...
安卓13系统更新蓝牙,蓝牙功能... 你有没有发现,最近你的安卓手机好像变得不一样了?没错,就是那个神秘的安卓13系统更新,它悄悄地来到了...
安卓系统钉钉打开声音,安卓系统... 你有没有遇到过这种情况?手机里装了钉钉,可每次打开它,那声音就“嗖”地一下跳出来,吓你一跳。别急,今...
理想汽车操作系统安卓,基于安卓... 你有没有想过,一辆汽车,除了能带你去你想去的地方,还能像智能手机一样,给你带来智能化的体验呢?没错,...
安卓系统越狱还能升级吗,升级之... 你有没有想过,你的安卓手机越狱后,还能不能愉快地升级系统呢?这可是不少手机爱好者关心的大问题。今天,...
安卓系统蓝牙耳机拼多多,畅享无... 你有没有发现,最近蓝牙耳机在市场上可是火得一塌糊涂呢!尤其是安卓系统的用户,对于蓝牙耳机的要求那可是...
安卓变苹果系统桌面,桌面系统变... 你知道吗?最近有个大新闻在科技圈里炸开了锅,那就是安卓用户纷纷转向苹果系统桌面。这可不是闹着玩的,这...
鸿蒙系统怎么下安卓,鸿蒙系统下... 你有没有想过,你的手机里那个神秘的鸿蒙系统,竟然也能和安卓世界来一场亲密接触呢?没错,今天就要来揭秘...
手机安卓系统流程排行,便捷操作... 你有没有发现,现在手机的世界里,安卓系统就像是个大舞台,各种版本层出不穷,让人眼花缭乱。今天,就让我...
安卓系统左上角hd,左上角HD... 你有没有发现,每次打开安卓手机,左上角那个小小的HD标识总是默默地在那里,仿佛在诉说着什么?今天,就...
安卓系统软件文件,架构解析与功... 你有没有发现,手机里的安卓系统软件文件就像是一个神秘的宝库,里面藏着无数的宝藏?今天,就让我带你一起...
安卓系统输入法回车,探索安卓输... 你有没有发现,在使用安卓手机的时候,输入法回车键的奇妙之处?它就像是我们指尖的魔法师,轻轻一点,文字...
安卓修改系统时间的软件,轻松掌... 你有没有想过,有时候手机上的时间不对劲,是不是觉得生活节奏都被打乱了?别急,今天就来给你揭秘那些神奇...