正则表达式高阶技巧之环视的组合(使用python实现)
创始人
2024-05-31 23:59:10
0

环视的组合

    • 介绍
    • 环视的组合
      • 环视中包含环视
      • 并列多个环视
        • 注意:
      • 环视作为多选分支排列在多选结构中
      • 断言与反向引用之间的关系

介绍

在我们日常使用的编程语言都是支持环视的,但是语言不同,支持程度也就不同,下面具体介绍一下在python中的支持:

  • 一般来说,所有语言都是支持环视的,而且是没有限制。也就是说,无论你是使用肯定顺序环视,还是否定顺序环视,都可以在结构中使用各种复杂的表达式
  • 但是在python中规定:逆序环视中的表达式能匹配的文本长度必须是固定的,也就是说,(?<=cat)是合法的, (?<=(cat|dog))也是合法的,因为环视中的子表达式能匹配的文本都是固定的; 而((?<=(cats|dog)))(?<=dogs?) 则都是不合法的,因为环视的子表达式能匹配的文本长度是不确定的
  • 要解决上诉问题:可以使用多选结构来改造表达式,比如,cats?等价于(dog|dogs),所以可以将上述的环视结构改写为((?<=cat)|(?<=cats)),同样是,((?<=(cats|dog)))也可以修改为((?<=cats)|(?<=dog));但是上述的方法的应用场景是非常有限的,如果逆序环视的表达式较为复杂,使用多选结构列出就略显不便;而且一旦表达式中出现了*+这类的量词,就不能再使用多选结构列出了

环视的组合

  • 环视匹配的并不是字符,而是位置。在正则表达式匹配时,表示环视结构匹配成功,并不会更改“当前的位置”,所以多个还是可以组合在一起,实现在同一位置的多种判断

环视中包含环视

  • 如我们在匹配主机名时,限定了主机长度不能超过255个字符,使用表达式(?=[-a-zA-Z0-9.]{0,255}(?![-a-zA-Z0-9.]))。其中的(?![-a-zA-Z0-9.])是包含在外层的环视中的,它要求在这个位置(也就是正确的主机名字符串之后),不能再出现属于主机名字符串的字符,也就是保证之前的表达式匹配的是整个主机名字符串,而不是“可能的主机名字符串的一部分”;综合起来,(?=[-a-zA-Z0-9.]{0,255}(?![-a-zA-Z0-9.]))保证的是“整个主机名字字符串的长度为255字符以内”,逻辑如下图:
    在这里插入图片描述

并列多个环视

  • 并列多个环视,他要求在当前位置,所有的环视判断都必须成功。比如:要知道一个这样的位置,它之后必须是一个数字字符串,但是不能是以999开头的数字字符串。这个时候就必须并列这两个环视
  • 表示数字字符串的表达式为\d+,对应的环视结构为(?=\d+);表示“不能以999开头”的表达式的环视结构为(?!999)。我们要做的是将两个环视结构并列起来,得到(?=\d+)(?!999)。因为环视结构不会更改当前位置,所以先后顺序没有影响,无论是(?=\d+)(?!999)还是(?!999)(?=\d+),效果是相同的,都是必须要求两个环视条件必须同时满足
  • 在当前位置,之后必须出现数字字符串;在当前位置,之后不能是出现999,最终的结果是两个环视做“与(and)”运算,就是说,两个条件必须同时满足才能进行匹配成功,否则失败,如下测试:
import re
# 查找这样的起始位置:它之后必须是数字字符串,且不能以999开头
# 数字字符串
re.search(r"^(?=\d+)(?!999)", '123456') is not None
# 非数字字符串
re.search(r"^(?=\d+)(?!999)", 'wywy') is not None
# 数字字符串但是以999开头
re.search(r"^(?=\d+)(?!999)", '999123456') is not None

在这里插入图片描述
逻辑如下图:
在这里插入图片描述

注意:

  • 仔细观察上述(!?999)这个环视结构会发现,字符串99999的开始位置也是不能匹配的,这是因为(!?999)不允许出现的其实是字符串999,而不是数值999,如果要更加准确的表示数值999,应该使用(!?999)(?!\d)这个环视

环视作为多选分支排列在多选结构中

  • 最后常见的环视结构就是将若干环视作为多选分支排列在多选结构中(或(or))。如要找到这样的一个位置:它之后要么不是数字字符,要么是一个数字字符和一个非数字字符(比如3w)。“不是数字字符”对应的环视为(?!\d);而“一个数字字符和一个非数字字符”对应的环视为(?=\d\D),所以最终组合后的环视为(?!\d)|(?=\d\D)。虽然我们在上面我们也探讨过并列多个环视组合,但是在多选结构中列出多个环视结构的意义与上面不太一样。使用多选环视结构,列出的多个环视只要有一个成立,整个判断都是成功的;不使用多选结构时,所有列出的环视都必须成立,整个判断才能成功,如下测试:
import re
# 查找这样的起始位置:它之后要么不是数字字符,要么是一个数字字符和一个非数字字符
# 不是数字字符
re.search(r"^((?!\d)|(?=\d\D))","ab") is not None
# 一个数字字符与一个非数字字符
re.search(r"^((?!\d)|(?=\d\D))","3w") is not None
# 单个数字字符
re.search(r"^((?!\d)|(?=\d\D))","6") is not None
# 连续的数字字符
re.search(r"^((?!\d)|(?=\d\D))","6666") is not None

在这里插入图片描述
逻辑如下图:
在这里插入图片描述

断言与反向引用之间的关系

  • 断言不匹配任何字符,只匹配位置;而反向引用只引用之前的捕获分组匹配的文本,之前捕获分组中锚点表示的文职信息,在反向引用时并不会保留下来
  • 举例来说,如果正则表达式为(\bcat\b)\s\1\1所匹配的,就不只有单独出现的cat,还有包括在单词内部的cat,比如(category中的cat),如果要验证单词cat是否在字符串中出现了两次,正确的做法是在反向引用的两端也加上单词边界\b,变成(\bcat\b.*?\b\1\b),如下举例:
import re
# 未加单词边界\b
re.search(r"(\bcat\b)\s+\1", 'cat category') is not None
# 加单词边界\b
re.search(r"(\bcat\b)\s+\b\1\b", 'cat category') is not None
# 加单词边界\b
re.search(r"(\bcat\b)\s+\b\1\b", 'cat cat') is not None

在这里插入图片描述

  • 在后续使用正则中一定要注意:使用(\bcat\b)\s+\1来匹配“重复的单词”是不对的,应该使用(\bcat\b)\s+\b\1\b

相关内容

热门资讯

自动打开应用安卓系统,安卓系统... 你有没有想过,手机里的那些应用,有时候真是让人又爱又恨呢?有时候,我们急需某个应用,却得费老大力气去...
安卓系统防沉迷软件,守护青少年... 你有没有发现,现在手机上玩游戏的诱惑力简直让人无法抗拒?尤其是安卓系统,那丰富的游戏资源,简直让人停...
流量最快的安卓系统,揭秘流量最... 你有没有想过,为什么你的手机总是那么卡,而别人的手机却像开了挂一样流畅?是不是好奇,为什么有些安卓系...
小米5换换安卓系统,畅享极致性... 你有没有想过,你的小米5手机,那个陪伴你走过无数日夜的小家伙,是不是也该给它来个“换新装”了呢?没错...
国产的安卓系统手机,畅享智能生... 你有没有发现,最近国产的安卓系统手机越来越火了?没错,就是那种咱们自己研发的系统,那种让外国品牌都不...
安卓系统刷入停止,探究原因与解... 你有没有遇到过这种情况?手机刷机过程中突然停止了,安卓系统刷入停滞不前,心里那个急啊!别慌,今天就来...
汽车是安卓系统嘛,安卓系统在智... 你有没有想过,汽车里那个神奇的操作系统,是不是和安卓手机里的一样呢?没错,今天咱们就来聊聊这个话题—...
网易狼人杀 安卓系统,体验指尖... 亲爱的玩家们,你是否曾在深夜里,手机屏幕前,与一群好友展开一场惊心动魄的“狼人杀”对决?今天,就让我...
小米安卓系统小主机,探索小米安... 你有没有想过,家里的电视、电脑、平板,甚至手机,其实都可以变成一个超级智能的娱乐中心?没错,这就是小...
卡刷安卓系统大全,全面解析各类... 你有没有想过,你的安卓手机可以像变形金刚一样,随心所欲地变换模样?没错,今天就要给你揭秘一个神奇的世...
安卓系统测试流畅度,安卓系统流... 你有没有发现,现在手机更新换代的速度简直就像坐上了火箭呢!尤其是安卓系统,每次更新都让人眼前一亮。但...
安卓系统50怎么升级,轻松迈向... 亲爱的安卓用户们,你是否也像我一样,对安卓系统的更新充满了期待?没错,就是那个让我们的手机焕然一新的...
安卓5.1.1操作系统,系统特... 你知道吗?在手机世界里,操作系统就像是个大管家,它不仅决定了手机的脸面,还掌管着手机的所有“家务事”...
手机安卓系统如果升级,体验流畅... 亲爱的手机控们,你们有没有发现,你的安卓手机最近是不是总在提醒你更新系统呢?别急,别急,今天就来给你...
安卓系统怎么禁止待机,安卓系统... 手机待机时间短,是不是让你头疼不已?别急,今天就来教你一招,让你的安卓手机告别“短命”模式,延长待机...
亿联安卓苹果系统,跨平台沟通新... 你知道吗?在科技飞速发展的今天,手机操作系统可是咱们日常生活中不可或缺的一部分。说起手机系统,亿联安...
smoothx安卓系统安装ap... 你有没有想过,为什么你的手机里总是乱糟糟的,各种app堆在一起,找起来费劲得很?别急,今天就来教你怎...
安卓系统图库在哪里,图库应用位... 你有没有发现,手机里的照片越来越多,有时候想找一张特定的照片,却像大海捞针一样困难?别急,今天就来告...
安卓7.0系统自带彩蛋,隐藏彩... 你知道吗?安卓7.0系统里竟然藏着不少小秘密,就像一颗颗隐藏的彩蛋,等着我们去发现。今天,就让我带你...
安卓系统好用的电池,好用到飞起... 你有没有发现,用安卓手机的时候,电池续航能力简直让人爱不释手啊!没错,今天咱们就来聊聊这个话题——安...