在 Python 中拆分具有多个分隔符的字符串
创始人
2024-05-31 00:02:02
0

要使用多个定界符拆分字符串:

  1. 使用 re.split() 方法,例如 re.split(r',|-', my_str)
  2. re.split() 方法将拆分所有出现的分隔符之一的字符串。
import re# 👇️ 用 2 个分隔符拆分字符串my_str = 'fql,jiyik-dot,com'my_list = re.split(r',|-', my_str)  # 👈️ 以逗号或连字符分隔print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

re.split 方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。

管道 | 字符是一个或。 匹配 A 或 B。

该示例使用 2 个分隔符(逗号和连字符)拆分字符串。

# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'my_list = re.split(r',|-|:', my_str)  # 👈️ comma, hyphen or colonprint(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

下面是一个使用 3 个分隔符(逗号、连字符和冒号)拆分字符串的示例。

我们可以使用尽可能多的 | 正则表达式中必要的字符。


使用方括号 [] 根据多个定界符拆分字符串

或者,我们可以使用方括号 [] 来指示一组字符。

import remy_str = 'fql,jiyik-dot,com'my_list = re.split(r'[,-]', my_str)print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

Python 中以逗号和连字符分隔

确保在方括号之间添加所有分隔符。

import re# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'my_list = re.split(r'[,-:]', my_str) # 以逗号、连字符、冒号分割print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

如果字符串以其中一个定界符开头或结尾,我们可能会在输出列表中得到空字符串值。


处理前导或尾随定界符

我们可以使用列表理解从列表中删除任何空字符串。

import re# 👇️ 用 3 个分隔符拆分字符串
my_str = ',fql,jiyik-dot:com:'my_list = [item for item in re.split(r'[,-:]', my_str)if item
]print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

列表推导负责从列表中删除空字符串。

列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。

另一种方法是使用 str.replace() 方法。


使用 str.replace() 拆分具有多个定界符的字符串

要使用多个定界符拆分字符串:

  1. 使用 str.replace() 方法将第一个分隔符替换为第二个分隔符。
  2. 使用 str.split() 方法按第二个分隔符拆分字符串。
my_str = 'fql_jiyik!dot_com'my_list = my_str.replace('_', '!').split('!')print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

这种方法仅在您想要拆分的分隔符很少时才方便,例如 2.

首先,我们用第二个分隔符替换每个出现的第一个分隔符,然后我们拆分第二个分隔符。

str.replace 方法返回字符串的副本,其中所有出现的子字符串都被提供的替换项替换。

该方法采用以下参数:

  • old 字符串中我们要替换的子串
  • new 替换每次出现的 old
  • count 仅替换第一个 count 出现(可选)

请注意 ,该方法不会更改原始字符串。 字符串在 Python 中是不可变的。

这是另一个例子。

my_str = 'fql jiyik, dot # com. abc'my_list = my_str.replace(',', '').replace('#', '').replace('.', '').split()print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

我们使用 str.replace() 方法在拆分空白字符的字符串之前删除标点符号。

我们使用空字符串进行替换,因为我们要删除指定的字符。

我们可以根据需要将尽可能多的调用链接到 str.replace() 方法。

最后一步是使用 str.split() 方法将字符串拆分为单词列表。

str.split() 方法使用定界符将字符串拆分为子字符串列表。

该方法采用以下 2 个参数:

  • separator 在每次出现分隔符时将字符串拆分为子字符串
  • maxsplit 最多完成 maxsplit 拆分(可选)

当没有分隔符传递给 str.split() 方法时,它会将输入字符串拆分为一个或多个空白字符。

my_str = 'fql jiyik com'print(my_str.split())  # 👉️ ['fql', 'jiyik', 'com']

如果在字符串中找不到分隔符,则返回仅包含 1 个元素的列表。


使用可重用函数根据多个定界符拆分字符串

如果我们需要经常根据多个分隔符拆分字符串,请定义一个可重用的函数。

import redef split_multiple(string, delimiters):pattern = '|'.join(map(re.escape, delimiters))return re.split(pattern, string)my_str = 'fql,jiyik-dot:com'print(split_multiple(my_str, [',', '-', ':']))

split_multiple 函数接受一个字符串和一个分隔符列表,并根据分隔符拆分字符串。

str.join() 方法用于将分隔符与管道 | 连接起来。 分隔器。

# 👇️ ,|-|:
print('|'.join([',', '-', ':']))

这将创建一个正则表达式模式,我们可以使用该模式根据指定的分隔符拆分字符串。

如果我们需要将一个字符串拆分为多个分隔符的单词列表,我们还可以使用 re.findall() 方法。

使用 re.findall() 将字符串拆分为单词列表

使用 re.findall() 方法将字符串拆分为具有多个分隔符的单词列表。

re.findall() 方法将在每次出现单词时拆分字符串,并返回包含单词的列表。

import re# ✅ 将字符串拆分为具有多个分隔符的单词列表
my_str = 'fql jiyik, dot # com. abc'my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

re.findall 方法将一个模式和一个字符串作为参数,并返回一个字符串列表,其中包含字符串中该模式的所有非重叠匹配项。

我们传递给 re.findall() 方法的第一个参数是一个正则表达式。

import remy_str = 'fql jiyik, dot # com. abc'my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

方括号 [] 用于表示一组字符。

\w 字符与 Unicode 单词字符匹配,并且包括可以作为任何语言的单词一部分的大多数字符。

加号 + 使正则表达式匹配前面字符(Unicode 字符)的 1 次或多次重复。

re.findall() 方法返回一个包含字符串中单词的列表。

如果大家想了解关于正则表达式的知识,可以参考 正则表达式教程。

该页面包含所有特殊字符的列表以及许多有用的示例。

相关内容

热门资讯

122.(leaflet篇)l... 听老人家说:多看美女会长寿 地图之家总目录(订阅之前建议先查看该博客) 文章末尾处提供保证可运行...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
Vue使用pdf-lib为文件... 之前也写过两篇预览pdf的,但是没有加水印,这是链接:Vu...
PyQt5数据库开发1 4.1... 文章目录 前言 步骤/方法 1 使用windows身份登录 2 启用混合登录模式 3 允许远程连接服...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
Linux基础命令大全(上) ♥️作者:小刘在C站 ♥️个人主页:小刘主页 ♥️每天分享云计算网络运维...
再谈解决“因为文件包含病毒或潜... 前面出了一篇博文专门来解决“因为文件包含病毒或潜在的垃圾软件”的问题,其中第二种方法有...
南京邮电大学通达学院2023c... 题目展示 一.问题描述 实验题目1 定义一个学生类,其中包括如下内容: (1)私有数据成员 ①年龄 ...
PageObject 六大原则 PageObject六大原则: 1.封装服务的方法 2.不要暴露页面的细节 3.通过r...
【Linux网络编程】01:S... Socket多进程 OVERVIEWSocket多进程1.Server2.Client3.bug&...
数据结构刷题(二十五):122... 1.122. 买卖股票的最佳时机 II思路:贪心。把利润分解为每天为单位的维度,然后收...
浏览器事件循环 事件循环 浏览器的进程模型 何为进程? 程序运行需要有它自己专属的内存空间࿰...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
计算机二级Python备考(2... 目录  一、选择题 1.在Python语言中: 2.知识点 二、基本操作题 1. j...
端电压 相电压 线电压 记得刚接触矢量控制的时候,拿到板子,就赶紧去测各种波形,结...
如何使用Python检测和识别... 车牌检测与识别技术用途广泛,可以用于道路系统、无票停车场、车辆门禁等。这项技术结合了计...
带环链表详解 目录 一、什么是环形链表 二、判断是否为环形链表 2.1 具体题目 2.2 具体思路 2.3 思路的...
【C语言进阶:刨根究底字符串函... 本节重点内容: 深入理解strcpy函数的使用学会strcpy函数的模拟实现⚡strc...
Django web开发(一)... 文章目录前端开发1.快速开发网站2.标签2.1 编码2.2 title2.3 标题2.4 div和s...