之前介绍Python的 pathlib 模块可以有效的路径及文件查找等方便操作,本篇介绍一个相对 readlines() 获取文件内容更高效的用法
对一个或者多个文件的内容迭代遍历(类似文件操作的readlines()),但是返回的是
迭代对象
,而不是一次性返回所有的文件内容行记录。
fileinput.input(files=None, inplace=False, backup='', *, mode='r', openhook=None, encoding=None, errors=None)
默认是标准输入
写回文件
,默认是不写回指定备份的扩展名即可
,如果备份已经存在则会覆盖行的数量
注意和 filelineno的区别最后一行
是否从标准stdin中读取3.1、 基于标准输入和命令行文件参数
#!/usr/bin/env python
# encoding: utf-8
#import fileinputdef demo1():"""演示基于标准输入"""print("文件名| 文件行号|文件行内容")for line in fileinput.input():print(f"{fileinput.filename()}| {fileinput.filelineno()} | {line}")print(f"文件共有 {fileinput.lineno()} 行")if __name__ == '__main__':demo1()
命令行不加任何参数,表示从标准输入 stdin 获取信息
命令行有参数(文件)则读取文件内容
3.2、修改多个文件,并回写
到源文件
def demo2():"""演示多文件操作,并原地修改(写回当前文件)"""# 直接传参# for line in fileinput.input(['fi_1.txt', 'fi_2.txt'], inplace=1):# 从命令行读取(标准输入)for line in fileinput.input(inplace=1):print(line.strip() + ' -> 我是回写')
3.3、文件内容替换,并备份原文件
def demo3():"""实现源文件的内容替换,并实现备份"""for line in fileinput.input('1209_demo.txt', backup=".bak", inplace=1):print(line.rstrip().replace('Python', 'Django'))
执行脚本之后,发现 1209_demo.txt 文件中第一行的Python
变成了Django
# python demo_fileinput.py
# cat 1209_demo.txt
hello Django in line one
3.4、利用``fileinput + re` 实现邮箱提取
def demo4():pattern = "[a-zA-Z0-9]{3,9}@126.com"for line in fileinput.input("1209_demo.txt"):if re.search(pattern, line):print("Email: ", line)
执行脚本之后
# python demo_fileinput.py
Email: lkjdlafje@126.comEmail: ouiolj303@126.com
Demo演示就到这里,通过案例学习它的方法怎么用,然后具体结合自己业务就好。
有问题,欢迎交流 ~
原文地址 Python模块fileinput操作文件和目录操作总结