Python 文件操作

ゞ浴缸里的玫瑰 2022-05-17 06:37 215阅读 0赞

**目录**

文件操作

用Python创建一个新文件

文件内容追加，从0到9的10个随机整数

如何读取并显示

把标准输出定向到文件

文件的读写

文件打开

关闭文件

清空文件内容

文件的指针定位与查询

从文件读取指内容

向文件写入一个字符串

删除文件

打开文件

操作函数目录

对文件、文件夹的操作

文件操作

目录操作

案例

--------------------

# 文件操作 #

## **用Python****创建一个新文件** ##

内容是从0到9的整数, 每个数字占一行：

f=open('f.txt','w')    # r只读，w可写，a追加
    for i in range(0,10):f.write(str(i)+'\n')
    f.close()
    try:
    f=open('f.txt','r')    # r只读，w可写，a追加
    t=f.readlines()
    print(t)
    f.close()
      except Exception,e:
        f.close()

![70][]

## **文件内容追加，从0****到9****的10****个随机整数** ##

import random
    f=open('f.txt','a')
    for i in range(0,10):f.write(str(random.randint(0,9)))
    f.write('\n')
    f.close()

![70 1][]

文件内容追加，从0到9的随机整数, 10个数字一行，共10行

import random
    f=open('f.txt','a')
    for i in range(0,10):
         for i in range(0,10):f.write(str(random.randint(0,9)))
         f.write('\n')
    f.close()

![70 2][]

## **如何读取并显示** ##

g=open('f.txt','rt')    # r只读，w可写，a追加
    s=g.readlines()
    print(s)
    for i in range(len(s)):
        s[i]=s[i].strip('\n')
    print(s)
    g.close()

![70 3][]

## **把标准输出定向到文件** ##

#python
    
    import sys
    
    sys.stdout = open("stdout.txt", "w")

# 文件的读写 #

## **文件打开** ##

f = file(name[, mode[, buffering]])

入口参数:   name 文件名

mode   选项,字符串

buffering   是否缓冲 (0=不缓冲，1=缓冲, >1的int数=缓冲区大小)

返回值 : 文件对象

mode 选项:

"r"   以读方式打开，只能读文件 ， 如果文件不存在，会发生异常

"w" 以写方式打开，只能写文件， 如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

"rb"   以二进制读方式打开，只能读文件 ， 如果文件不存在，会发生异常

"wb" 以二进制写方式打开，只能写文件， 如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件。

"rt"   以文本读方式打开，只能读文件 ， 如果文件不存在，会发生异常。

"wt" 以文本写方式打开，只能写文件， 如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

"rb+"   以二进制读方式打开，可以读、写文件 ， 如果文件不存在，会发生异常。

"wb+" 以二进制写方式打开，可以读、写文件， 如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

## **关闭文件** ##

f.close()

当文件读写完毕后，应关闭文件。

## **清空文件内容** ##

f.truncate()

注意：仅当以 "r+"   "rb+"    "w"   "wb" "wb+"等以可写模式打开的文件才可以执行该功能。

## **文件的指针定位与查询** ##

1.  文件指针：

文件被打开后，其对象保存在 f 中， 它会记住文件的当前位置,以便于执行读、写操作，这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

1.  文件打开时的位置:

以"r"   "r+"   "rb+" 读方式, "w"   "w+"   "wb+"写方式 打开的文件，一开始，文件指针均指向文件的头部。

1.  获取文件指针的值: L = f.tell()
2.  移动文件的指针

f.seek(偏移量, 选项)

选项 =0 时， 表示将文件指针指向从文件头部到 "偏移量"字节处。

选项 =1 时， 表示将文件指针指向从文件的当前位置，向后移动 "偏移量"字节。

选项 =2 时， 表示将文件指针指向从文件的尾部，，向前移动 "偏移量"字节。

## **从文件读取指内容** ##

1 文本文件（以"rt"方式打开的文件）的读取

s = f.readline()

返回值：s 是字符串，从文件中读取的一行，含行结束符。

说明： (1)  如果 len( s ) =0 表示已到文件尾

(2)  如果是文件的最后一行，有可能没有行结束符

2 二进制文件（以"rb"、"rb+"、"wb+" 方式打开的文件）的读取

说明： (1)  如果 len( s ) =0 表示已到文件尾

(2)  文件读取后，文件的指针向后移动 len(s) 字节。

(3)  如果磁道已坏，会发生异常。

## **向文件写入一个字符串** ##

f.write( s )

参数： s 要写入的字符串

说明：(1)文件写入后，文件的指针向后移动 len(s) 字节。

(2)如果磁道已坏，或磁盘已满会发生异常。

返回值：s 是字符串，从文件中读取的内容

## **删除文件** ##

import os
    
    os.remove(file)

# 打开文件 #

读写文件之前，先用open()函数打开一个文件，它会返回一个文件对象(file object)：

f =open(filename，mode)

如果不指定mode参数，文件将默认以‘r'模式打开。模式中的字符有：

r：只读

w：只写，如果文件已存在则将其覆盖。如果该文件不存在，创建新文件

\+：读写(不能单独使用)

a：打开文件用于追加，只写，不存在则创建新文件

b：以二进制模式打开(不能单独使用)

所以可能的模式大概有r、w、r+、w+、rb、wb、rb+、wb+、a、a+、ab、ab+，注意只有w和a可以创建文件。

通常情况下，文件都是以文本模式(text mode)打开的，也就是说，从文件中读写的是以一种特定的编码格式进行编码(默认的是 UTF-8)的字符串。如果文件以二进制模式(binary mode)打开，数据将以字节对象的形式进行读写：

f =open('a.txt','wb+')
    
    f.write('I like apple!')  # 报错
    
    f.write(b'I like apple!') # 以bytes对象的形式进行读写

Bytes对象是0到127的不可修改的整数序列，或纯粹的 ASCII 字符，它的用途是存储二进制数据。

可以通过在一个字符串前面加上'b'来创建一个bytes literal；

也可以通过bytes() 函数创建一个 bytes 对象。

注意：如果bytes() 函数的初始化器是一个字符串，那么必须提供一种编码。

b1 =b'This is string'
    
    b2 =bytes('This is string', 'UTF-8')  # 必须指定编码格式

字符串对象与字节对象是不兼容的，要将 bytes 转变为 str， bytes 对象必须要进行解码，使用decode() 方法：

b = bytes('This is string', 'UTF-8')
    
    print(b, b.decode(), sep='\n')
    
    # 输出：
    
    # b'This is string'
    
    # This is string

文件对象的方法(假设f是一个文件对象)：

f.read(size) ：读取size个字节的数据，然后作为字符串或 bytes 对象返回。size是一个可选参数，如果不指定size，则读取文件的所有内容。

f.readline() ：读取一行。在字符串末尾会留下换行符 (\\n)，如果到文件尾，返回空字符串。

f.readlines() ：读取所有行，储存在列表中，每个元素是一行，相当于list(f)。

f.write(string) ：将 string 写入到文件中，返回写入的字符数。如果以二进制模式写文件，需要将string转换为 bytes 对象。

f.tell() ：返回文件对象当前所处的位置，它是从文件开头开始算起的字节数。

f.seek(offset, from\_what) ：改变文件对象所处的位置。offset是相对参考位置的偏移量，from\_what 取值 0(文件头, 默认)、1(当前位置)、2(文件尾)表示参考位置。

f.close() ：关闭文件对象。

这些都是很常用的方法，当然文件对象不止这些方法。根据打开的模式不同，open() 返回的文件对象类型也不同：

TextIOWrapper：文本模式，返回TextIOWrapper对象。

BufferedReader：读二进制，即rb，返回BufferedReader对象。

BufferedWriter：写和追加二进制，即wb、ab，返回BufferedWriter对象。

BufferedRandom：读/写模式，即含有+的模式，返回BufferedRandom对象。

可以在这些文件对象上运行 dir() 或 help()，查看它们所有的方法。

# 操作函数目录 #

## **对文件、文件夹的操作** ##

需要涉及到os模块和shutil模块。

（1）得到当前工作目录，即当前Python脚本工作的目录路径: os.getcwd()

（2）返回指定目录下的所有文件和目录名:os.listdir()

（3）函数用来删除一个文件:os.remove()

（4）删除多个目录：os.removedirs(r"c:\\python")

（5）检验给出的路径是否是一个文件：os.path.isfile()

（6）检验给出的路径是否是一个目录：os.path.isdir()

（7）判断是否是绝对路径：os.path.isabs()

（8）检验给出的路径是否真地存:os.path.exists()

（9）返回一个路径的目录名和文件名:

os.path.split()

例如：

os.path.split('/home/swaroop/byte/code/poem.txt')

结果：

('/home/swaroop/byte/code', 'poem.txt')

（10）分离扩展名：os.path.splitext()

>>> t=os.path.splitext("d:\d.txt")
    
    >>> t[0]
    
    'd:\\d'
    
    >>> t[1]
    
    '.txt'

（11）获取路径名：os.path.dirname()

（12）获取文件名：os.path.basename()

（12）运行shell命令: os.system()

（13）读取和设置环境变量:os.getenv() 与os.putenv()

（14）给出当前平台使用的行终止符:os.linesep

Windows使用'\\r\\n'，Linux使用'\\n'而Mac使用'\\r'

指示你正在使用的平台：os.name对于Windows，它是'nt'，而对于Linux/Unix用户，它是'posix'

（15）重命名：os.rename(old， new)

（16）创建多级目录：os.makedirs(r"c:\\python\\test")

（17）创建单个目录：os.mkdir("test")

（18）获取文件属性：os.stat(file)

（19）修改文件权限与时间戳：os.chmod(file)

（20）终止当前进程：os.exit()

（21）获取文件大小：os.path.getsize(filename)

## **文件操作** ##

os.mknod("test.txt")        创建空文件

fp = open("test.txt", 'w')     直接打开一个文件，如果文件不存在则创建文件

关于open 模式：

w     以写方式打开，

a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+     以读写模式打开

w+     以读写模式打开 (参见 w )

a+     以读写模式打开 (参见 a )

rb     以二进制读模式打开

wb     以二进制写模式打开 (参见 w )

ab     以二进制追加模式打开 (参见 a )

rb+    以二进制读写模式打开 (参见 r+ )

wb+    以二进制读写模式打开 (参见 w+ )

ab+    以二进制读写模式打开 (参见 a+ )

fp.read([size])      #size为读取的长度，以byte为单位
    
    fp.readline([size])    #读一行，如果定义了size，有可能返回的只是一行的一部分
    
    fp.readlines([size])     #把文件每一行作为一个list的一个成员，并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数，size是表示读取内容的总长，也就是说可能只读到文件的一部分。
    
    fp.write(str)     #把str写到文件中，write()并不会在str后加上一个换行符
    
    fp.writelines(seq)    #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入，不会在每行后面加上任何东西。
    
    fp.close()     #关闭文件。python会在一个文件不用后自动关闭文件，不过这一功能没有保证，最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError
    
    fp.flush()    #把缓冲区的内容写入硬盘
    
    fp.fileno()     #返回一个长整型的"文件标签"
    
    fp.isatty()     #文件是否是一个终端设备文件(unix系统中的)
    
    fp.tell()       #返回文件操作标记的当前位置，以文件的开头为原点
    
    fp.next()      #返回下一行，并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时，就是调用next()函数来实现遍历的。
    
    fp.seek(offset[,whence])  #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的，一般为正数。但如果提供了whence参数就不一定了，whence可以为0表示从头开始计算，1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意，如果文件以a或a+的模式打开，每次进行写操作时，文件操作标记会自动返回到文件末尾。
    
    fp.truncate([size])   #把文件裁成规定的大小，默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大，依据系统的不同可能是不改变文件，也可能是用0把文件补到相应的大小，也可能是以一些随机的内容加上去。

## **目录操作** ##

import shutil

shutil -- High-level file operations 是一种高层次的文件操作工具

类似于高级API，而且主要强大之处在于其对文件的复制与删除操作。

（1）创建目录os.mkdir("file")

（2）复制文件：

shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件

shutil.copy("oldfile","newfile")            oldfile只能是文件夹，newfile可以是文件，也可以是目标目录

（3）复制文件夹：

shutil.copytree("olddir","newdir")        olddir和newdir都只能是目录，且newdir必须不存在

（4）重命名文件(目录)

os.rename("oldname","newname")       文件或目录都是使用这条命令

（5）移动文件(目录)

shutil.move("oldpos","newpos")

（6）删除文件

os.remove("file")

（7）删除目录

os.rmdir("dir")只能删除空目录

shutil.rmtree("dir")    空目录、有内容的目录都可以删

（8）转换目录

os.chdir("path")   换路径

**Example：**

(使用os.listdir)

import os
    def ListFilesToTxt(dir,file,wildcard,recursion):
        exts = wildcard.split(" ")
        files = os.listdir(dir)
        for name in files:
            fullname=os.path.join(dir,name)
            if(os.path.isdir(fullname) & recursion):
                ListFilesToTxt(fullname,file,wildcard,recursion)
            else:
                for ext in exts:
                    if(name.endswith(ext)):
                        file.write(name + "\n")
                        break
    def Test():
        dir="/datas/Pdata"
        outfile="binaries.txt"
        wildcard = ".txt .exe .dll .lib"
        file = open(outfile,"w")
        if not file:
            print ("cannot open the file %s for writing" % outfile)
        ListFilesToTxt(dir,file,wildcard, 1)
        file.close()

Test()

代码：(使用os.walk) walk递归地对目录及子目录处理，每次返回的三项分别为：当前递归的目录，当前递归的目录下的所有子目录，当前递归的目录下的所有文件。

import os
    def ListFilesToTxt(dir,file,wildcard,recursion):
        exts = wildcard.split(" ")
        for root, subdirs, files in os.walk(dir):
            for name in files:
                for ext in exts:
                    if(name.endswith(ext)):
                        file.write(name + "\n")
                        break
            if(not recursion):
                break
    
    
    def Test():
        dir="/datas/Pdata"
        outfile="binaries.txt"
        wildcard = ".txt .exe .dll .lib"
        file = open(outfile,"w")
        if not file:
            print ("cannot open the file %s for writing" % outfile)
        ListFilesToTxt(dir,file,wildcard, 0)
        file.close()

Test()

运行结果：

![70 4][]

# 案例 #

将文件夹下所有图片名称加上'\_fc'

python代码:

# -*- coding:utf-8 -*-
    import re
    import os
    import time
    #str.split(string)分割字符串
    #'连接符'.join(list) 将列表组成字符串
    def change_name(path):
        global i
        if not os.path.isdir(path) and not os.path.isfile(path):
            return False
        if os.path.isfile(path):
            file_path = os.path.split(path) #分割出目录与文件
            lists = file_path[1].split('.') #分割出文件与文件扩展名
            file_ext = lists[-1] #取出后缀名(列表切片操作)
            img_ext = ['bmp','jpeg','gif','psd','png','jpg']
            if file_ext in img_ext:
                os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
                i+=1 #注意这里的i是一个陷阱
            #或者
            #img_ext = 'bmp|jpeg|gif|psd|png|jpg'
            #if file_ext in img_ext:
            #    print('ok---'+file_ext)
        elif os.path.isdir(path):
            for x in os.listdir(path):
                change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
    img_dir = 'D:\\xx\\xx\\images'
    img_dir = img_dir.replace('\\','/')
    start = time.time()
    i = 0
    change_name(img_dir)
    c = time.time() - start
    print('程序运行耗时:%0.2f'%(c))
    print('总共处理了 %s 张图片'%(i))

输出结果：

![70 5][]

图片改名结果：

![70 6][]

[70]: /images/20220517/5f326fea0498449aaed3a5ee5279c966.png
[70 1]: /images/20220517/3da36ffe9a2745ab9a9a625ba652228f.png
[70 2]: /images/20220517/e9ae66e8ada44adbb35586fd6864af23.png
[70 3]: /images/20220517/7361683f8ccb49d7a4007cb562237b53.png
[70 4]: /images/20220517/3ec3c20e55884f779c5b1245c38118fd.png
[70 5]: /images/20220517/6a5d34e8e06e43d0badd794c68deb891.png
[70 6]: /images/20220517/668fb78920444bbb8625c7a22339ad67.png