Python 文件操作

ゞ 浴缸里的玫瑰 2022-05-17 06:37 377阅读 0赞

目录

文件操作

用Python创建一个新文件

文件内容追加,从0到9的10个随机整数

如何读取并显示

把标准输出定向到文件

文件的读写

文件打开

关闭文件

清空文件内容

文件的指针定位与查询

从文件读取指内容

向文件写入一个字符串

删除文件

打开文件

操作函数目录

对文件、文件夹的操作

文件操作

目录操作

案例


文件操作

用Python**创建一个新文件**

内容是从0到9的整数, 每个数字占一行:

  1. f=open('f.txt','w') # r只读,w可写,a追加
  2. for i in range(0,10):f.write(str(i)+'\n')
  3. f.close()
  4. try:
  5. f=open('f.txt','r') # r只读,w可写,a追加
  6. t=f.readlines()
  7. print(t)
  8. f.close()
  9. except Exception,e:
  10. f.close()

70

文件内容追加,从0**到9的10个随机整数**

  1. import random
  2. f=open('f.txt','a')
  3. for i in range(0,10):f.write(str(random.randint(0,9)))
  4. f.write('\n')
  5. f.close()

70 1

文件内容追加,从0到9的随机整数, 10个数字一行,共10行

  1. import random
  2. f=open('f.txt','a')
  3. for i in range(0,10):
  4. for i in range(0,10):f.write(str(random.randint(0,9)))
  5. f.write('\n')
  6. f.close()

70 2

如何读取并显示

  1. g=open('f.txt','rt') # r只读,w可写,a追加
  2. s=g.readlines()
  3. print(s)
  4. for i in range(len(s)):
  5. s[i]=s[i].strip('\n')
  6. print(s)
  7. g.close()

70 3

把标准输出定向到文件

  1. #python
  2. import sys
  3. sys.stdout = open("stdout.txt", "w")

文件的读写

文件打开

  1. f = file(name[, mode[, buffering]])

入口参数: name 文件名

  1. mode 选项,字符串
  2. buffering 是否缓冲 (0=不缓冲,1=缓冲, >1int数=缓冲区大小)

返回值 : 文件对象

mode 选项:

“r” 以读方式打开,只能读文件 , 如果文件不存在,会发生异常

“w” 以写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

“rb” 以二进制读方式打开,只能读文件 , 如果文件不存在,会发生异常

“wb” 以二进制写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件。

“rt” 以文本读方式打开,只能读文件 , 如果文件不存在,会发生异常。

“wt” 以文本写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

“rb+” 以二进制读方式打开,可以读、写文件 , 如果文件不存在,会发生异常。

“wb+” 以二进制写方式打开,可以读、写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

关闭文件

  1. f.close()

当文件读写完毕后,应关闭文件。

清空文件内容

  1. f.truncate()

注意:仅当以 “r+” “rb+” “w” “wb” “wb+”等以可写模式打开的文件才可以执行该功能。

文件的指针定位与查询

  1. 文件指针:

文件被打开后,其对象保存在 f 中, 它会记住文件的当前位置,以便于执行读、写操作,这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

  1. 文件打开时的位置:

以”r” “r+” “rb+” 读方式, “w” “w+” “wb+”写方式 打开的文件,一开始,文件指针均指向文件的头部。

  1. 获取文件指针的值: L = f.tell()
  2. 移动文件的指针

f.seek(偏移量, 选项)

选项 =0 时, 表示将文件指针指向从文件头部到 “偏移量”字节处。

选项 =1 时, 表示将文件指针指向从文件的当前位置,向后移动 “偏移量”字节。

选项 =2 时, 表示将文件指针指向从文件的尾部,,向前移动 “偏移量”字节。

从文件读取指内容

1 文本文件(以”rt”方式打开的文件)的读取

  1. s = f.readline()

返回值:s 是字符串,从文件中读取的一行,含行结束符。

说明: (1) 如果 len( s ) =0 表示已到文件尾

(2) 如果是文件的最后一行,有可能没有行结束符

2 二进制文件(以”rb”、”rb+”、”wb+” 方式打开的文件)的读取

说明: (1) 如果 len( s ) =0 表示已到文件尾

  1. (2) 文件读取后,文件的指针向后移动 len(s) 字节。
  2. (3) 如果磁道已坏,会发生异常。

向文件写入一个字符串

  1. f.write( s )

参数: s 要写入的字符串

说明:(1)文件写入后,文件的指针向后移动 len(s) 字节。

  1. (2)如果磁道已坏,或磁盘已满会发生异常。

返回值:s 是字符串,从文件中读取的内容

删除文件

  1. import os
  2. os.remove(file)

打开文件

读写文件之前,先用open()函数打开一个文件,它会返回一个文件对象(file object):

  1. f =open(filenamemode)

如果不指定mode参数,文件将默认以‘r’模式打开。模式中的字符有:

r:只读

w:只写,如果文件已存在则将其覆盖。如果该文件不存在,创建新文件

+:读写(不能单独使用)

a:打开文件用于追加,只写,不存在则创建新文件

b:以二进制模式打开(不能单独使用)

所以可能的模式大概有r、w、r+、w+、rb、wb、rb+、wb+、a、a+、ab、ab+,注意只有w和a可以创建文件。

通常情况下,文件都是以文本模式(text mode)打开的,也就是说,从文件中读写的是以一种特定的编码格式进行编码(默认的是 UTF-8)的字符串。如果文件以二进制模式(binary mode)打开,数据将以字节对象的形式进行读写:

  1. f =open('a.txt','wb+')
  2. f.write('I like apple!') # 报错
  3. f.write(b'I like apple!') # 以bytes对象的形式进行读写

Bytes对象是0到127的不可修改的整数序列,或纯粹的 ASCII 字符,它的用途是存储二进制数据。

可以通过在一个字符串前面加上’b’来创建一个bytes literal;

也可以通过bytes() 函数创建一个 bytes 对象。

注意:如果bytes() 函数的初始化器是一个字符串,那么必须提供一种编码。

  1. b1 =b'This is string'
  2. b2 =bytes('This is string', 'UTF-8') # 必须指定编码格式

字符串对象与字节对象是不兼容的,要将 bytes 转变为 str, bytes 对象必须要进行解码,使用decode() 方法:

  1. b = bytes('This is string', 'UTF-8')
  2. print(b, b.decode(), sep='\n')
  3. # 输出:
  4. # b'This is string'
  5. # This is string

文件对象的方法(假设f是一个文件对象):

f.read(size) :读取size个字节的数据,然后作为字符串或 bytes 对象返回。size是一个可选参数,如果不指定size,则读取文件的所有内容。

f.readline() :读取一行。在字符串末尾会留下换行符 (\n),如果到文件尾,返回空字符串。

f.readlines() :读取所有行,储存在列表中,每个元素是一行,相当于list(f)。

f.write(string) :将 string 写入到文件中,返回写入的字符数。如果以二进制模式写文件,需要将string转换为 bytes 对象。

f.tell() :返回文件对象当前所处的位置,它是从文件开头开始算起的字节数。

f.seek(offset, from_what) :改变文件对象所处的位置。offset是相对参考位置的偏移量,from_what 取值 0(文件头, 默认)、1(当前位置)、2(文件尾)表示参考位置。

f.close() :关闭文件对象。

这些都是很常用的方法,当然文件对象不止这些方法。根据打开的模式不同,open() 返回的文件对象类型也不同:

TextIOWrapper:文本模式,返回TextIOWrapper对象。

BufferedReader:读二进制,即rb,返回BufferedReader对象。

BufferedWriter:写和追加二进制,即wb、ab,返回BufferedWriter对象。

BufferedRandom:读/写模式,即含有+的模式,返回BufferedRandom对象。

可以在这些文件对象上运行 dir() 或 help(),查看它们所有的方法。

操作函数目录

对文件、文件夹的操作

需要涉及到os模块和shutil模块。

(1)得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()

(2)返回指定目录下的所有文件和目录名:os.listdir()

(3)函数用来删除一个文件:os.remove()

(4)删除多个目录:os.removedirs(r”c:\python”)

(5)检验给出的路径是否是一个文件:os.path.isfile()

(6)检验给出的路径是否是一个目录:os.path.isdir()

(7)判断是否是绝对路径:os.path.isabs()

(8)检验给出的路径是否真地存:os.path.exists()

(9)返回一个路径的目录名和文件名:

  1. os.path.split()

例如:

  1. os.path.split('/home/swaroop/byte/code/poem.txt')

结果:

  1. ('/home/swaroop/byte/code', 'poem.txt')

(10)分离扩展名:os.path.splitext()

  1. >>> t=os.path.splitext("d:\d.txt")
  2. >>> t[0]
  3. 'd:\\d'
  4. >>> t[1]
  5. '.txt'

(11)获取路径名:os.path.dirname()

(12)获取文件名:os.path.basename()

(12)运行shell命令: os.system()

(13)读取和设置环境变量:os.getenv() 与os.putenv()

(14)给出当前平台使用的行终止符:os.linesep

Windows使用’\r\n’,Linux使用’\n’而Mac使用’\r’

指示你正在使用的平台:os.name对于Windows,它是’nt’,而对于Linux/Unix用户,它是’posix’

(15)重命名:os.rename(old, new)

(16)创建多级目录:os.makedirs(r”c:\python\test”)

(17)创建单个目录:os.mkdir(“test”)

(18)获取文件属性:os.stat(file)

(19)修改文件权限与时间戳:os.chmod(file)

(20)终止当前进程:os.exit()

(21)获取文件大小:os.path.getsize(filename)

文件操作

os.mknod(“test.txt”) 创建空文件

fp = open(“test.txt”, ‘w’) 直接打开一个文件,如果文件不存在则创建文件

关于open 模式:

w 以写方式打开,

a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+ 以读写模式打开

w+ 以读写模式打开 (参见 w )

a+ 以读写模式打开 (参见 a )

rb 以二进制读模式打开

wb 以二进制写模式打开 (参见 w )

ab 以二进制追加模式打开 (参见 a )

rb+ 以二进制读写模式打开 (参见 r+ )

wb+ 以二进制读写模式打开 (参见 w+ )

ab+ 以二进制读写模式打开 (参见 a+ )

  1. fp.read([size]) #size为读取的长度,以byte为单位
  2. fp.readline([size]) #读一行,如果定义了size,有可能返回的只是一行的一部分
  3. fp.readlines([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
  4. fp.write(str) #把str写到文件中,write()并不会在str后加上一个换行符
  5. fp.writelines(seq) #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
  6. fp.close() #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError
  7. fp.flush() #把缓冲区的内容写入硬盘
  8. fp.fileno() #返回一个长整型的"文件标签"
  9. fp.isatty() #文件是否是一个终端设备文件(unix系统中的)
  10. fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点
  11. fp.next() #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
  12. fp.seek(offset[,whence]) #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
  13. fp.truncate([size]) #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

目录操作

import shutil

shutil — High-level file operations 是一种高层次的文件操作工具

类似于高级API,而且主要强大之处在于其对文件的复制与删除操作。

(1)创建目录os.mkdir(“file”)

(2)复制文件:

shutil.copyfile(“oldfile”,”newfile”) oldfile和newfile都只能是文件

shutil.copy(“oldfile”,”newfile”) oldfile只能是文件夹,newfile可以是文件,也可以是目标目录

(3)复制文件夹:

shutil.copytree(“olddir”,”newdir”) olddir和newdir都只能是目录,且newdir必须不存在

(4)重命名文件(目录)

os.rename(“oldname”,”newname”) 文件或目录都是使用这条命令

(5)移动文件(目录)

shutil.move(“oldpos”,”newpos”)

(6)删除文件

os.remove(“file”)

(7)删除目录

os.rmdir(“dir”)只能删除空目录

shutil.rmtree(“dir”) 空目录、有内容的目录都可以删

(8)转换目录

os.chdir(“path”) 换路径

Example:

(使用os.listdir)

  1. import os
  2. def ListFilesToTxt(dir,file,wildcard,recursion):
  3. exts = wildcard.split(" ")
  4. files = os.listdir(dir)
  5. for name in files:
  6. fullname=os.path.join(dir,name)
  7. if(os.path.isdir(fullname) & recursion):
  8. ListFilesToTxt(fullname,file,wildcard,recursion)
  9. else:
  10. for ext in exts:
  11. if(name.endswith(ext)):
  12. file.write(name + "\n")
  13. break
  14. def Test():
  15. dir="/datas/Pdata"
  16. outfile="binaries.txt"
  17. wildcard = ".txt .exe .dll .lib"
  18. file = open(outfile,"w")
  19. if not file:
  20. print ("cannot open the file %s for writing" % outfile)
  21. ListFilesToTxt(dir,file,wildcard, 1)
  22. file.close()

Test()

代码:(使用os.walk) walk递归地对目录及子目录处理,每次返回的三项分别为:当前递归的目录,当前递归的目录下的所有子目录,当前递归的目录下的所有文件。

  1. import os
  2. def ListFilesToTxt(dir,file,wildcard,recursion):
  3. exts = wildcard.split(" ")
  4. for root, subdirs, files in os.walk(dir):
  5. for name in files:
  6. for ext in exts:
  7. if(name.endswith(ext)):
  8. file.write(name + "\n")
  9. break
  10. if(not recursion):
  11. break
  12. def Test():
  13. dir="/datas/Pdata"
  14. outfile="binaries.txt"
  15. wildcard = ".txt .exe .dll .lib"
  16. file = open(outfile,"w")
  17. if not file:
  18. print ("cannot open the file %s for writing" % outfile)
  19. ListFilesToTxt(dir,file,wildcard, 0)
  20. file.close()

Test()

运行结果:

70 4

案例

将文件夹下所有图片名称加上’_fc’

python代码:

  1. # -*- coding:utf-8 -*-
  2. import re
  3. import os
  4. import time
  5. #str.split(string)分割字符串
  6. #'连接符'.join(list) 将列表组成字符串
  7. def change_name(path):
  8. global i
  9. if not os.path.isdir(path) and not os.path.isfile(path):
  10. return False
  11. if os.path.isfile(path):
  12. file_path = os.path.split(path) #分割出目录与文件
  13. lists = file_path[1].split('.') #分割出文件与文件扩展名
  14. file_ext = lists[-1] #取出后缀名(列表切片操作)
  15. img_ext = ['bmp','jpeg','gif','psd','png','jpg']
  16. if file_ext in img_ext:
  17. os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
  18. i+=1 #注意这里的i是一个陷阱
  19. #或者
  20. #img_ext = 'bmp|jpeg|gif|psd|png|jpg'
  21. #if file_ext in img_ext:
  22. # print('ok---'+file_ext)
  23. elif os.path.isdir(path):
  24. for x in os.listdir(path):
  25. change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
  26. img_dir = 'D:\\xx\\xx\\images'
  27. img_dir = img_dir.replace('\\','/')
  28. start = time.time()
  29. i = 0
  30. change_name(img_dir)
  31. c = time.time() - start
  32. print('程序运行耗时:%0.2f'%(c))
  33. print('总共处理了 %s 张图片'%(i))

输出结果:

70 5

图片改名结果:

70 6

发表评论

表情:
评论列表 (有 0 条评论,377人围观)

还没有评论,来说两句吧...

相关阅读

    相关 python文件操作

    文件基礎操作: 文件操作類型分為:文本操作、二進制操作 文件操作步驟: 打開文件。方法:open(“文件路徑”, “操作模式”),返回一個可操作的文件對象。

    相关 python 文件操作

    对于文件,我们通常有以下几种操作: 读操作 写操作 文件类型拷贝 图片类型的拷贝 文件的读取方式 1、第一种方式 打开文件,读取,关闭文件

    相关 Python 文件操作

    文件操作 open() 打开 file 文件的位置(路径) mode 操作文件的模式 encoding() 文件编码方式 f 文件句柄 操作文件: