shutil庫:Python高級文件操作
目錄
前言
copyfile()
copy()與copy2()
copymode()與copystat()
復制整個文件夾
參數copy_function
參數ignore
刪除整個文件夾
移動文件夾或文件
查找文件
歸檔
壓縮文件
解壓縮
文件系統空間
前言
什么算是高層的文件操作呢?
普通的文件操作,我們一般只涉及創建文件,文件夾以及寫入文件等等。假如我現在需要復制一個文件的內容到另一個文件之中,用pathlib等都只能先打開復制文件,然后進行將其讀出來保存,然后再寫入新的文件,這種普通的復制操作,無形之中增加了許多步驟。
而shutil庫可以直接完成復制符間的操作,同時還支持歸檔。本篇,將詳細介紹文件的高層次操作。
copyfile()
copyfile()函數用于將一個文件的內容復制到另一個文件之中,準備的來說,它不是copy內容,而是直接copy文件,并重命名。
示例如下:
import shutil shutil.copyfile('week.csv', 'week_copy.csv')
1
2
3
很簡單,就一行代碼,第1個參數是需要copy的源文件,第2個參數是需要復制的新文件。運行之后,效果如下:
copy()與copy2()
不過,copyfile()函數用于復制文件有一個缺陷,該函數的原理是通過打開源文件進行讀取。所以,如果是某些特殊的文件,比如是UNIX設備節點,沒有權限會報IOERROR錯誤。
還需要注意的是,通過copyfile()函數復制的文件是一個新文件,它不包括舊文件的訪問時間與修改時間。
而copy2()函數可以復制文件后保留訪問時間,修改時間。示例如下:
import shutil import os import time shutil.copy2('week.csv', 'week_copy.csv') stat_info1 = os.stat('week.csv') stat_info2 = os.stat('week_copy.csv') print("源文件信息") print(oct(stat_info1.st_mode)) print('文件創建時間:{}'.format(time.ctime(stat_info1.st_ctime))) print('文件訪問時間:{}'.format(time.ctime(stat_info1.st_atime))) print('文件修改時間:{}'.format(time.ctime(stat_info1.st_mtime))) print("復制文件信息") print(oct(stat_info2.st_mode)) print('文件創建時間:{}'.format(time.ctime(stat_info2.st_ctime))) print('文件訪問時間:{}'.format(time.ctime(stat_info2.st_atime))) print('文件修改時間:{}'.format(time.ctime(stat_info2.st_mtime)))
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
運行之后,效果如下:
而copy()與copyfile()一樣都是復制文件的函數,不過copy()你給它一個文件夾名或者文件都可以復制,如果給文件夾名稱,它會復制到文件夾下的目錄中,當然復制的文件同名。而copyfile()如果給的是一個文件夾名稱會報錯。
示例如下:
import shutil import os os.mkdir('data') shutil.copy('week.csv', 'data')
1
2
3
4
5
運行之后,效果如下:
copymode()與copystat()
通過copy2()函數,我們知道了如何復制文件內容和文件信息等操作。但是其復制并不包含文件的權限,比如我們的Win10系統C盤中,有些文件只能讀不能寫,那么如果將權限也復制過去呢?
答案是:copymode()函數,示例如下:
import shutil import os, stat with open("temp.txt", 'wt') as file: file.write("11111111111111111") os.chmod("temp.txt", stat.S_IREAD) shutil.copymode('temp_copymode.txt', 'temp.txt') print(oct(os.stat('temp.txt').st_mode)) print(oct(os.stat('temp_copymode.txt').st_mode))
1
2
3
4
5
6
7
8
9
需要注意的是,copymode()復制的只是文件權限,不是文件,也就是被賦予權限的文件名必須存在后才能將某個文件的權限復制給它。比如這里temp_copymode.txt獲取temp.txt權限,那么temp_copymode.txt必須存在后才能操作。而且這只是復制權限,并沒有復制內容。(stat.S_IXGRP組用戶組執行權限)
至于copystat()函數,不僅復制權限,而且也復制了文件的信息。具體代碼如下:
import shutil import os, stat import time with open("temp.txt", 'wt') as file: file.write("11111111111111111") os.chmod("temp.txt", stat.S_IXGRP) shutil.copystat('temp_copymode.txt', 'temp.txt') stat_info1 = os.stat('temp.txt') stat_info2 = os.stat('temp_copymode.txt') print("源文件信息") print(oct(stat_info1.st_mode)) print('文件創建時間:{}'.format(time.ctime(stat_info1.st_ctime))) print('文件訪問時間:{}'.format(time.ctime(stat_info1.st_atime))) print('文件修改時間:{}'.format(time.ctime(stat_info1.st_mtime))) print("復制文件信息") print(oct(stat_info2.st_mode)) print('文件創建時間:{}'.format(time.ctime(stat_info2.st_ctime))) print('文件訪問時間:{}'.format(time.ctime(stat_info2.st_atime))) print('文件修改時間:{}'.format(time.ctime(stat_info2.st_mtime)))
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
運行之后,效果如下:
復制整個文件夾
上面的所有復制都是針對單個文件的操作,但其實我們還會在實際的項目中,將整個文件夾復制到另一個位置。而且復制整個文件夾肯定會用到遞歸,不過shutil庫有一個更簡單的函數用于實現該操作:copytree()。
示例如下:
import shutil shutil.copytree('./text', './text_copy')
1
2
3
這里一行代碼就可以完成整個文件夾的實現。需要注意的是,第2個參數為需要復制到的目錄,但該文件夾不能存在,copytree()函數會自動創建的,如果存在會報錯。
參數copy_function
有時候,我們復制文件夾并不是需要將整個文件夾都復制過來,而是只需要指定的符合規則的文件,比如我們只需要某個文件夾下的所有后綴為py的文件,那么怎么篩選呢?
示例如下:
import shutil def verbose_copy(src, dst): if src.endswith(".py"): return shutil.copy2(src, dst) shutil.copytree('./text', './text_copy', copy_function=verbose_copy)
1
2
3
4
5
6
7
這里,我們通過copytree()函數的參數copy_function進行參數,該參數提供一個函數用于篩選符合規則的文件進行復制,比如這里,我們提供了一個函數,并判斷后綴是否是.py然后再創建,當然,它會保存目錄結構,但只復制.py后綴的文件。
參數ignore
copytree()不僅只有copy_function參數,還有一個ignore參數,它可以過濾掉某些文件,比如還是如上面一樣,但是我們不需要.py后綴的文件,其他文件都復制,那么可以這樣實現。
import shutil shutil.copytree('./text', './text_copy', ignore=shutil.ignore_patterns('*.py'))
1
2
3
這樣,就不會復制*.py規則的文件。
刪除整個文件夾
既然有復制整個文件夾,那么肯定shutil庫也會提供反向的操作用于刪除整個文件夾。刪除整個文件夾的函數為:rmtree()。
import shutil shutil.rmtree('./text_copy')
1
2
3
這樣,我們就刪除了上面復制的文件夾內容。
移動文件夾或文件
除了復制文件與文件夾之外,我們在實際的項目中,還會移動整個某個文件或某個目錄到另一個位置,shutil庫提供了move()函數用于移動文件或文件夾。
示例如下:
import shutil shutil.move('week.csv', './text')
1
2
3
這里,我們將csv文件移動到了剛才用于復制的text源文件目錄。(移動文件夾一樣操作,只是將文件名改為文件夾名)
查找文件
在更多的文件操作中,我們往往還需要查找某個文件。而shutil庫提供了which()函數用于搜索查找目標文件。它有3個參數:mode可以設置查找文件的權限,path為需要查找的路徑,cmd為要查找的文件。
示例如下:
import shutil filename = shutil.which('python') print(filename)
1
2
3
4
運行之后,效果如下:
歸檔
shutil庫提供了更多高層函數來創建和解壓歸檔文件。我們先來看看shutil庫支持哪些格式,示例如下:
import shutil for format,desc in shutil.get_archive_formats(): print('{:<5}:{}'.format(format,desc))
1
2
3
4
運行之后,效果如下:
簡單的理解就是支持的壓縮格式。
壓縮文件
我們先來看一個簡單的例子,將某個文件夾進行壓縮,代碼如下:
import shutil shutil.make_archive('text','gztar',root_dir='..',base_dir='base_demo')
1
2
3
這里我們將text文件夾,壓縮格式為gztar。運行之后,效果如下:
其中,root_dir指定要壓縮的路徑根目錄(默認當前目錄),只能指定路徑,優先級低于base_dir。base_dir指定要壓縮文件的路徑,可以指定路徑下的文件名,也可以指定路徑。
解壓縮
既然有壓縮,肯定也就有解壓縮。shutil庫提供了unpack_archive()進行解壓縮文件。示例如下:
import shutil shutil.unpack_archive('text.tar.gz',extract_dir='text_un')
1
2
3
unpack_archive()函數的第1個參數為需要解壓的文件,第2個參數為需要解壓到哪里。
文件系統空間
完成一個長時間運行的可能耗盡可用空間的操作之前,最好先檢查本地文件系統,來看看有多少可用的空間。shutil庫提供了disk_usage()函數來返回包括總空間,當前正在使用的空間以及未使用的空間。
示例如下:
import shutil (total, used, free) = shutil.disk_usage("E:/") BytesPerGB = 1024 * 1024 * 1024 print ("Total: %.2fGB" % (float(total)/BytesPerGB)) print ("Used: %.2fGB" % (float(used)/BytesPerGB)) print ("Free: %.2fGB" % (float(free)/BytesPerGB))
1
2
3
4
5
6
7
運行之后,效果如下:
這里博主是獲取電腦E盤的信息,比如這里獲取到E盤總大小total為238G,已使用Used為43G,未使用Free:194G。一個健壯的程序必然很嚴謹,所以在操作文件時,特別是比較大的文件時,一定要判斷磁盤的大小之后再操作。
Python
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。