0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用Python对压缩文件的处理

马哥Linux运维 来源:Python编程学习圈 作者:Python编程学习圈 2022-03-29 11:29 次阅读

在日常工作中,除了会涉及到使用Python处理文本文件,有时候还会涉及对压缩文件的处理。

通常会涉及到的压缩文件格式有:
  • rar:Windows 环境下用的比较多的压缩,比较著名的GUI工具是winrar
  • tar: Linux系统下的打包工具,只打包,不压缩
  • gz:即gzip,通常只能压缩一个文件。与tar结合起来就可以实现先打包,再压缩。
  • tgz:即gz。先用tar打包,然后再用gz压缩得到的文件
  • zip:不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar
  • 7z:7zip压缩软件支持的格式,压缩效率较高。
当然除了使用Python外,你还可以选择使用压缩解压缩软件或命令手动进行处理。

zip文件

zipfile是Python里用来做zip格式编码的压缩和解压缩的module,zipfile里有两个非常重要的class:ZipFile和ZipInfo。ZipFile是主要的类,用来创建和读取zip文件,而ZipInfo是存储的zip文件的每个文件的信息。 示例代码:
import osimport zipfile

# 压缩def make_zip(source_dir, output_filename):    zipf = zipfile.ZipFile(output_filename, 'w')    pre_len = len(os.path.dirname(source_dir))    for parent, dirnames, filenames in os.walk(source_dir):        for filename in filenames:            print(filename)            pathfile = os.path.join(parent, filename)            arcname = pathfile[pre_len:].strip(os.path.sep)  # 相对路径            zipf.write(pathfile, arcname)        print()    zipf.close()

# 解压缩def un_zip(file_name):    """unzip zip file"""    zip_file = zipfile.ZipFile(file_name)    if os.path.isdir(file_name + "_files"):        pass    else:        os.mkdir(file_name + "_files")    for names in zip_file.namelist():        zip_file.extract(names, file_name + "_files/")    zip_file.close()

if __name__ == '__main__':    make_zip(r"E:python_samplelibstest_tar_fileslibs", "test.zip")    un_zip("test.zip")

tar.gz文件

tarfile 模块可以用来读写 tar 归档,包括使用 gzip, bz2 和 lzma 压缩的归档。在使用tarfile是必须了解模式: mode 必须是 ‘filemode[:compression]’ 形式的字符串,其默认值为 ‘r’。以下是模式组合的完整列表:

模式

动作

‘r’or‘r:*’

打开和读取使用透明压缩(推荐)。

‘r:’

打开和读取不使用压缩。

‘r:gz’

打开和读取使用gzip 压缩。

‘r:bz2’

打开和读取使用bzip2 压缩。

‘r:xz’

打开和读取使用lzma 压缩。

‘x’或‘x:’

创建tarfile不进行压缩。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:gz’

使用gzip压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:bz2’

使用bzip2 压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘x:xz’

使用lzma 压缩创建tarfile。如果文件已经存在,则抛出 FileExistsError 异常。

‘a’or‘a:’

打开以便在没有压缩的情况下追加。如果文件不存在,则创建该文件。

‘w’or‘w:’

打开用于未压缩的写入。

‘w:gz’

打开用于 gzip 压缩的写入。

‘w:bz2’

打开用于 bzip2 压缩的写入。

‘w:xz’

打开用于 lzma 压缩的写入。

针对特殊的目的,还存在第二种 mode 格式: ‘filemode|[compression]’。tarfile.open() 将返回一个将其数据作为数据块流来处理的 TarFile 对象:

模式

动作

‘r|*’

打开 tar 块的流以进行透明压缩读取。

‘r|’

打开一个未压缩的 tar 块的 stream 用于读取。

‘r|gz’

打开一个 gzip 压缩的 stream 用于读取。

‘r|bz2’

打开一个 bzip2 压缩的 stream 用于读取。

‘r|xz’

打开一个 lzma 压缩 stream 用于读取。

‘w|’

打开一个未压缩的 stream 用于写入。

‘w|gz’

打开一个 gzip 压缩的 stream 用于写入。

‘w|bz2’

打开一个 bzip2 压缩的 stream 用于写入。

‘w|xz’

打开一个 lzma 压缩的 stream 用于写入。

代码示例:

import osimport tarfileimport gzip

# 一次性打包整个根目录。空子目录会被打包。# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。def make_targz(output_filename, source_dir):    with tarfile.open(output_filename, "w:gz") as tar:        tar.add(source_dir, arcname=os.path.basename(source_dir))

# 逐个添加文件打包,未打包空子目录。可过滤文件。# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。def make_targz_one_by_one(output_filename, source_dir):    tar = tarfile.open(output_filename, "w:gz")    for root, dir, files in os.walk(source_dir):        for file in files:            pathfile = os.path.join(root, file)            tar.add(pathfile)    tar.close()

def un_gz(file_name):    """ungz zip file"""    f_name = file_name.replace(".gz", "")    # 获取文件的名称,去掉    g_file = gzip.GzipFile(file_name)    # 创建gzip对象    open(f_name, "wb+").write(g_file.read())    # gzip对象用read()打开后,写入open()建立的文件里。    g_file.close()  # 关闭gzip对象

def un_tar(file_name):    # untar zip file    tar = tarfile.open(file_name)    names = tar.getnames()    if os.path.isdir(file_name + "_files"):        pass    else:        os.mkdir(file_name + "_files")    # 由于解压后是许多文件,预先建立同名文件夹    for name in names:        tar.extract(name, file_name + "_files/")    tar.close()

if __name__ == '__main__':    make_targz('test.tar.gz', "E:python_samplelibs")    make_targz_one_by_one('test01.tgz', "E:python_samplelibs")    un_gz("test.tar.gz")    un_tar("test.tar")

rar文件

我们可以使用rarfile来解压.rar的文件,但是不支持用rarfile来压缩rar文件。rarfile以下unrar组件,但是使用pip install unrar安装后发现会报如下错误: Couldn’t find path to unrar library… 这是因为 Python下的 unrar 还依赖了RAR官方的库。

Windows的安装

  • 到RARLab官方下载库文件,https://www.rarlab.com/rar/UnRARDLL.exe,然后安装。
  • 安装是最好选择默认路径,一般在 C:Program Files (x86)UnrarDLL 目录下。
  • 添加环境变量,在系统变量中新建变量名UNRAR_LIB_PATH,如果是64位系统,就输入 C:Program Files (x86)UnrarDLLx64UnRAR64.dll,如果是32位系统就是 C:Program Files (x86)UnrarDLLUnRAR.dll。
  • 确定保存环境变量后,在进行 pip install unrar 安装,这时代码再运行就不会报错了。
Linux的安装
  • 下载rar源文件:https://www.rarlab.com/rar/rarlinux-6.0.0.tar.gz
  • 解压安装包,进入安装包目录,编译安装,生成so 文件
  • 配置环境变量,完成后,在进行 pip install unrar 安装
# cd /usr/local/src/# wget https://www.rarlab.com/rar/unrarsrc-6.0.3.tar.gz# tar zxvf unrarsrc-6.0.3.tar.gz# cd unrar# make lib# make install-lib  //生成libunrar.so 文件# vim /etc/profileexport UNRAR_LIB_PATH=/usr/lib/libunrar.so# source /etc/profile

代码示例:

import rarfile

def unrar(rar_file, dir_name):    # rarfile需要unrar支持, linux下pip install unrar, windows下在winrar文件夹找到unrar,加到path里    rarobj = rarfile.RarFile(rar_file.decode('utf-8'))    rarobj.extractall(dir_name.decode('utf-8'))

7z文件

要压缩和解压缩.7z文件需要用到py7zr组件。代码示例:
import py7zr
# 压缩with py7zr.SevenZipFile("Archive.7z", 'r') as archive:    archive.extractall(path="/tmp")
# 解压缩with py7zr.SevenZipFile("Archive.7z", 'w') as archive:archive.writeall("target/")


原文标题:使用Python进行压缩与解压缩

文章出处:【微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4294

    浏览量

    85790
  • 编码
    +关注

    关注

    6

    文章

    940

    浏览量

    54809
  • python
    +关注

    关注

    56

    文章

    4792

    浏览量

    84620

原文标题:使用Python进行压缩与解压缩

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何在Linux使用unzip命令在终端解压缩文件

    ZIP是最广泛使用的存档文件格式,支持无损数据压缩。ZIP文件是一个数据容器,其中包含一个或多个压缩文件或目录。
    发表于 12-08 16:52 4792次阅读

    winrar压缩文件图标丢失(不见了)怎么办? 不能显示压缩文件

    winrar压缩文件图标丢失(不见了)怎么办? 不能显示压缩文件答:运行WinRAR程序,在选项里点综合,左面的WinRAR文件关联,全选,确定!如果不行的话可以先全部取消,再全部选中,试试.1
    发表于 11-12 12:17

    WinRAR压缩文件我们该知道的几个点【jiasuba】

    真正做到事半功倍。1.制作自解压文件  如果你平时使用Win7系统下载的WinRAR来压缩文件,而你的朋友也不会使用WinRAR,但你的数据又确实必须压缩后才能够给他。这时,我们就可以把RAR
    发表于 03-14 09:47

    NI LabVIEW 2013 License Activator压缩文件

    NI LabVIEW 2013NI License Activator压缩文件
    发表于 04-05 03:16

    压缩文件可以使用pdf压缩器吗

    `  压缩文件可以使用pdf压缩器吗?现在很多办公人员都会编辑各种文档格式的文件,也都掌握了将其它可编辑格式转换为PDF文件格式的方法,但是有时候PDF
    发表于 10-27 14:03

    树莓派压缩文件

    请问各位,怎么用树莓派压缩文件夹?
    发表于 09-13 10:03

    在 Linux 上压缩文件的 5 种方法

    在 Linux 上压缩文件的 5 种方法 在 Linux 系统上有很多可以用于压缩文件的工具,但它们的表现并不都是一样的,也不是所有的压缩效果都是一样的。在这篇文章中,我们比较其中的五个工具
    发表于 05-07 15:25

    在 Linux 上压缩文件的 5 种方法

    在 Linux 上压缩文件的 5 种方法作者:Sandra Henry-Stocker 在 Linux 上有不少用于压缩文件的命令。最新最有效的一个方法是 xz,但是所有的方法都有节省磁盘空间和维护
    发表于 05-13 15:45

    Linux如何压缩文件

    在Linux上压缩文件的5种方法
    发表于 12-30 08:00

    Qboot打包器无法打包fastlz压缩文件怎么解决呢?

    Qboot打包器无法打包fastlz压缩文件点击打包跳出红框, 选择其他压缩方式都能打包
    发表于 02-03 11:29

    压缩文件管理器WinRAR安装程序下载

    压缩文件管理器WinRAR安装程序下载
    发表于 08-31 10:45 15次下载

    钛金系列压缩与非压缩文件多镜像问题

    根据客户的反馈和需求,我们做了一个Ti60压缩与非压缩文件的多镜像与加载时间的验证。
    的头像 发表于 12-01 10:16 847次阅读
    钛金系列<b class='flag-5'>压缩</b>与非<b class='flag-5'>压缩文件</b>多镜像问题

    如何在Linux上使用Pigz来更快地压缩文件

    Pigz是一款快速压缩文件的工具,它能够使用多个CPU核心进行压缩,使得压缩速度得到了极大的提升。在本文中,我们将介绍如何在Linux上使用Pigz来更快地压缩文件
    的头像 发表于 05-12 16:42 2195次阅读
    如何在Linux上使用Pigz来更快地<b class='flag-5'>压缩文件</b>

    只读压缩文件系统EROFS的设计与实现

    EROFS是一个针对移动设备的只读压缩文件系统。作者观察到,当前手机配备的存储空间不大,而安卓系统的系统分区、各种app占用的空间越来越大。导致用户的实际可支配空间越来越小。如图所示,安卓系统
    的头像 发表于 08-31 15:09 2615次阅读
    只读<b class='flag-5'>压缩文件</b>系统EROFS的设计与实现

    java中的压缩文件是如何解压与压缩

    (String name):表示压缩文件中的一个文件或者目录 void putNextEntry(ZipEntry e):写入新的压缩文件或者目录 ZipIutputStream:是一种
    的头像 发表于 10-10 15:49 938次阅读