Python中的十个安全陷阱(一)-电子发烧友网

Python 开发者们在使用标准库和通用框架时，都以为自己的程序具有可靠的安全性。然而，在 Python 中，就像在任何其它编程语言中一样，有一些特性可能会被开发者们误解或误用。通常而言，只有极少的微妙之处或细节会使开发者们疏忽大意，从而在代码中引入严重的安全漏洞。

在这篇博文中，我们将分享在实际 Python 项目中遇到的 10 个安全陷阱。我们选择了一些在技术圈中不太为人所知的陷阱。通过介绍每个问题及其造成的影响，我们希望提高人们对这些问题的感知，并提高大家的安全意识。如果你正在使用这些特性，请一定要排查你的 Python 代码！

1.被优化掉的断言

Python 支持以优化的方式执行代码。这使代码运行得更快，内存用得更少。当程序被大规模使用，或者可用的资源很少时，这种方法尤其有效。一些预打包的 Python 程序提供了优化的字节码。

然而，当代码被优化时，所有的 assert 语句都会被忽略。开发者有时会使用它们来判断代码中的某些条件。例如，如果使用断言来作身份验证检查，则可能导致安全绕过。

defsuperuser_action(request,user):
assertuser.is_super_user
#executeactionassuperuser

在这个例子中，第 2 行中的 assert 语句将被忽略，导致非超级用户也可以运行到下一行代码。不推荐使用 assert 语句进行安全相关的检查，但我们确实在实际的项目中看到过它们。

2. MakeDirs 权限

os.makdirs 函数可以在操作系统中创建一个或多个文件夹。它的第二个参数 mode 用于指定创建的文件夹的默认权限。在下面代码的第 2 行中，文件夹 A/B/C 是用 rwx------ (0o700) 权限创建的。这意味着只有当前用户（所有者）拥有这些文件夹的读、写和执行权限。

definit_directories(request):
os.makedirs("A/B/C",mode=0o700)
returnHttpResponse("Done!")

在 Python < 3.6 版本中，创建出的文件夹 A、B 和 C 的权限都是 700。但是，在 Python > 3.6 版本中，只有最后一个文件夹 C 的权限为 700，其它文件夹 A 和 B 的权限为默认的 755。

因此，在 Python > 3.6 中，os.makdirs 函数等价于 Linux 的这条命令：mkdir -m 700 -p A/B/C。有些开发者没有意识到版本之间的差异，这已经在 Django 中造成了一个权限越级漏洞（cve - 2022 -24583），无独有偶，这在 WordPress 中也造成了一个加固绕过问题。

3.绝对路径拼接

os.path.join(path, *paths) 函数用于将多个文件路径连接成一个组合的路径。第一个参数通常包含了基础路径，而之后的每个参数都被当做组件拼接到基础路径后。

然而，这个函数有一个少有人知的特性。如果拼接的某个路径以 / 开头，那么包括基础路径在内的所有前缀路径都将被删除，该路径将被视为绝对路径。下面的示例揭示了开发者可能遇到的这个陷阱。

defread_file(request):
filename=request.POST['filename']
file_path=os.path.join("var","lib",filename)
iffile_path.find(".")!=-1:
    returnHttpResponse("Failed!")
withopen(file_path)asf:
    returnHttpResponse(f.read(),content_type='text/plain')

在第 3 行中，我们使用 os.path.join 函数将用户输入的文件名构造出目标路径。在第 4 行中，检查生成的路径是否包含”.“，防止出现路径遍历漏洞。

但是，如果攻击者传入的文件名参数为”/a/b/c.txt“，那么第 3 行得到的变量 file_path 会是一个绝对路径（/a/b/c.txt）。即 os.path.join 会忽略掉”var/lib“部分，攻击者可以不使用“.”字符就读取到任何文件。尽管 os.path.join 的文档中描述了这种行为，但这还是导致了许多漏洞（Cuckoo Sandbox Evasion， CVE-2020-35736）。

4. 任意的临时文件

tempfile.NamedTemporaryFile 函数用于创建具有特定名称的临时文件。但是，prefix（前缀）和 suffix（后缀）参数很容易受到路径遍历攻击（Issue 35278）。如果攻击者控制了这些参数之一，他就可以在文件系统中的任意位置创建出一个临时文件。下面的示例揭示了开发者可能遇到的一个陷阱。

def touch_tmp_file(request):
    id = request.GET['id']
    tmp_file = tempfile.NamedTemporaryFile(prefix=id)
    return HttpResponse(f"tmp file: {tmp_file} created!", content_type='text/plain')

在第 3 行中，用户输入的 id 被当作临时文件的前缀。如果攻击者传入的 id 参数是“/../var/www/test”，则会创建出这样的临时文件：/var/www/test_zdllj17。粗看起来，这可能是无害的，但它会为攻击者创造出挖掘更复杂的漏洞的基础。

5.扩展的 Zip Slip

在 Web 应用中，通常需要解压上传后的压缩文件。在 Python 中，很多人都知道 TarFile.extractall 与 TarFile.extract 函数容易受到 Zip Slip 攻击。攻击者通过篡改压缩包中的文件名，使其包含路径遍历（../）字符，从而发起攻击。

这就是为什么压缩文件应该始终被视为不受信来源的原因。zipfile.extractall 与 zipfile.extract 函数可以对 zip 内容进行清洗，从而防止这类路径遍历漏洞。

但是，这并不意味着在 ZipFile 库中不会出现路径遍历漏洞。下面是一段解压缩文件的代码。

def extract_html(request):
    filename = request.FILES['filename']
    zf = zipfile.ZipFile(filename.temporary_file_path(), "r")
    for entry in zf.namelist():
        if entry.endswith(".html"):
            file_content = zf.read(entry)
            with open(entry, "wb") as fp:
                fp.write(file_content)
    zf.close()
    return HttpResponse("HTML files extracted!")

第 3 行代码根据用户上传文件的临时路径，创建出一个 ZipFile 处理器。第 4 - 8 行代码将所有以“.html”结尾的压缩项提取出来。第 4 行中的 zf.namelist 函数会取到 zip 内压缩项的名称。注意，只有 zipfile.extract 与 zipfile.extractall 函数会对压缩项进行清洗，其它任何函数都不会。

在这种情况下，攻击者可以创建一个文件名，例如“../../../var/www/html”，内容随意填。该恶意文件的内容会在第 6 行被读取，并在第 7-8 行写入被攻击者控制的路径。因此，攻击者可以在整个服务器上创建任意的 HTML 文件。

如上所述，压缩包中的文件应该被看作是不受信任的。如果你不使用 zipfile.extractall 或者 zipfile.extract，你就必须对 zip 内文件的名称进行“消毒”，例如使用 os.path.basename。否则，它可能导致严重的安全漏洞，就像在 NLTK Downloader （CVE-2019-14751）中发现的那样。
审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

程序

程序

+关注

关注
117

文章
3788

浏览量
81130
代码

代码

+关注

关注
30

文章
4793

浏览量
68703
python

python

+关注

关注
56

文章
4797

浏览量
84778

一个月速成python+OpenCV图像处理

OpenCV是一个广受欢迎且极为流行的计算机视觉库，它因其强大的功能、灵活性和开源特性而在开发者和研究者中备受青睐。学习OpenCV主要就是学习里面的计算机视觉算法。要学习这些算法的原理，知道它们

发表于 11-29 18:27 •153次阅读

<b class='flag-5'>一个</b>月速成<b class='flag-5'>python</b>+OpenCV图像处理

Python中dict支持多个key的方法

在Python中，字典（dict）是一种非常强大的数据结构，它允许我们通过键（key）来存储和检索值（value）。有时候，我们可能想要根据多个键来检索或操作字典中的数据。虽然

发表于 11-29 15:59 •180次阅读

C++新手容易犯的十个编程错误

简单的总结一下 C++ 新手容易犯的一些编程错误，给新人们提供一个参考。 1 有些关键字在 cpp 文件中多写了对于 C++ 类，

发表于 11-15 12:42 •399次阅读

Python中多线程和多进程的区别

Python作为一种高级编程语言，提供了多种并发编程的方式，其中多线程与多进程是最常见的两种方式之一。在本文中，我们将探讨Python中多线

发表于 10-23 11:48 •413次阅读

<b class='flag-5'>Python</b><b class='flag-5'>中</b>多线程和多进程的区别

【每天学点AI】一个例子带你了解Python装饰器到底在干嘛！

进行“加料”呢？Python装饰器提供了一个更为优雅的方式来增强现有函数的行为，并且不需要修改现有的函数代码及调用方式。接下来通过一个案例来

发表于 09-20 16:54 •564次阅读

【每天学点AI】<b class='flag-5'>一</b><b class='flag-5'>个</b>例子带你了解<b class='flag-5'>Python</b>装饰器到底在干嘛！

Python在AI中的应用实例

Python在人工智能（AI）领域的应用极为广泛且深入，从基础的数据处理、模型训练到高级的应用部署，Python都扮演着至关重要的角色。以下将详细探讨Python在AI中的几个关键应用

发表于 07-19 17:16 •1145次阅读

opencv-python和opencv一样吗

不一样。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了大量的图像和视频处理功能。OpenCV-Pytho

发表于 07-16 10:38 •1243次阅读

如何在Python中开发人工智能

在Python中开发人工智能（AI）是一个广泛而深入的主题，它涵盖了从基础的数据处理到复杂的机器学习、深度学习以及自然语言处理等多个领域。

发表于 07-15 15:01 •2218次阅读

python训练出的模型怎么调用

在Python中，训练出的模型可以通过多种方式进行调用。 1. 模型保存与加载在Python中，训练好的模型需要被保存，以便在其他程序或会话中使用。以下是

发表于 07-11 10:15 •2015次阅读

用pycharm进行python爬虫的步骤

以下是使用PyCharm进行Python爬虫的步骤：安装PyCharm和Python 首先，您需要安装PyCharm和Python。PyCharm是一

发表于 07-11 10:11 •880次阅读

具有十个解码输出的十进位计数器/除法器数据表

电子发烧友网站提供《具有十个解码输出的十进位计数器/除法器数据表.pdf》资料免费下载

发表于 05-17 10:47 •0次下载

如何使用linux下gdb来调试python程序

如何使用linux下gdb来调试python程序在Linux下，可以使用GDB（GNU调试器）来调试Python程序。GDB是一个强大的调试工具，可以帮助开发者诊断和修复程序

发表于 01-31 10:41 •2653次阅读

python中open函数的用法详解

python中open函数的用法详解 Python中的open()函数用于打开文件。它接受文件名和模式作为参数，并返回一

发表于 01-30 15:31 •2154次阅读

中国工业软件产业发展的十个误区

对于工业软件，多数人一直忽略了一个核心问题：我们真的需要做出大鳄们一样厉害的软件么？我们经常讲对标，到底应该对什么标？现在每天讲突破“卡脖子”困局，讲国产替代，于是，就想当然地对标国际

发表于 01-14 09:29 •850次阅读

如何解决Python爬虫中文乱码问题？Python爬虫中文乱码的解决方法

如何解决Python爬虫中文乱码问题？Python爬虫中文乱码的解决方法在Python爬虫过程中，遇到中文乱码问题是常见的情况。乱码问题主要是由于编码不

发表于 01-12 15:11 •2451次阅读

搜索历史

Python中的十个安全陷阱(一)

1.被优化掉的断言

2. MakeDirs 权限

3.绝对路径拼接

4. 任意的临时文件

5.扩展的 Zip Slip

评论

一个月速成python+OpenCV图像处理

Python中dict支持多个key的方法

C++新手容易犯的十个编程错误

Python中多线程和多进程的区别

【每天学点AI】一个例子带你了解Python装饰器到底在干嘛！

Python在AI中的应用实例

opencv-python和opencv一样吗

如何在Python中开发人工智能

python训练出的模型怎么调用

用pycharm进行python爬虫的步骤

具有十个解码输出的十进位计数器/除法器数据表

如何使用linux下gdb来调试python程序

python中open函数的用法详解

中国工业软件产业发展的十个误区

如何解决Python爬虫中文乱码问题？Python爬虫中文乱码的解决方法