一文汇总并发http请求最快的几种实现方式用-电子发烧友网

假如有一个文件，里面有 10 万个 url，需要对每个 url 发送 http 请求，并打印请求结果的状态码，如何编写代码尽可能快的完成这些任务呢？

Python 并发编程有很多方法，多线程的标准库 threading，concurrency，协程 asyncio，当然还有 grequests 这种异步库，每一个都可以实现上述需求，下面一一用代码实现一下，本文的代码可以直接运行，给你以后的并发编程作为参考：

队列+多线程定义一个大小为 400 的队列，然后开启 200 个线程，每个线程都是不断的从队列中获取 url 并访问。

主线程读取文件中的 url 放入队列中，然后等待队列中所有的元素都被接收和处理完毕。代码如下：

fromthreadingimportThread
importsys
fromqueueimportQueue
importrequests

concurrent=200


defdoWork():
whileTrue:
url=q.get()
status,url=getStatus(url)
doSomethingWithResult(status,url)
q.task_done()


defgetStatus(ourl):
try:
res=requests.get(ourl)
returnres.status_code,ourl
except:
return"error",ourl


defdoSomethingWithResult(status,url):
print(status,url)


q=Queue(concurrent*2)
foriinrange(concurrent):
t=Thread(target=doWork)
t.daemon=True
t.start()

try:
forurlinopen("urllist.txt"):
q.put(url.strip())
q.join()
exceptKeyboardInterrupt:
sys.exit(1)

运行结果如下：

有没有 get 到新技能？

线程池

如果你使用线程池，推荐使用更高级的 concurrent.futures 库：

importconcurrent.futures
importrequests

out=[]
CONNECTIONS=100
TIMEOUT=5

urls=[]
withopen("urllist.txt")asreader:
forurlinreader:
urls.append(url.strip())

defload_url(url,timeout):
ans=requests.get(url,timeout=timeout)
returnans.status_code

withconcurrent.futures.ThreadPoolExecutor(max_workers=CONNECTIONS)asexecutor:
future_to_url=(executor.submit(load_url,url,TIMEOUT)forurlinurls)
forfutureinconcurrent.futures.as_completed(future_to_url):
try:
data=future.result()
exceptExceptionasexc:
data=str(type(exc))
finally:
out.append(data)
print(data)

协程 + aiohttp

协程也是并发非常常用的工具了：

importasyncio
fromaiohttpimportClientSession,ClientConnectorError

asyncdeffetch_html(url:str,session:ClientSession,**kwargs)->tuple:
try:
resp=awaitsession.request(method="GET",url=url,**kwargs)
exceptClientConnectorError:
return(url,404)
return(url,resp.status)

asyncdefmake_requests(urls:set,**kwargs)->None:
asyncwithClientSession()assession:
tasks=[]
forurlinurls:
tasks.append(
fetch_html(url=url,session=session,**kwargs)
)
results=awaitasyncio.gather(*tasks)

forresultinresults:
print(f'{result[1]}-{str(result[0])}')

if__name__=="__main__":
importsys
assertsys.version_info>=(3,7),"ScriptrequiresPython3.7+."
withopen("urllist.txt")asinfile:
urls=set(map(str.strip,infile))
asyncio.run(make_requests(urls=urls))

grequests[1]

这是个第三方库，目前有 3.8K 个星，就是 Requests + Gevent[2]，让异步 http 请求变得更加简单。Gevent 的本质还是协程。

使用前：

pipinstallgrequests

使用起来那是相当的简单：

importgrequests

urls=[]
withopen("urllist.txt")asreader:
forurlinreader:
urls.append(url.strip())

rs=(grequests.get(u)foruinurls)

forresultingrequests.map(rs):
print(result.status_code,result.url)

注意 grequests.map(rs) 是并发执行的。运行结果如下：

也可以加入异常处理：

>>>defexception_handler(request,exception):
...print("Requestfailed")

>>>reqs=[
...grequests.get('http://httpbin.org/delay/1',timeout=0.001),
...grequests.get('http://fakedomain/'),
...grequests.get('http://httpbin.org/status/500')]
>>>grequests.map(reqs,exception_handler=exception_handler)
Requestfailed
Requestfailed
[None,None,500]>]

最后的话

今天分享了并发 http 请求的几种实现方式，有人说异步（协程）性能比多线程好，其实要分场景看的，没有一种方法适用所有的场景，笔者就曾做过一个实验，也是请求 url，当并发数量超过 500 时，协程明显变慢。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

编程

编程

+关注

关注
88

文章
3619

浏览量
93781
HTTP

HTTP

+关注

关注
0

文章
510

浏览量
31295
URL

URL

+关注

关注
0

文章
139

浏览量
15365
python

python

+关注

关注
56

文章
4797

浏览量
84757

原文标题：如何用最快的方式发送 10 万个 http 请求？

文章出处：【微信号：LinuxHub，微信公众号：Linux爱好者】欢迎添加关注！文章转载请注明出处。

服务器如何处理 HTTP 请求

服务器处理HTTP请求的过程是一个有序且复杂的流程，通常涉及多个步骤。以下是服务器处理HTTP请求的具体步骤：监听端口：

发表于 12-30 09:37 •81次阅读

如何调试 HTTP 请求和响应

调试HTTP请求和响应是Web开发和网络编程中的一个重要技能。以下是一些步骤和工具，可以帮助你调试HTTP

发表于 12-30 09:28 •182次阅读

HTTP 1.1 和 HTTP 2.0 的区别

HTTP（超文本传输协议）是互联网上应用最为广泛的协议之一，用于在客户端和服务器之间传输数据。随着技术的发展，HTTP协议也在不断地更新和优化。HTTP/1.1是1999年发布的，而

发表于 12-30 09:25 •190次阅读

如何实现 HTTP 协议的安全性

HTTP（超文本传输协议）是互联网上应用最为广泛的协议之一，用于从服务器传输超文本到本地浏览器的传输协议。然而，HTTP协议本身并没有加密机制，因此传输的数据容易被窃听、篡改和伪造。为了实现

发表于 12-30 09:22 •207次阅读

HTTP 协议的工作原理

HTTP协议的工作原理 1. HTTP协议概述 HTTP是一个应用层协议，它定义了客户端与服务器之间请求和响应的格式。

发表于 12-30 09:21 •218次阅读

请问如何使用HTTP请求获取本地时间？

我正在尝试使用 AT 命令和 HTTP 请求获取本地时间，我已经从中获得了时间www.gooogle.com但这个时间是GMT时区，我想知道如何获取本地时区，我已经尝试过 AT CIPNTP，但它不起作用。

发表于 07-16 06:20

鸿蒙开发网络管理： @ohos.net.http 数据请求

每一个httpRequest对应一个http请求任务，不可复用

发表于 06-18 15:42 •847次阅读

手把手教学！HLK-LD2410B/C新手必看攻略！测试教程、模块调参一文详解~

HLK-LD2410B/C接线教程、参数解析、APP调参教程、上位机调参教程、常见异常情况自检等等内容，一文汇总。不管是萌新小白还是资深玩家，都可以快速入门。

发表于 05-31 14:48 •5227次阅读

串口屏的几种安装方式

串口屏的几种安装方式

发表于 05-10 11:28 •1574次阅读

鸿蒙OS开发实战：【网络管理HTTP数据请求】

应用通过HTTP发起一个数据请求，支持常见的GET、POST、OPTIONS、HEAD、PUT、DELETE、TRACE、CONNECT方法。

发表于 04-01 16:31 •704次阅读

鸿蒙原生应用开发-网络管理HTTP数据请求

一、场景介绍应用通过HTTP发起一个数据请求，支持常见的GET、POST、OPTIONS、HEAD、PUT、DELETE、TRACE、CONNECT方法。二、接口说明

发表于 03-29 17:51

鸿蒙OS开发实例：【工具类封装-http请求】

;@ohos.promptAction';** **封装HTTP接口请求类，提供格式化的响应信息输出功能。使用 DevEco Studio 3.1.1 Release 及以上版本，API 版本为 api 9 及以上

发表于 03-27 22:32 •1377次阅读

arkts http 发起请求失败

http 发起请求官网Http库

发表于 03-23 00:33

java实现多线程的几种方式

Java实现多线程的几种方式多线程是指程序中包含了两个或以上的线程，每个线程都可以并行执行不同的任务或操作。Java中的多线程可以提高程序的效率和性能，使得程序可以同时处理多个任务。 Java提供

发表于 03-14 16:55 •722次阅读

HTTP协议的运作方式及请求/响应的步骤

基于HTTP的客户/服务器模式的信息交换过程它分四个过程建立连接、发送请求信息、发送响应信息、关闭连接。

发表于 02-01 11:02 •1434次阅读