0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Python异步IO分析

马哥Linux运维 来源:工程师曾玲 2019-02-02 09:04 次阅读

异步操作在计算机软硬件体系中是一个普遍概念,根源在于参与协作的各实体处理速度上有明显差异。软件开发中遇到的多数情况是CPU与IO的速度不匹配,所以异步IO存在于各种编程框架中,客户端比如浏览器,服务端比如node.js。本文主要分析Python异步IO。

Python 3.4标准库有一个新模块asyncio,用来支持异步IO,不过目前API状态是provisional,意味着不保证向后兼容性,甚至可能从标准库中移除(可能性极低)。如果关注PEP和Python-Dev会发现该模块酝酿了很长时间,可能后续有API和实现上的调整,但毋庸置疑asyncio非常实用且功能强大,值得学习和深究。

示例

asyncio主要应对TCP/UDP socket通信,从容管理大量连接,而无需创建大量线程,提高系统运行效率。此处将官方文档的一个示例做简单改造,实现一个HTTP长连接benchmark工具,用于诊断WEB服务器长连接处理能力。

功能概述:

每隔10毫秒创建10个连接,直到目标连接数(比如10k),同时每个连接都会规律性的向服务器发送HEAD请求,以维持HTTP keepavlie。

代码如下:

importargparse

importasyncio

importfunctools

importlogging

importrandom

importurllib.parse

loop=asyncio.get_event_loop()

@asyncio.coroutine

defprint_http_headers(no,url,keepalive):

url=urllib.parse.urlsplit(url)

wait_for=functools.partial(asyncio.wait_for,timeout=3,loop=loop)

query=('HEAD {url.path} HTTP/1.1\r\n'

'Host: {url.hostname}\r\n'

'\r\n').format(url=url).encode('utf-8')

rd,wr=yieldfromwait_for(asyncio.open_connection(url.hostname,80))

whileTrue:

wr.write(query)

whileTrue:

line=yieldfromwait_for(rd.readline())

ifnotline:# end of connection

wr.close()

returnno

line=line.decode('utf-8').rstrip()

ifnotline:# end of header

break

logging.debug('(%d) HTTP header> %s'%(no,line))

yieldfromasyncio.sleep(random.randint(1,keepalive//2))

@asyncio.coroutine

defdo_requests(args):

conn_pool=set()

waiter=asyncio.Future()

def_on_complete(fut):

conn_pool.remove(fut)

exc,res=fut.exception(),fut.result()

ifexcisnotNone:

logging.info('conn#{} exception'.format(exc))

else:

logging.info('conn#{} result'.format(res))

ifnotconn_pool:

waiter.set_result('event loop is done')

foriinrange(args.connections):

fut=asyncio.async(print_http_headers(i,args.url,args.keepalive))

fut.add_done_callback(_on_complete)

conn_pool.add(fut)

ifi%10==0:

yieldfromasyncio.sleep(0.01)

logging.info((yieldfromwaiter))

defmain():

parser=argparse.ArgumentParser(description='asyncli')

parser.add_argument('url',help='page address')

parser.add_argument('-c','--connections',type=int,default=1,

help='number of connections simultaneously')

parser.add_argument('-k','--keepalive',type=int,default=60,

help='HTTP keepalive timeout')

args=parser.parse_args()

logging.basicConfig(level=logging.INFO,format='%(asctime)s %(message)s')

loop.run_until_complete(do_requests(args))

loop.close()

if__name__=='__main__':

main()

测试与分析

硬件:CPU 2.3GHz / 2 cores,RAM 2GB

软件:CentOS 6.5(kernel 2.6.32), Python 3.3 (pip install asyncio), nginx 1.4.7

参数设置:ulimit -n 10240;nginx worker的连接数改为10240

启动WEB服务器,只需一个worker进程:

# ../sbin/nginx

# ps ax | grep nginx

2007 ? Ss 0:00 nginx: master process ../sbin/nginx

2008 ? S 0:00 nginx: worker process

启动benchmark工具, 发起10k个连接,目标URL是nginx的默认测试页面:

$ python asyncli.py http://10.211.55.8/ -c 10000

nginx日志统计平均每秒请求数:

# tail -1000000 access.log | awk '{ print $4 }' | sort | uniq -c | awk '{ cnt+=1; sum+=$1 } END { printf "avg = %d\n", sum/cnt }'

avg = 548

top部分输出:

VIRT RES SHR S %CPU %MEM TIME+ COMMAND

657m 115m 3860 R 60.2 6.2 4:30.02 python

54208 10m 848 R 7.0 0.6 0:30.79 nginx

总结:

1. Python实现简洁明了。不到80行代码,只用到标准库,逻辑直观,想象下C/C++标准库实现这些功能,顿觉“人生苦短,我用Python”。

2. Python运行效率不理想。当连接建立后,客户端和服务端的数据收发逻辑差不多,看上面top输出,Python的CPU和RAM占用基本都是nginx的10倍,意味着效率相差100倍(CPU x RAM),侧面说明了Python与C的效率差距。这个对比虽然有些极端,毕竟nginx不仅用C且为CPU/RAM占用做了深度优化,但相似任务效率相差两个数量级,除非是BUG,说明架构设计的出发点就是不同的,Python优先可读易用而性能次之,nginx就是一个高度优化的WEB服务器,开发一个module都比较麻烦,要复用它的异步框架,简直难上加难。开发效率与运行效率的权衡,永远都存在。

3. 单线程异步IO v.s. 多线程同步IO。上面的例子是单线程异步IO,其实不写demo就知道多线程同步IO效率低得多,每个线程一个连接?10k个线程,仅线程栈就占用600+MB(64KB * 10000)内存,加上线程上下文切换和GIL,基本就是噩梦。

ayncio核心概念

以下是学习asyncio时需要理解的四个核心概念,更多细节请看<参考资料>

1. event loop。单线程实现异步的关键就在于这个高层事件循环,它是同步执行的。

2. future。异步IO有很多异步任务构成,而每个异步任务都由一个future控制。

3. coroutine。每个异步任务具体的执行逻辑由一个coroutine来体现。

4. generator(yield & yield from) 。在asyncio中大量使用,是不可忽视的语法细节。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    1505

    浏览量

    62190
  • python
    +关注

    关注

    56

    文章

    4800

    浏览量

    84834

原文标题:快学学Python异步IO轻松管理10k+并发连接

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Linux驱动学习笔记:异步IO

    前几篇介绍了几种IO模型,今天介绍另一种IO模型——异步IO
    发表于 06-12 16:24 719次阅读

    python有哪些方向?

    。3. 爬虫开发在爬虫领域,Python几乎是霸主地位,将网络一切数据作为资源,通过自动化程序进行有针对性的数据采集以及处理。从事该领域应学习爬虫策略、高性能异步IO、分布式爬虫等,并针对Scrapy
    发表于 03-09 15:47

    Python就业状况分析

    ,数据库,数据分析,云基础设施,设计,站点可靠性/测试,网络抓取,安全性,移动开发,API等等。根据列出的职位,机会倾向于国际化需求,尤其是在英国地区。在任何主要工作网站搜索“Python开发人员”,会返回
    发表于 05-23 15:20

    怎么有效学习Python数据分析

    Python在人工智能、机器学习领域受到火热追捧,很大程度上在于它拥有非常庞大的第三方库,以及强大的通用编程性能。因此,快速掌握Python进行数据分析,就是学习Python各种第三方
    发表于 06-28 15:18

    python 数据分析基础 day12-python调用mysql

    python 数据分析基础 day12-python调用mysql
    发表于 10-23 13:34

    Python中的并行性和并发性分析

    理,异步编程,并发和并行性。我们使用python的多处理模块来实现并行性,而Python中的并发是通过线程和异步IO模块来实现的。并行运行的
    发表于 08-21 17:45

    异步IO是什么

    python 异步ioAsync IO is a concurrent programming design that has received dedicated support
    发表于 09-06 07:26

    《Linux设备驱动开发详解》第9章、Linux设备驱动中的异步通知与异步IO

    《Linux设备驱动开发详解》第9章、Linux设备驱动中的异步通知与异步IO
    发表于 10-27 11:33 0次下载
    《Linux设备驱动开发详解》第9章、Linux设备驱动中的<b class='flag-5'>异步</b>通知与<b class='flag-5'>异步</b><b class='flag-5'>IO</b>

    浅析同步与异步Python的区别与概述

    你是否听到人们说过,异步Python代码比普通(或同步)Python代码更快?果真是那样吗?
    的头像 发表于 04-25 13:53 2226次阅读
    浅析同步与<b class='flag-5'>异步</b><b class='flag-5'>Python</b>的区别与概述

    基于Python的聚类分析及其应用简介

    基于Python的聚类分析及其应用简介。
    发表于 05-28 10:54 8次下载

    FPGA 结构分析 -IO 资源

    关于 FPGA 的 IO资源分析共分为三个系列进行具体阐述,分别为: IO资源:分析FPGA IO资源的电气特性;
    的头像 发表于 12-13 13:20 1866次阅读

    用于将数据从Google表单自动发布到Adafruit IOPython脚本

    电子发烧友网站提供《用于将数据从Google表单自动发布到Adafruit IOPython脚本.zip》资料免费下载
    发表于 06-16 15:47 0次下载
    用于将数据从Google表单自动发布到Adafruit <b class='flag-5'>IO</b>的<b class='flag-5'>Python</b>脚本

    信号驱动IO异步IO的区别

    一. 谈信号驱动IO (对比异步IO来看) 信号驱动IO 对比 异步 IO进行理解 信号驱动
    的头像 发表于 11-08 15:32 1092次阅读
    信号驱动<b class='flag-5'>IO</b>与<b class='flag-5'>异步</b><b class='flag-5'>IO</b>的区别

    linux异步io框架iouring应用

    Linux内核5.1支持了新的异步IO框架iouring,由Block IO大神也即Fio作者Jens Axboe开发,意在提供一套公用的网络和磁盘异步
    的头像 发表于 11-08 15:39 700次阅读
    linux<b class='flag-5'>异步</b><b class='flag-5'>io</b>框架iouring应用

    异步IO框架iouring介绍

    前言 Linux内核5.1支持了新的异步IO框架iouring,由Block IO大神也即Fio作者Jens Axboe开发,意在提供一套公用的网络和磁盘异步
    的头像 发表于 11-09 09:30 2498次阅读
    <b class='flag-5'>异步</b><b class='flag-5'>IO</b>框架iouring介绍