C++20 给我们带来了非常现代化的协程特性,但是主要的增加都集中于语核部分。由于库特性尚未准备充分,所以 C++20 标准库中尚没有多少现成的、组装好的协程设施供我们使用。但是!仅仅通过使用std::coroutine_handle(这是一个编译器为之开洞的类)并在你的类中定制好几个规定的接口,我们就可以组合出五花八门的功能。你可以理解为,虽然我们没有现成的飞机、火车,但是我们有沙子和铁矿石!完全可以从沙子和铁矿石出发,造出飞机、火车。我知道很多人诟病 C++ 的这个特点,没有现成的这个、现成的那个,自己造很麻烦。但是这也是我比较喜欢 C++ 的一点——上限非常高,你可以为自己的飞机、火车做定制,加上你想要的功能或去掉你不想要的功能;除此以外,你甚至还可以造出之前还没有问世的东西,比如星舰!在其他语言中,语言和标准库给你提供了什么就是什么了,你几乎没有超越的能力。
在 C++23 周期,LEWG (库特性工作组) 在新冠肆虐的艰难背景下完成了大量的工作,使得 C++23 增添了不少很有益的设施(可参考 C++23特性总结 - 上 - Mick235711的文章 - 知乎 https://zhuanlan.zhihu.com/p/562383157)。但是,对于协程方面的内容还是举棋不定。std::generator和std::lazy在合并的计划里进进出出,而最终只有std::generator达成目标。对于更花花绿绿的协程库,像task等,则可怜的连提案都没有。
另外,在可预见的将来,哪怕标准库收录了一些基本的协程类,为了探索更加花花绿绿的协程高级功能,我们还是需要从最基本的协程设施出发,也就是理解std::coroutine_handle和相应的接口。
本文将向读者展示如何实现一个简单的生成器 (generator) 和一个能支持协程内外双向信息传递的生成器。网上关于什么是协程的讲解很多,哪怕是讲 C++ 协程的中文材料也不少。且因笔者时间精力有限,本文不会详细地介绍协程概念,而是更侧重于展示怎么实现出一个 generator,以填补相关参考资料的不足。
1
感性的了解一下协程
协程可以简单地理解为:一个执行时可以主动打断,程序执行流程可以在调用方和被调用方之间进进出出若干次的函数。
Python 是最早的一批支持协程的语言,我们不妨用 Python 来演示一下协程的神奇。(其实早在 19 年,那时 C++ 编译器还没支持协程的时候,笔者就是利用 Python 来理解协程的)
从这个例子我们可以看出以下几点怪异的现象:
1)myrange函数中并没有一句return语句,我们却调用myrange函数得到了一个gen对象(第 22 行)
2) 22 行调用myrange函数后,这个函数似乎并没有立即开始执行(没有执行第 3 行的print语句,倒是执行第 23 行的print语句了)
3) 调用gen对象的__next__方法后,myrange函数开始执行。执行到第 7 行时,myrange函数 "yield" 了一个值,然后程序的执行流程又切换到主函数的第 24 行。__next__方法得到了刚刚 "yield" 的结果。
4) 26 行再次调用__next__时,执行流程回到了myrange中。而且并不是从myrange的开头重新开始执行,而是从上一次 "yield" 的地方,也就是第 7 行继续执行。i 的值似乎也没受到影响。
如果你熟悉了协程的特点,这无非可以概括为,协程执行时可以主动打断(更学术一点叫挂起)自己,将控制权交还给调用方。协程挂起期间,协程的栈上信息都可以得到保留。协程恢复后,从上一次的挂起点继续执行。
经过封装后的 C++ 协程库,也可以向用户展示出和 Python 中几乎完全一致的用法。如下就是我们将要实现的generator所展示的应用效果。
当然,C++ 毕竟是一个静态类型的语言,除了range函数要写 “返回值”generator
2
std::coroutine_handle
std::coroutine_handle类模板是为我们实现协程的各种“魔法”提供支持的最底层的设施,其主要负责存储协程的句柄。它分为模板std::coroutine_handle
打开
std::coroutine_handle中保存了协程的上下文。我们协程执行到哪儿切出去了(协程切换回来后从哪儿开始继续执行)?我们协程的栈上变量在协程切出去期间怎么能得到保留?这些问题的解决都是归功于std::coroutine_handle保存了协程的上下文。
std::coroutine_handle中的方法不多,但是各个都至关重要。由于有些概念还没有铺垫,我们先只罗列三个比较容易理解的方法:
done方法,可以查询一个协程是否已经结束;
resume方法可以恢复一个协程的执行;
destroy方法可以销毁一个协程。
std::coroutine_handle只是一个很底层很底层的设施,没有 RAII 包裹。它就像裸指针一样(其实它内部也就是一个裸指针),需要靠我们手动创建、手动销毁。我们刚刚谈到,std::coroutine_handle保存了协程的上下文,其中就有栈上变量的信息。如果一个 handle 被创建出来,用完以后我们忘了对它调用 destroy 了,那么其中存储的上下文信息当然也就没有被销毁——也就是内存泄漏了。如果不小心做了两次 destroy,那么就可能会引发 double free 错误了。所以,我们得写一个 RAII 类将其包装起来,以解决忘记销毁或者其他比如浅拷贝等问题。
这里,郑重向大家推荐由清华大学出版社出版的《C++20 实践入门》和《C++20 高级编程》。这两本书是目前最新的一批介绍 C++20 的教程。该书紧跟潮流,就 C++20 的几大热点内容,如modules、concepts、ranges等作了详细介绍。全卷内容质量上乘,精雕细琢,非那些在历史旧版本的基础上草草加两章节新内容圈钱的书可比也!
非常感谢清华大学出版社对这篇文章的赞助!本着对我的读者负责的态度,我坚持要求审读完书的大部分内容后才能做推荐,清华大学出版社的编辑对此给予了高度支持。且,从 8 月份联系我开始,到本文落笔,编辑非常宽容地给了我 4 个月的时间 —— 一段非常充足的时间阅读了这两本书,之后才有了这里的精心推荐。再次表示致敬和谢意!
3
generator
我们的generator类终于出场了。
首先,C++ 的协程要求generator中必须有promise_type这个类型。你可以通过typedef/using的方式 alias 一个别名,也可以干脆就定义成generator的内部类 —— 本文选择后者。
templatestruct generator { struct promise_type { } };
promise_type中有这么几个可定制的、会影响协程行为的重要接口,先介绍两个:
1)initial_suspend—— 它回答的是协程一出生时是否就要马上挂起的问题;
2)final_suspend—— 它回答的是协程最后一次是否要挂起的问题;
对于一个generator而言,这两个问题的回答是:
初始时始终都要挂起,最后一次始终都不挂起。
std::suspend_alwaysstd::suspend_never是标准库里面已经定义好的类型,可以方便地回答是否要挂起的问题。
struct promise_type { ... std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept // 这里注意一下,由于 final_suspend 在收尾阶段工作,所以必须是 noexcept 的 { return {}; } }
在新协程创建完毕好后,C++ 会执行co_await promise.initial_suspend(),同样的, 在协程结束前也会co_await promise.final_suspend()。当然了,从名字中我们也能看出,co_await一个std::suspend_always时,执行流程永远都会无条件切出去,而对于std::suspend_never则是永远也不会切出。
还记得我们刚刚观察的 Python 代码中的现象吗?主函数中调用myrange的时候,是不是立马得到一个gen对象的?是不是myrange里面没有立即得到执行的?在第一次调用__next__的时候才会去执行的吧?这其实就是因为myrange协程一创建好就挂起自己将程序流程切回到调用方了。
如果initial_suspend这里回答的是suspend_never,那么协程就会立刻开始执行。
建议等generator实现完成后读者自己动手实践下,将initial_suspend和final_suspend的回答换换,看看结果会有什么改变。
3)promise_type中第三个定制接口是unhandled_exception,它回答的是协程被其里头的没有捕获的异常终止时做何处理的问题。
我们这里只是简单处理一下,调用exit提前终止程序。当然这样的做法太简化了,实际应用时可以考虑使用std::exception_ptr等设施做更严谨的处理。
struct promise_type { ... void unhandled_exception() { std::exit(EXIT_FAILURE); } }
4)promise_type中第四个定制接口,也是最核心的一个是get_return_object。这个方法也涉及到了如何创建一个 coroutine 的问题 —— 答案就是使用std::coroutine_handle
现在,通过get_return_object得到了return_object,就会开始询问是否要做initial_suspend了 (刚刚介绍的initial_suspend还记得吗?)
templatestruct generator { struct promise_type; std::coroutine_handle handle; struct promise_type { ... generator get_return_object() { return generator{std::coroutine_handle ::from_promise(*this)}; } }; generator(std::coroutine_handle handle) : handle(handle) { } ... };
我们之前也提到,coroutine_handle是无 RAII 的,因此generator中得根据三/五法则,做好 RAII。该析构的析构,禁止拷贝,写好移动构造/移动赋值。
templatestruct generator { struct promise_type; std::coroutine_handle handle; ... public: generator() = default; generator(const generator &) = delete; private: generator(std::coroutine_handle handle) : handle(handle) { } public: generator(generator && src) : handle(src.handle) { src.handle = nullptr; } generator& operator=(const generator &) = delete; generator& operator=(generator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~generator() { if (!handle) { handle.destroy(); } } ... };
5) 定制yield_value接口
接下来的定制则对于generator来说至关重要,我们马上就可以让我们的generator支持 yield 了!
还是以此举例,co_yield关键字实际上只是一个语法糖,这一行会被编译器替换为co_await promise.yield_value(i),在有了initial_suspend和final_suspend的经验后,我们这次也就能很容易地猜测出,我们要在promise_type中实现一个yield_value方法,而返回值负责回答要不要切出的问题。显然,每次 yield 时总是要挂起协程,所以,yield_value方法的返回值类型应当是suspend_always。你猜对了吗?
struct promise_type { .... std::optionalopt; template std::suspend_always yield_value(Arg && arg) { opt.emplace(std::forward (arg)); return {}; } };
在promise中,我们还增加了一个optional,用以存放 yield 的结果。注意,很多例子,甚至包括 cppreference 在内,promise内部都是用的T类型的裸值来存放 yield 的结果的。在模板编程中这样做兼容性不太好,我们需要考虑能照顾到不可默认构造的类型。除此以外,我们使用万能引用和完美转发以提升构造值时的性能。
而这个opt,当然是在等generator来取它的。
templatestruct generator { ... T & next() { handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return *(handle.promise().opt); } }; generator range(int n) { for(int i = 0; i < n; ++i) { co_yield i; } } int main() { generator gen = range(4); for (int i = 0; i < 4; ++i) { std::cout << gen.next() << std::endl; } }
这里需要结合前文介绍过的内容梳理下。由于initial_suspend的返回值是suspend_always,所以协程刚创建好后就切出,执行流程到了gen = range(4)。
再下面,每次对gen调用next方法时,会执行handle.resume()恢复协程。
协程首次恢复运行,当然是从range函数的开头开始执行 (如果不是首次恢复运行,当然就是从上一次 yield 出去的地方恢复运行),直到碰上了co_yield。这时, 调用promise.yield_value(i),根据co_yield后面值 (也就是i) 构造好了值保存在opt中。随后,由于promise.yield_value(i)的结果是suspend_always,所以协程切出, 执行流程回到了handle.resume()之后。正常情况下 (协程没有执行完毕),next方法就会从promise里的那个optional中取出 yield 的结果,返回给主函数中以供输出。如果检测到已经是最后一次 yield 后再调用next的 (即 resume 后检测到 done 的话),则抛出generator_done异常。
完整的generator代码如下:
#include#include #include #include #include struct generator_done : std::logic_error { private: typedef std::logic_error super; public: using super::super; }; template struct generator { struct promise_type; std::coroutine_handle handle; struct promise_type { std::optional opt; std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept { return {}; } void unhandled_exception() { std::exit(EXIT_FAILURE); } generator get_return_object() { return generator{std::coroutine_handle ::from_promise(*this)}; } template std::suspend_always yield_value(Arg && arg) { opt.emplace(std::forward (arg)); return {}; } }; public: generator() = default; generator(const generator &) = delete; private: generator(std::coroutine_handle handle) : handle(handle) { } public: generator(generator && src) : handle(src.handle) { src.handle = nullptr; } generator& operator=(const generator &) = delete; generator& operator=(generator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~generator() { if (!handle) { handle.destroy(); } } T & next() { handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return *(handle.promise().opt); } }; generator range(int n) { for(int i = 0; i < n; ++i) { co_yield i; } } int main () { generator gen = range(5); for (int i = 0; i < 5; ++i) { std::cout << gen.next() << std::endl; }
}
4
能双向传递信息的
bigenerator
我们目前完成的generator只能做到协程内部向外部 yield 一个值,传递出来信息。能不能做到外部也向协程内部回复一个值,将信息由外部传递到协程内部呢?C++ 的协程机制也是允许的。
其实,co_yield表达式,当然,我们上面也知道了, 其实就是co_await promise.yield_value()这个表达式,其实也是有计算结果的,只不过,我们之前generator中的例子,计算结果为void类型 —— 没有返回值罢了。
要想整个表达式有返回值,当然我们得从promise.yield_value()的返回值入手。我们以前用的是std::suspend_always,现在得自己配置了。
先上效果:
再上源码:
#include#include #include #include #include struct generator_done : std::logic_error { private: typedef std::logic_error super; public: using super::super; }; template struct bigenerator { struct promise_type; std::coroutine_handle handle; struct awaitable : public std::suspend_always { std::variant * ref; U & await_resume() const { return std::get(*ref); } }; struct promise_type { std::variant var; std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept { return {}; } void unhandled_exception() { std::exit(EXIT_FAILURE); } bigenerator get_return_object() { return bigenerator{std::coroutine_handle ::from_promise(*this)}; } template awaitable yield_value(Arg && arg) { var.template emplace (std::forward (arg)); return awaitable{.ref = &var}; } }; public: bigenerator() = default; bigenerator(const bigenerator &) = delete; private: bigenerator(std::coroutine_handle handle) : handle(handle) { } public: bigenerator(bigenerator && src) : handle(src.handle) { src.handle = nullptr; } bigenerator& operator=(const bigenerator &) = delete; bigenerator& operator=(bigenerator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~bigenerator() { if (!handle) { handle.destroy(); } } template T & next(Args&& ... args) { handle.promise().var.template emplace(std::forward (args)...); handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return std::get (handle.promise().var); } }; bigenerator range(int n) { for(int i = 0; i < n; ++i) { std::string sunk = co_yield i; std::cout << sunk << std::endl; } } int main () { bigenerator gen = range(10); for (int i = 0; i < 5; ++i) { std::cout << gen.next(i + 1, 'a') << std::endl; } }
然后讲解:
主要变动就是一个新的内部类:awaitable,在bigenerator中,yield_value接口返回的就是这个类型。它继承自std::suspend_always,表明我们确实还是需要每次 yield 时都要挂起,但是,这里我们重写了await_resume方法,使得协程在恢复时调用这个方法,从 promise 中取出外界传递进去的结果。
struct awaitable : public std::suspend_always { std::variant* ref; U & await_resume() const { return std::get(*ref); } };
下面的代码片段展示了yield_value中怎么构造awaitable。其实只要告知 promise 中的variant的地址就可以了。bigenerator中改用了variant,主要是考虑到 yield 出去的值和 resume 时传递进来的值不会在同一时刻存在,使用variant有助于节省空间。
struct promise_type { ... std::variantvar; template awaitable yield_value(Arg && arg) { var.template emplace (std::forward (arg)); return awaitable{.ref = &var}; } };
还有bigenerator中next的变化,其实也就是恢复协程前,在 promise 的variant中构造好传进去的对象就好了。
templatestruct bigenerator { ... template T & next(Args&& ... args) { handle.promise().var.template emplace(std::forward (args)...); handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return std::get (handle.promise().var); } };
当然,我们这里没有考虑到bigenerator
全文完。
审核编辑 :李倩
-
C++
+关注
关注
22文章
2114浏览量
73939 -
编译器
+关注
关注
1文章
1642浏览量
49345 -
生成器
+关注
关注
7文章
320浏览量
21186
原文标题:C++ coroutine generator 实现笔记
文章出处:【微信号:程序喵大人,微信公众号:程序喵大人】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
Spire.XLS for C++组件说明
![Spire.XLS for <b class='flag-5'>C++</b>组件说明](https://file1.elecfans.com/web3/M00/05/E7/wKgZO2eFwUuAbuoQAAAbn_khf8A091.png)
同样是函数,在C和C++中有什么区别
ostream在c++中的用法
OpenVINO2024 C++推理使用技巧
C++中实现类似instanceof的方法
![<b class='flag-5'>C++</b>中<b class='flag-5'>实现</b>类似instanceof的方法](https://file1.elecfans.com/web2/M00/FE/0C/wKgaomaYe1CAQ31QAAAnf0IkoSU605.png)
C/C++中两种宏实现方式
使用 MISRA C++:2023® 避免基于范围的 for 循环中的错误
![使用 MISRA <b class='flag-5'>C++</b>:2023® 避免基于范围的 for 循环中的错误](https://file1.elecfans.com/web2/M00/A9/66/wKgZomUl7m-AHJX6AABuJjgxs14678.png)
评论