0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探索Go程序的进化可能性

jf_WZTOguxH 来源:AI前线 作者:AI前线 2022-12-05 14:02 次阅读

有时候,我们会想要把别种语言编写的库嵌入到自己的程序里。这类需求在程序员之间早已有之,但出于种种原因,这始终是个充满了危险、恐惧、折磨的艰难过程。

照常来讲,如果想从 Go 中调用 Rust 函数,那我们就必须借助 cgo 这样的跳板。但这样效果不错,而且至少比亲自编写 cgo 这样的工具方便得多。

然而,问题是当我们用 cgo 将 Rust 函数链接到 Go 程序时,还得复制 Rust 生成的共享对象。我们没法把这个共享对象签入源代码树(不同操作系统、不同 CPU 架构的各自系统分发都必须是唯一的,就像常见的动态链接二进制文件一样)。所以虽然有效,但总体来讲其开发者体验很差。这时候就不能简单 go build,还得记得运行 cargo build --release 并确保生成的.so、.dll 或者.dylib 位于操作系统动态链接程序所能读取的正确路径。总之,一团乱麻。

这是个大问题,也是 Nix 和 NixOS 存在的原因。想象一下,当我们把通用操作系统组件混入其中,情况会有多么复杂。但令人惊讶的是,这样操作又是真实有效的。那么,如果说有一种方法能让我们从 Rust 发布一个二进制文件,它能在 Go 所支持的任何平台上正常起效;而且只需简单的 go build 就行、不必修改任何构建过程呢?一想就知道能这样可太棒了。对用户来说,他们虽然使用相应的包或程序,却根本感受不到有 Rust 参与其中。我的这个 mastosan 包就是这样的解决方案。下面我想跟大家聊聊它的开发过程以及存在的原因。

为什么要开发 mastosan

Mastodon 的实质就是把素材存储为 HTML 格式,再将该 HTML 呈现了 API 使用者。HTML 特别适合浏览器显示,但对 bot 来说意义不大。所以如果目标是 Slack webhook,那就不太合适。

下面来看 API 中的素材:

e4de4282-745f-11ed-8abf-dac502259ad0.png

e4f5a13e-745f-11ed-8abf-dac502259ad0.png

e52a35ac-745f-11ed-8abf-dac502259ad0.png

其内容如下所示:

e5504026-745f-11ed-8abf-dac502259ad0.png

理想情况下,我们当然希望它在 Slack 中也有相同的语义,比如像这样:

e5854e92-745f-11ed-8abf-dac502259ad0.png

这条链接在 Slack 中的显示效果跟其他超链接一样。但随着设计复杂度的提升,Mastodon 也会出现某些怪异语义,例如 span 不可见及其他一些烦人的 Slack 显示错误。我们看看以下两条有什么区别:

e5a82804-745f-11ed-8abf-dac502259ad0.png

很明显,这两条跟人类正常思维的契合度就不一样。

如何实现

UNIX 理念的核心特征之一,在于将程序视为简单的过滤器。它既能很好地完成一项任务,又允许用户将其组合为新的、更有趣的形式。如果大家曾经把 curl 和 jq 配合起来执行操作,比如从 JSONFeed 中读取数据之类,就能理解这类实践过程:

e5cdddce-745f-11ed-8abf-dac502259ad0.png

我用 Rust 编写了一个小程序,它使用 lol_html 来获取传入的 Mastodon 风格 HTML,并发布 Slack 风格的 markdown。用法非常简单:

e5ecfe20-745f-11ed-8abf-dac502259ad0.png

就这么简单。它会接收标准输入并在此之上返回结果。这跟 WebAssembly 流并不直接映射,除非用 WASI 填补其中的空缺。WASI 为 WebAssembly 程序提供了类似于 POSIX 的环境,大多数基础功能都可以直接起效,但这里我们只使用到它的两个主要部分:标准输入和标准输出。

在 Go 中,如果将其作为普通的 OS 子进程运行,可以使用以下代码:

e6318a90-745f-11ed-8abf-dac502259ad0.png

e653d96a-745f-11ed-8abf-dac502259ad0.png

但这仍然要求程序针对本机 OS 和发行版进行编译,而且必须存在于 $PATH 文件夹内。所以有效,但还不够完美。

Rust 允许我们使用以下编译器标记,构建以 WASI 为目标的二进制文件:

e6643210-745f-11ed-8abf-dac502259ad0.png

这会在./target/wasm32-wasi/release/mastosan.wasm 当中生成一个几 MB 大小的二进制文件。只要运行它,就能帮我们达成目标。

现在我们需要在 Go 中用这个二进制文件。可行的办法很多,这里我选择使用 wazero。它的使用流程类似于带 os/exec 的子进程,但也略有不同,因为我们嵌入了 WebAssembly。具体方法如下:

e681935a-745f-11ed-8abf-dac502259ad0.png

意思基本是一样的:设置环境、加载 WASM 模块,然后运行。主要区别在于,这里我没有把二进制文件作为机器码从磁盘上加载,而是使用 go:embed 将预编译的 WebAssembly 模块嵌入到了二进制文件中。也就是说,只要 WebAssembly 模块的位置符合要求,那生成的 Go 程序就能正常工作。

再快一点

这种实现的主要缺点就是速度略慢。每次调用该函数时,它都必须编译 WebAssembly 模块。

Wazero 运行时和编译后的 WebAssembly 模块代码都可以被举升到包级变量当中,具体如此补丁(https://github.com/Xe/x/commit/b61b59318be6544632ac1f64b1237bb17b2e7a32)所示。这样就能大大改善速度问题。用了这个补丁,WebAssembly 模块只会在应用程序启动时编译一次。在使用此补丁前,每次运行中的调用大概需要 0.2 秒,而使用补丁后的基准测试结果为:

e6a89de2-745f-11ed-8abf-dac502259ad0.png

可以看到,最佳用时从 0.2 秒下降到了 0.3 毫秒,意味着性能至少提升了 1000 倍。这意味着大部分时间可能都花在了 HTML 解析器上,而不是无关紧要的其他部分。

我觉得这不仅能满足我个人的工作需求,也应该会帮助更多朋友解决难题。后续我还会用更多随机 Mastodon 消息做实验,看看它能否满足要求。这种将两个不相容的世界融合起来的感受真棒,也期待它能真正在更多实践场景当中发光发热。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 操作系统
    +关注

    关注

    37

    文章

    6710

    浏览量

    123163
  • Go
    Go
    +关注

    关注

    0

    文章

    43

    浏览量

    12239
  • 函数
    +关注

    关注

    3

    文章

    4299

    浏览量

    62357

原文标题:一场实验:探索Go程序的进化可能性

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    车路协同——探索智慧路灯系统的无限可能

    车路协同——探索智慧路灯系统的无限可能
    的头像 发表于 11-07 12:40 79次阅读
    车路协同——<b class='flag-5'>探索</b>智慧路灯系统的无限<b class='flag-5'>可能</b>

    探索住宅动态IP:连接世界的无限可能

    住宅动态IP,作为现代家庭网络的重要组成部分,其不断变化的特性为用户带来了诸多便利和可能性
    的头像 发表于 10-21 07:50 85次阅读

    AI如何对产品设计带来更多的可能性

    AI(人工智能)对产品设计带来了广泛而深远的可能性,这些可能性主要体现在以下几个方面 1.创新设计的激发 创意生成:AI能够学习和模仿人类设计师的创作过程,通过深度学习等技术生成全新的、独特
    的头像 发表于 10-15 11:29 190次阅读

    ADS131A02从AIN1P采到的ADC值不准,请问有哪些可能性会造成这样的影响?

    客户使用TI的ADC芯片ADS131A02,发现从AIN1P采到的ADC值不准,于是将AIN1P和VREF_2V5相连,发现也没法读出满量程的AD值,换算出来只有2.45V左右。请问有哪些可能性会造成这样的影响? 谢谢!
    发表于 10-14 07:04

    高通探索收购英特尔芯片设计业务的可能性

    在科技行业并购传闻频发的背景下,高通公司被曝已探索收购英特尔部分业务的可能性,特别是其客户端PC芯片设计业务,旨在进一步丰富和增强其产品组合。据多位知情人士透露,高通对英特尔的这部分资产表现出浓厚兴趣,而英特尔则正积极寻求现金流,考虑剥离非核心业务及出售资产以优化财务结构
    的头像 发表于 09-09 17:21 538次阅读

    新思科技探索AI+EDA的更多可能性

    芯片设计复杂的快速指数级增长给开发者带来了巨大的挑战,整个行业不仅要向埃米级发展、Muiti-Die系统和工艺节点迁移所带来的挑战,还需要应对愈加紧迫的上市时间目标、不断增加的制造测试成本以及人才短缺等问题。早在AI大热之前,芯片设计行业就把目光放到了AI,探索AI+E
    的头像 发表于 08-29 11:19 462次阅读

    三星电子积极探讨在越南设立半导体组装工厂的可能性

    据韩国政府方面的最新消息透露,三星电子的越南分公司正积极探讨在越南设立半导体组装工厂的可能性,尽管具体的选址尚未尘埃落定,但有线索指向富士康投资活跃的北江地区附近,这一区域因其得天独厚的地理位置而备受瞩目。
    的头像 发表于 08-23 15:19 533次阅读

    苹果积极探索为Apple Watch SE引入塑料表壳的可能性

    8月7日,国际媒体传来新消息,据知情人士透露,苹果公司正积极探索为即将推出的Apple Watch SE系列引入塑料表壳的可能性,此举旨在通过材料创新进一步压缩成本,增强市场竞争力。这一变化不仅预示着成本效益的显著提升,还可能
    的头像 发表于 08-07 17:03 564次阅读

    使用Docker部署Go Web应用程序步骤

    大多数情况下Go应用程序被编译成单个二进制文件,web应用程序则会包括模版和配置文件。而当一个项目中有很多文件的时候,由于很多文件没有同步就会导致错误的发生并且产生很多的问题。
    发表于 04-20 09:33 468次阅读
    使用Docker部署<b class='flag-5'>Go</b> Web应用<b class='flag-5'>程序</b>步骤

    瑞萨的40纳米MCU技术正在重新定义嵌入式系统的可能性

    从延长便携式设备电池寿命,到提高处理效率和响应能力,瑞萨的40纳米MCU技术正在重新定义嵌入式系统的可能性
    的头像 发表于 03-11 15:11 441次阅读

    基础模型能为机器人带来怎样的可能性

    机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。
    发表于 01-26 14:47 210次阅读
    基础模型能为机器人带来怎样的<b class='flag-5'>可能性</b>?

    记忆黑板与存储空间:探讨其限制与可能性

    记忆黑板与存储空间:探讨其限制与可能性 在当今的数字化时代,信息的存储和管理已经成为一项重要的任务。记忆黑板作为一种信息存储和展示工具,其存储空间是否有限制,成为了许多用户关心的问题。记忆黑板厂家将
    的头像 发表于 01-17 19:16 305次阅读

    记忆黑板与智能手机或平板电脑同步的可能性与实现

    记忆黑板与智能手机或平板电脑同步的可能性与实现 随着科技的不断发展,人们对于信息传递和共享的方式也在不断追求便捷和高效。记忆黑板作为一种传统的信息展示和传递工具,在许多场合仍然发挥着重要作用。然而
    的头像 发表于 12-27 15:30 527次阅读

    主轴之奥秘:探索主轴的定义、作用与应用?|深圳恒兴隆机电a

    主轴作为一个关键的概念,贯穿着各种领域的发展。从工程学到生物学,主轴都扮演着不可或缺的角色。本文将深入剖析主轴的定义、作用以及在不同领域的应用,带领读者探索主轴的奥秘。接下来就跟着深圳恒兴隆机电
    发表于 12-11 10:27

    改变我们生活的锂离子电池 | 第四讲:什么是全固态电池?实用化的可能性有多大?

    改变我们生活的锂离子电池 | 第四讲:什么是全固态电池?实用化的可能性有多大?
    的头像 发表于 12-05 16:59 975次阅读
    改变我们生活的锂离子电池 | 第四讲:什么是全固态电池?实用化的<b class='flag-5'>可能性</b>有多大?