0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一探究竟Java 8的Stream API性能

汽车玩家 来源:今日头条 作者:Java的小本家 2020-05-04 14:20 次阅读

Stream Performance

已经对 Stream API 的用法鼓吹够多了,用起简洁直观,但性能到底怎么样呢?会不会有很高的性能损失?

本节我们对 Stream API 的性能一探究竟。

为保证测试结果真实可信,我们将 JVM 运行在-server模式下,测试数据在 GB 量级,测试机器采用常见的商用服务器,配置如下:

一探究竟Java 8的Stream API性能

测试方法和测试数据

性能测试并不是容易的事,Java 性能测试更费劲,因为虚拟机对性能的影响很大,JVM 对性能的影响有两方面:

GC 的影响。GC 的行为是 Java 中很不好控制的一块,为增加确定性,我们手动指定使用 CMS 收集器,并使用 10GB 固定大小的堆内存。具体到 JVM 参数就是-XX:+UseConcMarkSweepGC-Xms10G-Xmx10G

JIT(Just-In-Time) 即时编译技术。即时编译技术会将热点代码在 JVM 运行的过程中编译成本地代码,测试时我们会先对程序预热,触发对测试函数的即时编译。相关的 JVM 参数是-XX:CompileThreshold=10000。

Stream 并行执行时用到ForkJoinPool.commonPool()得到的线程池,为控制并行度我们使用 Linux 的taskset命令指定 JVM 可用的核数。

测试数据由程序随机生成。为防止一次测试带来的抖动,测试 4 次求出平均时间作为运行时间。

实验一 基本类型迭代

测试内容:找出整型数组中的最小值。对比 for 循环外部迭代和 Stream API 内部迭代性能。

测试程序 IntTest,测试结果如下图:

一探究竟Java 8的Stream API性能

图中展示的是 for 循环外部迭代耗时为基准的时间比值。分析如下:

对于基本类型 Stream 串行迭代的性能开销明显高于外部迭代开销(两倍);

Stream 并行迭代的性能比串行迭代和外部迭代都好。

并行迭代性能跟可利用的核数有关,上图中的并行迭代使用了全部 12 个核,为考察使用核数对性能的影响,我们专门测试了不同核数下的 Stream 并行迭代效果:

一探究竟Java 8的Stream API性能


分析,对于基本类型:

使用 Stream 并行 API 在单核情况下性能很差,比 Stream 串行 API 的性能还差;

随着使用核数的增加,Stream 并行效果逐渐变好,比使用 for 循环外部迭代的性能还好。

以上两个测试说明,对于基本类型的简单迭代,Stream 串行迭代性能更差,但多核情况下 Stream 迭代时性能较好。

实验二 对象迭代

再来看对象的迭代效果。

测试内容:找出字符串列表中最小的元素(自然顺序),对比 for 循环外部迭代和 Stream API 内部迭代性能。

测试程序 StringTest,测试结果如下图:

一探究竟Java 8的Stream API性能


结果分析如下:

对于对象类型 Stream 串行迭代的性能开销仍然高于外部迭代开销(1.5 倍),但差距没有基本类型那么大。

Stream 并行迭代的性能比串行迭代和外部迭代都好。

再来单独考察 Stream 并行迭代效果:

一探究竟Java 8的Stream API性能

分析,对于对象类型:

使用 Stream 并行 API 在单核情况下性能比 for 循环外部迭代差;

随着使用核数的增加,Stream 并行效果逐渐变好,多核带来的效果明显。

以上两个测试说明,对于对象类型的简单迭代,Stream 串行迭代性能更差,但多核情况下 Stream 迭代时性能较好。

实验三 复杂对象归约

从实验一、二的结果来看,Stream 串行执行的效果都比外部迭代差(很多),是不是说明 Stream 真的不行了?先别下结论,我们再来考察一下更复杂的操作。

测试内容:给定订单列表,统计每个用户的总交易额。对比使用外部迭代手动实现和 Stream API 之间的性能。

我们将订单简化为构成的元组,并用Order对象来表示。测试程序 ReductionTest,测试结果如下图:

一探究竟Java 8的Stream API性能

分析,对于复杂的归约操作:

Stream API 的性能普遍好于外部手动迭代,并行 Stream 效果更佳;

再来考察并行度对并行效果的影响,测试结果如下:

一探究竟Java 8的Stream API性能

分析,对于复杂的归约操作:

使用 Stream 并行归约在单核情况下性能比串行归约以及手动归约都要差,简单说就是最差的;

随着使用核数的增加,Stream 并行效果逐渐变好,多核带来的效果明显。

以上两个实验说明,对于复杂的归约操作,Stream 串行归约效果好于手动归约,在多核情况下,并行归约效果更佳。我们有理由相信,对于其他复杂的操作,Stream API 也能表现出相似的性能表现。

结论

上述三个实验的结果可以总结如下:

对于简单操作,比如最简单的遍历,Stream 串行 API 性能明显差于显示迭代,但并行的 Stream API 能够发挥多核特性。

对于复杂操作,Stream 串行 API 性能可以和手动实现的效果匹敌,在并行执行时 Stream API 效果远超手动实现。

所以,如果出于性能考虑,

对于简单操作推荐使用外部迭代手动实现,

对于复杂操作,推荐使用 Stream API,

在多核情况下,推荐使用并行 Stream API 来发挥多核优势,

单核情况下不建议使用并行 Stream API。

如果出于代码简洁性考虑,使用 Stream API 能够写出更短的代码。即使是从性能方面说,尽可能的使用 Stream API 也另外一个优势,那就是只要 Java Stream 类库做了升级优化,代码不用做任何修改就能享受到升级带来的好处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JAVA
    +关注

    关注

    19

    文章

    2951

    浏览量

    104430
  • API
    API
    +关注

    关注

    2

    文章

    1470

    浏览量

    61725
收藏 人收藏

    评论

    相关推荐

    超高频读写器究竟是什么,能做什么?文读懂!

    在物联网技术日新月异的今天,超高频读写器作为射频识别(RFID)技术的重要组成部分,正逐渐渗透到我们生活的各个领域。那么,超高频读写器究竟是什么?它又能做些什么呢?本文将带您一探究竟、超高频
    的头像 发表于 10-23 14:41 102次阅读
    超高频读写器<b class='flag-5'>究竟</b>是什么,能做什么?<b class='flag-5'>一</b>文读懂!

    插座也有显示屏?快来一探究竟

    显示屏智能插座,通过显示屏实时监控与可视化展示、智能定时与提醒、灵活操作与安全保障、节能环保,具备高智能化水平,改变用电方式,成为数字化和智能化时代的重要桥梁。
    的头像 发表于 09-02 15:31 222次阅读
    插座也有显示屏?快来<b class='flag-5'>一探究竟</b>!

    揭秘耐压仪的电流之谜:直流还是交流?

    在电气设备的世界里,耐压仪是个重要的角色,它负责检验设备的绝缘性能是否能够承受规定的电压考验。然而,关于耐压仪输出的是直流(DC)还是交流(AC)的问题,却鲜为人知。今天,我们就来揭开这神秘的面纱,
    的头像 发表于 04-11 08:50 754次阅读
    揭秘耐压仪的电流之谜:直流还是交流?

    5.5G,多出来的0.5G又是啥?为什么不直接迈向6G时代?

    5.5G成为通信行业2024年开年的大焦点。提到5.5G,多出来的0.5G又是啥?为什么不直接迈向6G时代?今天我们一探究竟
    的头像 发表于 04-03 09:40 623次阅读

    OpenVINO™ Java API应用RT-DETR做目标检测器实战

    本文将从零开始详细介绍环境搭建的完整步骤,我们基于英特尔开发套件AIxBoard为硬件基础实现了Java在Ubuntu 22.04系统上成功使用OpenVINO™ Java API,并且成功运行了RT-DETR实现实时端到端目标
    的头像 发表于 03-18 15:04 720次阅读
    OpenVINO™ <b class='flag-5'>Java</b> <b class='flag-5'>API</b>应用RT-DETR做目标检测器实战

    环形光源让图像质量瞬间提升,一探究竟

    光源对机器视觉检测系统的性能起着重要作用,精确的光学结构设计可以提高捕获图像的质量,准确地分离目标和背景信息,不充足的光线会使捕捉到的图像无法满足需求,针对不同的检测对象,不同的形状光源应运而生
    的头像 发表于 02-24 08:33 1206次阅读
    环形光源让图像质量瞬间提升,<b class='flag-5'>一探究竟</b>!

    原子级量子芯片如何制造的?

    ,常见的量子计算芯片中,无论是超导、离子阱,还是光子芯片,都是肉眼可见的。而原子级量子集成电路,则需要通过扫描隧道显微镜等工具才能一探究竟
    的头像 发表于 12-21 09:58 843次阅读
    原子级量子芯片如何制造的?

    在SpinalHDL里在顶层键优化Stream/Flow代码生成

        在SpinalHDL里在顶层键优化代码中Stream/Flow代码生成的payload,fragment。 难看的代码       来看段代码:   import
    的头像 发表于 12-14 09:05 616次阅读

    NVMe SSD性能影响因素一探究竟(下)

    IO Pattern会对SSD的性能产生严重影响,主要表现在如下几个方面
    的头像 发表于 12-09 11:38 1451次阅读
    NVMe SSD<b class='flag-5'>性能</b>影响因素<b class='flag-5'>一探究竟</b>(下)

    生成式AI技术的应用前景

    生成式 AI(人工智能)与我们熟知的 AI 有何不同?这篇文章将为我们一探究竟
    的头像 发表于 11-29 12:20 1246次阅读

    简单了解Java的新特性

    Java 8Java 20,Java 已经走过了漫长的道路,自 Java 8 以来,
    的头像 发表于 11-23 16:38 1025次阅读
    简单了解<b class='flag-5'>Java</b>的新特性

    java内存溢出排查方法

    过程中常见的问题之,可能导致应用程序崩溃、性能下降甚至系统崩溃。在本文中,将详细介绍如何排查和解决Java内存溢出问题。 、什么是Java
    的头像 发表于 11-23 14:46 2996次阅读

    AD8231谐波畸变性能究竟在怎样个指标呢?

    没有给谐波畸变相关指标,不知道是设计问题还是芯片本身问题,AD8231谐波畸变性能究竟在怎样个指标呢?
    发表于 11-23 08:04

    java对clob类型数据怎么处理

    处理CLOB类型数据在Java中是项非常常见和重要的任务。CLOB(Character Large Object)是种用于存储大量字符数据的数据类型,通常用于存储大型文本文档、XML文档
    的头像 发表于 11-21 10:30 2229次阅读

    api网关 kong 教程入门

    权限控制、接口请求访问日志统计 安全,是保护内部服务而设计的道屏障 开源-最大好处 当然也有个很大的缺点,api-gw很可能成为性能
    的头像 发表于 11-10 11:39 675次阅读
    <b class='flag-5'>api</b>网关 kong 教程入门