0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

接口响应慢该如何排查 接口慢的排查思路

马哥Linux运维 来源:马哥Linux运维 2023-08-07 10:03 次阅读

不知道大家有没有遇到这种情况,接口业务逻辑写完后,用 postman 一调,发现接口响应时间好长,不得不对接口进行优化。

但是此时接口的代码往往逻辑比较复杂,调用层次也比较多,很难定位到耗时较长的代码块

遇到这种情况大家都是如何定位耗时代码块的呢?

我看到很多人都是直接用System.currentTimeMillis()对代码进行埋点

publicstaticvoidmain(String[]args){
LongstartTime=System.currentTimeMillis();
exec();
LongendTime=System.currentTimeMillis();
log.info("exec方法执行耗时:{}ms",endTime-startTime);
}

或者用StopWatch打印方法耗时

publicstaticvoidmain(String[]args)throwsInterruptedException{
StopWatchstopWatch=newStopWatch();
stopWatch.start("exec");
exec();
stopWatch.stop();
System.out.println(stopWatch.prettyPrint());
}

这两种方法本质上是一样的,都是通过手动在代码块上进行埋点,打印出方法的耗时,该方法不仅费时费力,而且对代码有侵入,修复问题后删掉代码还是一个麻烦事

下面介绍如果通过Arthas定位耗时代码块

Arthas 简介

Arthas是阿里开源的一款 Java 诊断工具,可以在无需重启 JVM 的情况下,实时查看应用 load、内存、gc、线程等状态信息,还能实时查看方法调用入参、出参、方法调用耗时等

Arthas 快速开始

直接下载Arthasjar 包,然后用java -jar命令启动即可

$curl-Ohttps://arthas.aliyun.com/arthas-boot.jar
$java-jararthas-boot.jar

Arthas启动的时候,会打印出当前运行的 java 进程

$java-jararthas-boot.jar
[INFO]JAVA_HOME:/Library/Java/JavaVirtualMachines/jdk1.8.0_351.jdk/Contents/Home/jre
[INFO]arthas-bootversion:3.6.9
[INFO]Foundexistingjavaprocess,pleasechooseoneandinputtheserialnumberoftheprocess,eg:1.ThenhitENTER.
*[1]:12512com.huangxy.springstudy.SpringStudyApplication
[2]:12511org.jetbrains.jps.cmdline.Launcher

然后可以选择我们需要 attach 的 java 进程,这里我们选择 1,然后按回车。Arthas 会 attach 到目标进程上,并输出日志:

[INFO]arthashome:/Users/huangxiaoyu/.arthas/lib/3.6.9/arthas
[INFO]Trytoattachprocess12512
[INFO]Attachprocess12512success.
[INFO]arthas-clientconnect127.0.0.13658
,---.,------.,--------.,--.,--.,---.,---.
/O|.--.''--..--'|'--'|/O'.-'
|.-.||'--'.'|||.--.||.-.|`.`-.
||||||||||||||||.-'|
`--'`--'`--''--'`--'`--'`--'`--'`--'`-----'

wikihttps://arthas.aliyun.com/doc
tutorialshttps://arthas.aliyun.com/doc/arthas-tutorials.html
version3.6.9
main_classcom.huangxy.springstudy.SpringStudyApplication
pid12512
time2023-07-2509:14:22

到这里,Arthas 已经 attach 到我们的目标进程上了,我们尝试使用dashboad命令,查看进程的信息

$dashboard
IDNAMEGROUPPRIORITYSTATE%CPUDELTA_TIMETIMEINTERRUPTDAEMON
36DestroyJavaVMmain5RUNNABLE0.00.0000:1.748falsefalse
-1C1CompilerThread3--1-0.00.0000:0.761falsetrue
-1VMPeriodicTaskThread--1-0.00.0000:0.237falsetrue
24http-nio-8081-exec-1main5WAITING0.00.0000:0.098falsetrue
-1VMThread--1-0.00.0000:0.071falsetrue
25http-nio-8081-exec-2main5WAITING0.00.0000:0.055falsetrue
54arthas-NettyHttpTelnetBootstrasystem5RUNNABLE0.00.0000:0.054falsetrue
-1GCtaskthread#8(ParallelGC)--1-0.00.0000:0.043falsetrue
-1GCtaskthread#1(ParallelGC)--1-0.00.0000:0.043falsetrue
-1GCtaskthread#7(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#6(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#0(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#9(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#2(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#3(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#5(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#4(ParallelGC)--1-0.00.0000:0.042falsetrue
MemoryusedtotalmaxusageGC
heap83M432M7282M1.14%gc.ps_scavenge.count4
ps_eden_space72M212M2688M2.69%gc.ps_scavenge.time(ms)24
ps_survivor_space0K21504K21504K0.00%gc.ps_marksweep.count2
ps_old_gen10M199M5461M0.20%gc.ps_marksweep.time(ms)61
nonheap53M56M-194.71%
code_cache6M7M240M2.87%
metaspace40M43M-194.45%
compressed_class_space5M5M1024M0.53%
direct16K16K-100.01%
mapped0K0K-0.00%
Runtime
os.nameMacOSX
os.version13.0.1
java.version1.8.0_351
java.home/Library/Java/JavaVirtualMachines/jdk1.8.0_351.jdk/Contents/
Home/jre
systemload.average3.80
processors12

可以看到dashboad命令会展示一个实时的数据面板,列出了我们平时比较关心的数据指标,如内存使用量,gc 状态等

更多命令的使用,可以参考官网的命令列表

使用 Trace 命令统计方法耗时

trace命令能主动搜索class-pattern/method-pattern对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路

比如下面接口

@RestController
publicclassHelloController{

@GetMapping("/test")
publicStringtest()throwsInterruptedException{
one();
two();
return"hello";
}

privatevoidtwo()throwsInterruptedException{
Thread.sleep(20);
three();
}

privatevoidthree()throwsInterruptedException{
Thread.sleep(1000);
}

privatevoidone()throwsInterruptedException{
Thread.sleep(100);
}

}

启动Arthas进程,并 attach 到我们的 springboot 项目上,接着使用trace命令跟踪方法的调用情况

$tracecom.huangxy.springstudy.controller.HelloControllertest

trace方法第一个参数是要 attach 的类的路径,第二个参数是方法名称,接着我们调用一遍接口,就能看到 hello 方法的调用堆栈及其耗时

7023eaec-3457-11ee-9e74-dac502259ad0.png

可以看到,这里耗时比较严重的是tow()方法,花了 1029ms,占了 90.73% 的比重

不过需要注意的是,trace 命令只会 trace 匹配到的函数里的子调用,并不会向下 trace 多层,如果需要 trace 多层,可以用正则匹配多个函数,如

$trace-E com.huangxy.springstudy.controller.HelloControllertest|two
702d9506-3457-11ee-9e74-dac502259ad0.pngimage.png

这下更清晰的定位到,导致耗时过长的方法是three()方法,定位到方法后,针对性的优化耗时代码块即可







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JAVA语言
    +关注

    关注

    0

    文章

    138

    浏览量

    20073
  • JVM
    JVM
    +关注

    关注

    0

    文章

    157

    浏览量

    12206

原文标题:接口响应慢该如何排查

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Linux系统CPU占用率100%的排查思路

    今天浩道跟大家分享linux硬核干货,工作中当你服务器CPU达到100%时,干着急是没有用的,查问题还得自己去查。本文将给大家罗列排查异常故障思路,并且文末附上相关shell脚本,去实际一番,你会发现原来解决问题的方法如此之简
    的头像 发表于 01-23 10:26 5823次阅读
    Linux系统CPU占用率100%的<b class='flag-5'>排查</b><b class='flag-5'>思路</b>

    科普小课堂|LCD 问题排查思路解析

    在嵌入式系统开发中,液晶显示器(LCD)作为人机交互的重要界面,其稳定性和可靠性至关重要。然而在实际应用中,LCD难免会遇到各种问题。今天和各位小伙伴分享一些常见的LCD问题及其排查思路,帮助大家快速定位并解决这些问题。
    的头像 发表于 08-05 17:06 994次阅读
    科普小课堂|LCD 问题<b class='flag-5'>排查</b><b class='flag-5'>思路</b>解析

    GPIB接口仪器控制中数据波形更新速度问题

    有哪些同学以前做过用GPIB接口控制频谱仪的,有个问题请教大家,我的程序能实现控制及波形显示,但波形刷新率比仪器单独测量时好多,我认为有可能是GPIB接口的传输速率偏低,导致从仪器读取一次数据的时间过多,所以波形数据更新
    发表于 12-15 08:48

    Flink Checkpoint 问题排查实用指南

    Checkpoint 失败,或者 Checkpoint 的情况,本文会统一聊一聊Flink 中 Checkpoint 异常的情况(包括失败和),以及可能的原因和排查思路。1. C
    发表于 09-17 16:25

    Flink on YARN(下):常见问题与排查思路

    : org.apache.flink.yarn.cli.FlinkYarnSessionCli@25ce9dc4Flink Cluster 常见问题与排查思路▼ 用户应用和框架 JAR 包版本冲突问题问题通常会抛出
    发表于 10-10 14:14

    Flink on YARN(下):常见问题与排查思路

    客户端和 Flink Cluster 的常见问题,分享相关问题的排查思路。客户端常见问题与排查思路▼ 应用提交控制台异常信息:Could not build the program f
    发表于 10-14 15:04

    i.MX6ULL——ElfBoard 的ELF1 板卡网口不通问题排查思路

    的,那么对于网口,经常出现的问题就是网口不通,所以网口问题的排查是工程师理应具备的基本素质。 网口问题排查思路 在遇到网口问题时排查网口问题首先要明确问题点,网口不通的情况下首先要看
    发表于 10-21 10:44

    i.MX6ULL——ElfBoard 的ELF1 板卡网口不通问题排查思路

    的,那么对于网口,经常出现的问题就是网口不通,所以网口问题的排查是工程师理应具备的基本素质。 网口问题排查思路 在遇到网口问题时排查网口问题首先要明确问题点,网口不通的情况下首先要看
    发表于 10-21 14:11

    i.MX6ULL--ElfBoard 音频接口介绍及音频接口问题排查思路

    式插针)标准耳机,会有放音和录音功能失效的现象。 音频 接口问题排查思路 (1)首先检查焊接器件是否与设计的底板的原理图一致,音频芯片是否使用同一型号,电阻电容对应;阻值容值如有改动是否会有影响; (2
    发表于 10-25 13:38

    在Kubernetes集群发生网络异常时如何排查

    本文将引入一个思路:“在 Kubernetes 集群发生网络异常时如何排查”。文章将引入 Kubernetes 集群中网络排查思路,包含网络异常模型,常用工具,并且提出一些案例以供学
    的头像 发表于 09-02 09:45 4738次阅读

    网络故障排查思路和处理方法

    网络故障是最容易出现的,且难以解决的问题。本文提供的网络故障排查思路和处理方法,可解决日常工作中大部分网络问题。
    发表于 10-31 09:14 9367次阅读

    网络二层环路的排查思路与技巧

    今天浩道跟大家分享一篇关于网络二层环路的排查思路与技巧,希望能够在日常工作中帮助到你,得到老板的鸡腿大餐!
    的头像 发表于 12-29 15:38 3725次阅读

    深入分析SQL的排查、解决思路

    出于一些历史原因有的SQL查询可能非常复杂,需要同时关联非常多的表,使用一些复杂的函数、子查询,这样的SQL在项目初期由于数据量比较少,不会对数据库造成较大的压力,但是随着时间的积累以及业务的发展,这些SQL慢慢就会转变为SQL,对数据库的性能产生一定的影响。
    的头像 发表于 10-31 10:29 1665次阅读
    深入分析<b class='flag-5'>慢</b>SQL的<b class='flag-5'>排查</b>、解决<b class='flag-5'>思路</b>

    SWD端口无法连接如何排查

    大家在调试GD32 MCU的时候是否也碰到过SWD调试端口无法连接的情况?SWD端口无法连接的原因有很多,有时候排查没有思路,可能会耽误大家的时间,下面小编为大家介绍常见的SWD无法连接的原因,供大家排查参考
    的头像 发表于 01-10 10:46 2102次阅读
    SWD端口无法连接如何<b class='flag-5'>排查</b>

    机智云历史数据导出与排查指南

    机智云历史数据导出与排查指南在使用机智云平台进行设备管理和数据监控时,历史数据的导出和排查是常见的需求。机智云提供了开放的API接口,方便用户通过编程方式导出设备历史数据,以便进行分析或排查
    的头像 发表于 11-21 01:01 37次阅读
    机智云历史数据导出与<b class='flag-5'>排查</b>指南