0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开源服务器Tomcat工作原理

马哥Linux运维 来源:掘金 作者:VectorJin 2021-10-08 15:11 次阅读

Tomcat 是什么开源的 Java Web 应用服务器,实现了 Java EE(Java Platform Enterprise Edition)的部分技术规范,比如 Java Servlet、Java Server Page、JSTL、Java WebSocket。Java EE 是 Sun 公 司为企业级应用推出的标准平台,定义了一系列用于企业级开发的技术规范,除了上述的之外,还有 EJB、Java Mail、JPA、JTA、JMS 等,而这些都依赖具体容器的实现。

e190ae88-2426-11ec-82a8-dac502259ad0.jpg

上图对比了 Java EE 容器的实现情况,Tomcat 和 Jetty 都只提供了 Java Web 容器必需的 Servlet 和 JSP 规范,开发者要想实现其他的功能,需要自己依赖其他开源实现。

Glassfish 是由 Sun 公司推出,Java EE 最新规范出来之后,首先会在 Glassfish 上进行实 现,所以是研究 Java EE 最新技术的首选。

最常见的情况是使用 Tomcat 作为 Java Web 服务器,使用 Spring 提供的开箱即用的强大 的功能,并依赖其他开源库来完成负责的业务功能实现。

Servlet 容器Tomcat 组成如下图:主要有 Container 和 Connector 以及相关组件构成。

Server:指的就是整个 Tomcat 服 务器,包含多组服务,负责管理和 启动各个 Service,同时监听 8005 端口发过来的 shutdown 命令,用于关闭整个容器;

Service:Tomcat 封装的、对外提供完整的、基于组件的 Web 服务, 包含 Connectors、Container 两个核心组件,以及多个功能组件,各个 Service 之间是独立的,但是共享 同一 JVM 的资源;

Connector:Tomcat 与外部世界的连接器,监听固定端口接收外部请求,传递给 Container,并将 Container 处理的结果返回给外部;

Container:Catalina,Servlet 容器,内部有多层容器组成,用于管理 Servlet 生命周期,调用 servlet 相关方法;

Loader:封装了 Java ClassLoader,用于 Container 加载类文件;

Realm:Tomcat 中为 Web 应用程序提供访问认证和角色管理的机制;

JMX:Java SE 中定义技术规范,是一个为应用程序、设备、系统等植入管理功能的框架,通过 JMX 可以远程监控 Tomcat 的运行状态;

Jasper:Tomcat 的 JSP 解析引擎,用于将 JSP 转换成 Java 文件,并编译成 class 文件。

Session:负责管理和创建 Session,以及 Session 的持久化(可自定义),支持 Session 的集 群。

Pipeline:在容器中充当管道的作用,管道中可以设置各种 valve(阀门),请求和响应在经由管道中各个阀门处理,提供了一种灵活可配置的处理请求和响应的机制。

Naming:命名服务,JNDI, Java 命名和目录接口,是一组在 Java 应用中访问命名和目录服务的 API。命名服务将名称和对象联系起来,使得我们可以用名称访问对象,目录服务也是一种命名 服务,对象不但有名称,还有属性。Tomcat 中可以使用 JNDI 定义数据源、配置信息,用于开发与部署的分离。

Container 组成

Engine:Servlet 的顶层容器,包含一 个或多个 Host 子容器;

Host:虚拟主机,负责 Web 应用的部 署和 Context 的创建;

Context:Web 应用上下文,包含多个 Wrapper,负责 Web 配置的解析、管 理所有的 Web 资源;

Wrapper:最底层的容器,是对 Servlet 的封装,负责 Servlet 实例的创 建、执行和销毁。

生命周期管理

Tomcat 为了方便管理组件和容器的生命周期,定义了从创建、启动、到停止、销毁共 12 中状态,Tomcat 生命周期管理了内部状态变化的规则控制,组件和容器只需实现相应的生命周期 方法即可完成各生命周期内的操作(initInternal、startInternal、stopInternal、 destroyInternal)。

比如执行初始化操作时,会判断当前状态是否 New,如果不是,则抛出生命周期异常;如果是,则设置当前状态为 Initializing,并执行 initInternal 方法,由子类实现,方法执行成功则设置当 前状态为 Initialized,执行失败则设置为 Failed 状态。

Tomcat 的生命周期管理引入了事件机制,在组件或容器的生命周期状态发生变化时会通知事件监听器,监听器通过判断事件的类型来进行相应的操作。事件监听器的添加可以在 server.xml 文件中进行配置。

Tomcat 各类容器的配置过程就是通过添加 listener 的方式来进行的,从而达到配置逻辑与容器的解耦。如 EngineConfig、HostConfig、ContextConfig。

EngineConfig:主要打印启动和停止日志

HostConfig:主要处理部署应用,解析应用 META-INF/context.xml 并创建应用的 Context

ContextConfig:主要解析并合并 web.xml,扫描应用的各类 Eeb 资源(filter、servlet、listener)

Tomcat 的启动过程

启动从 Tomcat 提供的 start.sh 脚本开始,Shell 脚本会调用 Bootstrap 的 main 方法,实际调用了 Catalina 相应的 load、start 方法。

load 方法会通过 Digester 进行 config/server.xml 的解析,在解析的过程中会根据 xml 中的关系和配置信息来创建容器,并设置相关的属性。接着 Catalina 会调用 StandardServer 的 init 和 start 方法进行容器的初始化和启动。

按照 xml 的配置关系,server 的子元素是 service,service 的子元素是顶层容器 Engine,每层容器有持有自己的子容器,而这些元素都实现了生命周期管理 的各个方法,因此就很容易的完成整个容器的启动、关闭等生命周期的管理。

StandardServer 完成 init 和 start 方法调用后,会一直监听来自 8005 端口(可配置),如果接收到 shutdown 命令,则会退出循环监听,执行后续的 stop 和 destroy 方法,完成 Tomcat 容器的关闭。同时也会调用 JVM 的 Runtime.getRuntime()﴿.addShutdownHook 方法,在虚拟机意外退出的时候来关闭容器。

所有容器都是继承自 ContainerBase,基类中封装了容器中的重复工作,负责启动容器相关的组 件 Loader、Logger、Manager、Cluster、Pipeline,启动子容器(线程池并发启动子容器,通过线程池 submit 多个线程,调用后返回 Future 对象,线程内部启动子容器,接着调用 Future 对象的 get 方法来等待执行结果)。

List《Future《Void》》 results = new ArrayList《Future《Void》》(); for (int i = 0; i 《 children.length; i++) { results.add(startStopExecutor.submit(new StartChild(children[i]))); } boolean fail = false; for (Future《Void》 result :results) { try { result.get(); } catch (Exception e) { log.error(sm.getString(“containerBase.threadedStartFailed”), e); fail = true; } }

Web 应用的部署方式注:

catalina.home:安装目录

catalina.base:工作目录

默认值:user.dirServer.xml 配置 Host 元素,指定 appBase 属性,默认 $catalina.base/webapps/

Server.xml 配置 Context 元素,指定 docBase,元素,指定 Web 应用的路径

自定义配置在 $catalina.base/EngineName/HostName/XXX.xml 配置 Context 元素

HostConfig 监听了 StandardHost 容器的事件,在 start 方法中解析上述配置文件:

扫描 appbase 路径下的所有文件夹和 war 包,解析各个应用的 META-INF/context.xml,并创建 StandardContext,并将 Context 加入到 Host 的子容器中。

解析 $catalina.base/EngineName/HostName/ 下的所有 Context 配置,找到相应 Web 应用的位置,解析各个应用的 META-INF/context.xml,并创建 StandardContext,并将 Context 加入到 Host 的子容器中。

注:

HostConfig 并没有实际解析 Context.xml,而是在 ContextConfig 中进行的。

HostConfig 中会定期检查 watched 资源文件(context.xml 配置文件)

ContextConfig 解析 context.xml 顺序:

先解析全局的配置 config/context.xml

然后解析 Host 的默认配置 EngineName/HostName/context.xml.default

最后解析应用的 META-INF/context.xml

ContextConfig 解析 web.xml 顺序:

先解析全局的配置 config/web.xml

然后解析 Host 的默认配置 EngineName/HostName/web.xml.default 接着解析应用的 MEB-INF/web.xml

扫描应用 WEB-INF/lib/ 下的 jar 文件,解析其中的 META-INF/web-fragment.xml 最后合并 xml 封装成 WebXml,并设置 Context

注:

扫描 Web 应用和 jar 中的注解(Filter、Listener、Servlet)就是上述步骤中进行的。

容器的定期执行:backgroundProcess,由 ContainerBase 来实现的,并且只有在顶层容器中才会开启线程。(backgroundProcessorDelay=10 标志位来控制)

Servlet 生命周期

Servlet 是用 Java 编写的服务器端程序。其主要功能在于交互式地浏览和修改数据,生成动态 Web 内容。

请求到达 server 端,server 根据 url 映射到相应的 Servlet

判断 Servlet 实例是否存在,不存在则加载和实例化 Servlet 并调用 init 方法

Server 分别创建 Request 和 Response 对象,调用 Servlet 实例的 service 方法(service 方法内部会根据 http 请求方法类型调用相应的 doXXX 方法)

doXXX 方法内为业务逻辑实现,从 Request 对象获取请求参数,处理完毕之后将结果通过 response 对象返回给调用方

当 Server 不再需要 Servlet 时(一般当 Server 关闭时),Server 调用 Servlet 的 destroy() 方法。

load on startup

当值为 0 或者大于 0 时,表示容器在应用启动时就加载这个 servlet;当是一个负数或者没有指定时,则指示容器在该 servlet 被选择时才加载;正数的值越小,启动该 servlet 的优先级越高。

single thread model

每次访问 servlet,新建 servlet 实体对象,但并不能保证线程安全,同时 Tomcat 会限制 servlet 的实例数目。最佳实践:不要使用该模型,servlet 中不要有全局变量。

请求处理过程

根据 server.xml 配置的指定的 connector 以及端口监听 http、或者 ajp 请求

请求到来时建立连接,解析请求参数,创建 Request 和 Response 对象,调用顶层容器 Pipeline 的 invoke 方法

容器之间层层调用,最终调用业务 servlet 的 service 方法

Connector 将 response 流中的数据写到 socket 中

Pipeline 与 Valve

Pipeline 可以理解为现实中的管道,Valve 为管道中的阀门,Request 和 Response 对象在管道中经过各个阀门的处理和控制。

每个容器的管道中都有一个必不可少的 basic valve,其他的都是可选的,basic valve 在管道中最后调用,同时负责调用子容器的第一个 valve。

Valve 中主要的三个方法:setNext、getNext、invoke。Valve 之间的关系是单向链式结构,本身 invoke 方法中会调用下一个 Valve 的 invoke 方法。

各层容器对应的 basic valve 分别是 StandardEngineValve、StandardHostValve、StandardContextValve、StandardWrapperValve。

JSP引擎

JSP 生命周期

编译阶段:servlet 容器编译 servlet 源文件,生成 servlet 类

初始化阶段:加载与 JSP 对应的 servlet 类,创建其实例,并调用它的初始化方法

执行阶段:调用与 JSP 对应的 servlet 实例的服务方法

销毁阶段:调用与 JSP 对应的 servlet 实例的销毁方法,然后销毁 servlet 实例

JSP元素

代码片段:《% 代码片段 %》

JSP声明:《%! declaration; [ declaration; ]+ 。.. %》

JSP表达式:《%= 表达式 %》

JSP注释:《%-- 注释 --%》

JSP指令:《%@ directive attribute=“value” %》

JSP行为:《jsp:action_name attribute=“value” /》

HTML元素:html/head/body/div/p/……

JSP隐式对象:request、response、out、session、application、config、 pageContext、page、Exception

JSP 元素说明

代码片段:包含任意量的 Java 语句、变量、方法或表达式

JSP 声明:一个声明语句可以声明一个或多个变量、方法,供后面的 Java 代码使用

JSP 表达式:输出 Java 表达式的值,String 形式;

JSP 注释:为代码作注释以及将某段代码注释掉

JSP 指令:用来设置与整个 JSP 页面相关的属性:

《%@ page 。.. %》 定义页面的依赖属性,比如 language、contentType、errorPage、 isErrorPage、import、isThreadSafe、session 等等

《%@ include 。.. %》 包含其他的 JSP 文件、HTML 文件或文本文件,是该 JSP 文件的一部分,会被同时编译执行

《%@ taglib 。.. %》 引入标签库的定义,可以是自定义标签

JSP 行为:jsp:include、jsp:useBean、jsp:setProperty、jsp:getProperty、jsp:forward

JSP 解析过程

代码片段:在 _jspService() 方法内直接输出

JSP 声明:在 servlet 类中进行输出

JSP 表达式:在 _jspService() 方法内直接输出

JSP 注释:直接忽略,不输出

JSP 指令:根据不同指令进行区分,include:对引入的文件进行解析;page 相关的属性会做为 JSP 的属性,影响的是解析和请求处理时的行为

JSP 行为:不同的行为有不同的处理方式,jsp:useBean 为例,会从 pageContext 根据 scope 的 类别获取 bean 对象,如果没有会创建 bean,同时存到相应 scope 的 pageContext 中

HTML:在 _jspService() 方法内直接输出

JSP 隐式对象:在 _jspService() 方法会进行声明,只能在方法中使用

Connector

HTTP,HTTP 是超文本传输协议,是客户端浏览器或其他程序与 Web 服务器之间的应用层通信协议

AJP,Apache JServ 协议(AJP)是一种二进制协议,专门代理从 Web 服务器到位于后端的应用程序服务器的入站请求阻塞 IO

非阻塞 IO

IO 多路复用

阻塞与非阻塞的区别在于进行读操作和写操作的系统调用时,如果此时内核态没有数据可读或者没有缓冲空间可写时,是否阻塞。

IO 多路复用的好处在于可同时监听多个 socket 的可读和可写事件,这样就能使得应用可以同时监听多个 socket,释放了应用线程资源。

Tomcat 各类 Connector 对比

Connector 的实现模式有三种,分别是 BIO、NIO、APR,可以在 server.xml 中指定。

JIO:用 java.io 编写的 TCP 模块,阻塞IO

NIO:用 java.nio 编写的 TCP 模块,非阻塞 IO,(IO 多路复用)

APR:全称 Apache Portable Runtime,使用 JNI 的方式来进行读取文件以及进行网络传输

Apache Portable Runtime 是一个高度可移植的库,它是 Apache HTTP Server 2.x 的核心。APR 具有许多用途,包括访问高级 IO 功能(如 sendfile,epoll 和 OpenSSL),操作系统级功能(随机数生成,系统状态等)和本地进程处理(共享内存,NT 管道和 Unix 套接字)。

表格中字段含义说明:

Support Polling:是否支持基于 IO 多路复用的 socket 事件轮询

Polling Size:轮询的最大连接数

Wait for next Request:在等待下一个请求时,处理线程是否释放,BIO 是没有释放的,所以在 keep-alive=true 的情况下处理的并发连接数有限

Read Request Headers:由于 request header 数据较少,可以由容器提前解析完毕,不需要阻塞

Read Request Body:读取 request body 的数据是应用业务逻辑的事情,同时 Servlet 的限制,是需要阻塞读取的

Write Response:跟读取 request body 的逻辑类似,同样需要阻塞写

NIO处理相关类

Acceptor 线程负责接收连接,调用 accept 方法阻塞接收建立的连接,并对 socket 进行封装成 PollerEvent,指定注册的事件为 op_read,并放入到 EventQueue 队列中,PollerEvent 的 run 方法逻辑的是将 Selector 注册到 socket 的指定事件。

Poller 线程从 EventQueue 获取 PollerEvent,并执行 PollerEvent 的 run 方法,调用 Selector 的 select 方法,如果有可读的 Socket 则创建 Http11NioProcessor,放入到线程池中执行。

CoyoteAdapter 是 Connector 到 Container 的适配器,Http11NioProcessor 调用其提供的 service 方法,内部创建 Request 和 Response 对象,并调用最顶层容器的 Pipeline 中的第一个 Valve 的 invoke 方法。

Mapper 主要处理 http url 到 servlet 的映射规则的解析,对外提供 map 方法。

NIO Connector主要参数

Comet

Comet 是一种用于 Web 的推送技术,能使服务器实时地将更新的信息传送到客户端,而无须客户端发出请求,在 WebSocket 出来之前,如果不使用 comet,只能通过浏览器端轮询 Server 来模拟实现服务器端推送。Comet 支持 servlet 异步处理 IO,当连接上数据可读时触发事件,并异步写数据(阻塞)。

Tomcat 要实现 Comet,只需继承 HttpServlet 同时,实现 CometProcessor 接口。

Begin:新的请求连接接入调用,可进行与 Request 和 Response 相关的对象初始化操作,并保存 response 对象,用于后续写入数据

Read:请求连接有数据可读时调用

End:当数据可用时,如果读取到文件结束或者 response 被关闭时则被调用

Error:在连接上发生异常时调用,数据读取异常、连接断开、处理异常、socket 超时

Note:

Read:在 post 请求有数据,但在begin事件中没有处理,则会调用read,如果read没有读取数据,在会触发Error回调,关闭socket

End:当socket超时,并且response被关闭时也会调用;server被关闭时调用

Error:除了socket超时不会关闭socket,其他都会关闭socket

End和Error时间触发时应关闭当前comet会话,即调用CometEvent的close方法 Note:在事件触发时要做好线程安全的操作

异步 Servlet

传统流程:

首先,Servlet 接收到请求之后,request 数据解析;

接着,调用业务接口的某些方法,以完成业务处理;

最后,根据处理的结果提交响应,Servlet 线程结束。

异步处理流程:

客户端发送一个请求

Servlet 容器分配一个线程来处理容器中的一个 Servlet

Servlet 调用 request.startAsync(),保存 AsyncContext,然后返回

任何方式存在的容器线程都将退出,但是 response 仍然保持开放

业务线程使用保存的 AsyncContext 来完成响应(线程池)

客户端收到响应

Servlet 线程将请求转交给一个异步线程来执行业务处理,线程本身返回至容器,此时 Servlet 还没有生成响应数据,异步线程处理完业务以后,可以直接生成响应数据(异步线程拥有 ServletRequest 和 ServletResponse 对象的引用)

为什么 Web 应用中支持异步?

推出异步,主要是针对那些比较耗时的请求:比如一次缓慢的数据库查询,一次外部 REST API 调用,或者是其他一些 I/O 密集型操作。这种耗时的请求会很快的耗光 Servlet 容器的线程池,继而影响可扩展性。

Note:从客户端的角度来看,request 仍然像任何其他的 HTTP 的 request-response 交互一样,只是耗费了更长的时间而已。

异步事件监听

onStartAsync:Request 调用 startAsync 方法时触发

onComplete:syncContext 调用 complete 方法时触发

onError:处理请求的过程出现异常时触发

onTimeout:socket 超时触发

Note:onError/onTimeout 触发后,会紧接着回调 onComplete,onComplete 执行后,就不可再操作 request 和 response。

原文链接:https://juejin.cn/post/6844903473482317837

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9021

    浏览量

    85185
  • 开源
    +关注

    关注

    3

    文章

    3252

    浏览量

    42407
  • tomcat
    +关注

    关注

    0

    文章

    27

    浏览量

    4846

原文标题:万字详解 Tomcat 组成与工作原理

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    SMTP服务器配置教程

    服务器。 端口 :SMTP通常使用25、465(SSL)和587(TLS)端口。 认证 :为了安全起见,SMTP服务器可能需要用户名和密码进行认证。 2. 选择SMTP服务器软件 有许多开源
    的头像 发表于 10-30 16:16 468次阅读

    串口服务器的定义和功能

    串口服务器,作为一种重要的网络设备,在现代通信和数据传输中扮演着至关重要的角色。以下是对串口服务器的详细解析,包括其定义、功能、工作原理、应用领域以及未来发展等方面。
    的头像 发表于 08-25 17:21 1629次阅读

    tcp方式连接不了服务器了,服务器代码还能开源吗?

    是在维护服务器吗?已经两天了。http方式还可以连接上,就tcp的方式不行了.服务器代码能开源吗?让我们自己搭建服务器用。
    发表于 07-15 06:53

    服务器和虚拟服务器的区别是什么

    服务器和虚拟服务器是两种常见的服务器类型,它们在很多方面有相似之处,但也有一些关键的区别。本文将详细介绍云服务器和虚拟服务器的区别,包括它
    的头像 发表于 07-02 09:48 653次阅读

    京准电子、NTP网络授时服务器工作原理及应用领域分析

    京准电子、NTP网络授时服务器工作原理及应用领域分析
    的头像 发表于 05-21 15:30 383次阅读
    京准电子、NTP网络授时<b class='flag-5'>服务器</b><b class='flag-5'>工作原理</b>及应用领域分析

    高防美国云服务器工作原理是什么?

    高防美国云服务器工作原理主要基于强化的网络防护措施和先进的安全技术。那么高防美国云服务器工作原理是什么?Rak部落小编为您整理发布高防美国云服务
    的头像 发表于 05-17 10:13 271次阅读

    超云信创服务器与openEuler开源操作系统完成互认证

    日前,超云 C86 平台服务器 R3215、R3216 成功完成了与 openEuler 开源操作系统的兼容性适配工作。测试结果表明:openEuler 22.03 LTS SP3 版本的开源
    的头像 发表于 03-12 16:08 1220次阅读
    超云信创<b class='flag-5'>服务器</b>与openEuler<b class='flag-5'>开源</b>操作系统完成互认证

    linux服务器和windows服务器

    和适用性。 首先,Linux服务器是一种基于开源的操作系统,其内核是由许多个人和组织共同开发和维护的。它具有高度的稳定性和安全 性。由于Linux操作系统的开放性,用户可以根据自己的需求和喜好进行自定义配置
    发表于 02-22 15:46

    恒讯科技带大家深入理解:WebSocket服务器工作原理

    WebSocket是一种在单个TCP连接上进行全双工通信的通信协议。它的设计目标是在Web浏览服务器之间提供低延迟、高效的双向通信。下面是深入理解WebSocket服务器工作原理
    的头像 发表于 01-29 16:48 448次阅读

    独立服务器和云服务器的区别

    独立服务器和云服务器的区别是很多用户在选择服务器时要做的课程,那么独立服务器和云服务器的区别有哪些呢?
    的头像 发表于 01-17 10:58 807次阅读

    服务器数据恢复】服务器迁移数据时数据损坏的数据恢复案例

    服务器数据恢复环境&服务器故障: 一台安装Windows操作系统的服务器工作人员在迁移该服务器中数据时突然无法读取数据,
    的头像 发表于 01-16 13:19 902次阅读

    dns的服务器地址设置为多少

    DNS(域名系统)是互联网的基础设施之一,用于将域名转换为IP地址,使用户可以访问网络资源。要设置DNS服务器地址,首先需要理解DNS的工作原理和不同类型的DNS服务器。本文将详细介绍DNS
    的头像 发表于 01-15 11:11 1649次阅读

    weblogic和tomcat的区别和特点

    和维护的企业级Java应用服务器。它是一个完整的Java EE(Java Enterprise Edition)容器,具有丰富的功能和广泛的支持。相比之下,Tomcat是一个Apache开源项目,是一
    的头像 发表于 12-05 16:11 1350次阅读

    weblogic和tomcat哪个好

    WebLogic和Tomcat是两个常见的Java Web服务器。它们在Java Web应用程序开发中扮演着重要的角色。无论是作为开发环境还是部署环境,选择正确的Web服务器非常重要。本文将对两者
    的头像 发表于 12-05 14:57 1730次阅读

    idea如何将项目部署到tomcat服务器

    将项目部署到Tomcat服务器上是一个常见的操作,下面是一个详细的步骤指南,描述了如何将项目成功部署到Tomcat服务器上。 准备工作 在开
    的头像 发表于 12-03 15:25 1560次阅读