0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PromQL查询剖析

马哥Linux运维 来源:马哥Linux运维 2023-03-31 11:39 次阅读

本文让我们一起来看看PromQL查询解析。虽然PromQL有操作符、函数、选择器等,但我们无需被本篇文章中的这些细节所困扰。让我们来看看查询的总体性质:PromQL查询是如何结构化和类型化的?随着时间的推移它们是如何评估的?

让我们来看一下PromQL的查询结构。PromQL有操作符、函数、选择器等等,但是我们不要被本篇文章中的细节所困扰。相反,让我们看看查询的整体:PromQL查询是如何构造和输入的,以及随着时间的推移它们是如何被评估的?

这篇文章将假设您对PromQL查询和Prometheus数据模型有大概粗略的了解。

让我们开始吧!

1.PromQL是一种嵌套的函数式语言

不像SQL或其他一些更倾向于命令式的查询语言(SELECT * FROM...),PromQL是一种嵌套的函数式语言。这意味着您将所寻找的数据描述为一组嵌套表达式,每个表达式都计算出一个中间值(没有副作用)。每个中间值都用作它周围表达式的参数或操作数,而查询的最外层表达式表示您在表、图或类似用例中看到的最终返回值。

查询示例如下所示:

#Rootofthequery,finalresult,approximatesaquantile.
histogram_quantile(
#1stargumenttohistogram_quantile(),thetargetquantile.
0.9,
#2ndargumenttohistogram_quantile(),anaggregatedhistogram.
sumby(le,method,path)(
#Argumenttosum(),theper-secondincreaseofahistogramover5m.
rate(
#Argumenttorate(),therawhistogramseriesoverthelast5m.
demo_api_request_duration_seconds_bucket{job="demo"}[5m]
)
)
)

PromQL表达式不仅是整个查询,而且是查询的任何嵌套部分(如上面的rate(…)部分),可以单独作为查询运行。在上面的例子中,每个注释行代表一个表达式。

当你在PromLabs的PromLens查询可视化工具中分析相同的查询时,包含子表达式的嵌套表达式结构会变得特别清晰:

039e0516-cf11-11ed-bfe3-dac502259ad0.png

在PromLens中,您可以单击每个树节点来分别评估其子表达式,以了解您在嵌套表达式树的每个部分中处理的数据。

2.输入的表达式,可能不像你想的那样

Prometheus中有两个“类型”的概念:

  • 由抓取目标所报告的度量类型:计数器、仪表、直方图、摘要或无类型。
  • PromQL表达式的类型:字符串、标量、瞬时向量或范围向量。

PromQL完全忽略度量类型,只关心表达式类型:每个表达式都有一个类型,每个函数、操作符或其他类型的操作都要求其参数是某种表达式类型。例如,rate()函数要求其参数是一个范围向量,但rate()本身的计算结果是一个瞬时向量。因此,rate()的结果只能用于期望瞬时向量的地方。

PromQL中可能的表达式类型有:

  • 字符串:类似 "I am a string!". 这些只作为某些函数(如label_join())的参数出现,在PromQL中并不常用。
  • 标量:没有标注尺寸的单个数值,如 1.234。您将看到这些函数的数值参数,如histogram_quantile(0.9,…)或topk(3,…),以及算术运算。
  • 瞬时向量:一组带标签的时间序列,每个序列有一个样本,所有样本都有相同的时间戳。瞬时向量可以直接来自TSDB时间序列选择器,如node_cpu_seconds_total,也可以来自返回它们的任何函数或其他转换。
node_cpu_seconds_total{cpu="0",mode="idle"}→19165078.75@timestamp_1
node_cpu_seconds_total{cpu="0",mode="system"}→381598.72@timestamp_1
node_cpu_seconds_total{cpu="0",mode="user"}→23211630.97@timestamp_1
  • 范围向量:一组带标签的时间序列,每个序列都有一段时间的样本范围。在PromQL中只有两种方法产生范围向量:在查询中使用文字范围向量选择器(如node_cpu_seconds_total[5m]),或者使用子查询(如[5m:10s])。当您想要聚合指定时间窗口内的一系列行为时,范围向量非常有用,就像您使用rate(node_cpu_seconds_total[5m])计算node_cpu_seconds_total在过去5分钟内的平均每秒增长率一样。
node_cpu_seconds_total{cpu="0",mode="idle"}→19165078.75@timestamp_1,19165136.3@timestamp_2,19165167.72@timestamp_3
node_cpu_seconds_total{cpu="0",mode="system"}→381598.72@timestamp_1,381599.98@timestamp_2,381600.58@timestamp_3
node_cpu_seconds_total{cpu="0",mode="user"}→23211630.97@timestamp_1,23211711.34@timestamp_2,23211748.64@timestamp_3

但是指标类型呢?如果您已经使用过PromQL,您可能知道某些函数只适用于特定类型的指标!例如,histogram_quantile()函数只适用于直方图指标,rate()只适用于计数器指标,而deriv()只适用于仪表。但是PromQL实际上并不检查您是否传入了正确类型的指标——这些函数通常会顺利地运行,并为错误类型的输入指标返回一些无意义的东西,并且由用户决定是否传入符合某些假设的时间序列(比如在直方图的情况下有一个敏感的le标签,或者在计数器的情况下单调增加)。然而,将来我们很可能会看到像PromLens这样的用户界面试图警告你,如果你把一个不兼容的指标类型传递给一个函数。

3.时间是怎么进来的?范围和即时查询!

您可能已经注意到,PromQL查询中对时间的唯一引用是相对引用(例如[5m],向后看5分钟)。那么,如何指定绝对图形时间范围,或者在表中显示查询结果的时间戳呢?在PromQL中,这样的时间参数与表达式分开发送给Prometheus查询API,确切的时间参数取决于您发送的查询类型。Prometheus有两种类型的PromQL查询:即时查询和范围查询。

3.1即时查询

即时查询用于类似表格的视图,在这些视图中,您希望显示PromQL查询在单个时间点的结果。

即时查询的参数包括:

  • PromQL表达式。

  • 评估时间戳

表达式在计算时间戳时进行计算,查询中的任何数据选择器都可以选择从该时间戳回溯到过去的数据(foo[1h]选择foo系列的最后一个小时的数据),但不能选择未来的数据(foo[-1h]是无效的PromQL)。访问过去数据的窗口通常有助于计算一段时间内的比率或平均值等总量。

即时查询可以返回任何有效的PromQL表达式类型(字符串、标量、即时和范围瞬时和范围向量)。

例如即时查询:

让我们看一个即时查询的例子,看看它是如何工作的。想象一下使用表达式http_requests_total查询给定的时间戳数据。http_requests_total是一个瞬时向量选择器,它使用指标名称http_requests_total为任何时间序列选择最新的样本。更具体地说,相对于评估时间戳,“latest”意味着“最多5分钟以前的并且不是陈旧的”。因此,该选择器将只为在评估时间戳之前最多5分钟有一个样本的序列产生一个结果,并且评估时间戳之前的最后一个样本不是一个陈旧的标记(一种将序列标记为在Prometheus TSDB中的某个时间终止的显式方法)。

如果我们在有最近样本的时间戳上运行此查询,结果将包含两个序列,每个序列只有一个样本:

03bd9fd4-cf11-11ed-bfe3-dac502259ad0.png

注意,每个返回样本的输出时间戳不再是原始样本时间戳,而是被设置为评估时间戳。

想象一下,在一个时间戳上执行同样的查询,在该时间戳之前有>5m的数据间隔:

03d9dc80-cf11-11ed-bfe3-dac502259ad0.png

在这种情况下,查询将返回一个空结果,因为所有匹配的样本都太旧而无法包含。

3.2范围查询

范围查询主要用于图形,其中您希望显示给定时间范围内的PromQL表达式。范围查询的工作方式完全类似于许多完全独立的即时查询,这些查询在给定时间范围内的后续时间步骤中进行评估。当然,这是经过高度优化的,在这种情况下,Prometheus实际上并没有运行很多独立的即时查询。

范围查询包含以下参数:

  • PromQL表达式。
  • 开始时间。
  • 结束时间。
  • 解析步骤。

在开始时间和结束时间之间的每个解析步骤对表达式求值后,单独求值的时间片被拼接到单个范围向量中。范围查询允许传入瞬时向量类型或标量类型的表达式,但总是返回一个范围向量(标量或瞬时向量在一段时间内计算的结果)。

范围查询示例:

如果我们将上面的示例表达式评估为一个范围查询,它将如下所示:

03e6e916-cf11-11ed-bfe3-dac502259ad0.png

请注意,每个评估步骤的行为完全类似于独立的即时查询,并且每个独立的即时查询对查询的整体范围没有概念。这种情况下的最终结果将是一个范围向量,它包含一个时间范围内两个选定序列的样本,但也包含某些时间步长的序列数据中的间隙。

最后

希望这篇博客文章让您对PromQL查询的整体结构、正在进行的类型检查(或缺少的类型检查)以及查询的解析评估有了更好的了解。

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SQL
    SQL
    +关注

    关注

    1

    文章

    753

    浏览量

    44052
  • 函数
    +关注

    关注

    3

    文章

    4299

    浏览量

    62378
  • 数据模型
    +关注

    关注

    0

    文章

    49

    浏览量

    9997

原文标题:PromQL查询剖析

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    c语言深度剖析

    c语言深度剖析
    发表于 04-02 09:12

    C语言深度剖析

    C语言深度剖析
    发表于 08-25 09:08

    C语言深度剖析

    C语言深度剖析[完整版].pdfC语言深度剖析[完整版].pdf (919.58 KB )
    发表于 03-19 05:11

    Hive查询之where语句剖析

    黑猴子的家:Hive 查询之 where 语句
    发表于 07-12 13:46

    万亿级日志与行为数据存储查询技术的两大步骤介绍

    [转]万亿级日志与行为数据存储查询技术剖析
    发表于 07-18 10:52

    基于多表的动态查询模块设计与实现

    查询是信息管理系统中使用涉及用户最多使用最频繁的功能。为了提高用户查询的灵活性与查询效率,设计了基于多表的动态查询模块,使得用户可以自己选择查询
    发表于 04-20 10:13 25次下载
    基于多表的动态<b class='flag-5'>查询</b>模块设计与实现

    总线进入查询_查询工具

    总线进入查询,很好的查询工具,快来下载学习吧
    发表于 03-29 10:27 62次下载

    C语言深度剖析

    C语言深度剖析
    发表于 05-05 17:40 7次下载

    C语言深度剖析

    C语言深度剖析
    发表于 12-20 22:50 0次下载

    深入剖析Android消息机制

    深入剖析Android消息机制
    发表于 01-22 21:11 11次下载

    MySQL 教程—子查询

    查询:sub query,查询是在某个查询结果之上进行的,一条select语句内部包含了另外一条select语句。
    发表于 09-11 12:44 5次下载
    MySQL 教程—子<b class='flag-5'>查询</b>

    剖析环路设计相关计算

    剖析环路设计相关计算
    发表于 09-24 09:36 9次下载

    剖析BMP图片文件

    剖析BMP图片文件
    发表于 01-23 10:05 2次下载

    PromQL查询的整体结构及类型检查

    本文让我们一起来看看PromQL查询解析。虽然PromQL有操作符、函数、选择器等,但我们无需被本篇文章中的这些细节所困扰。让我们来看看查询的总体性质:
    的头像 发表于 05-25 09:59 1488次阅读

    如何利用IP查询技术保护网络安全?

    技术? IP查询技术,简而言之,是通过分析特定IP地址的活动和行为,来评估其潜在的网络威胁和安全风险。这一技术不仅关注IP地址的所在位置、历史活动记录,还深入剖析其连接模式、使用频率等关键信息。通过这些数据的综合评估,企业
    的头像 发表于 09-09 10:10 233次阅读