跳到内容

Knative Eventing 指标

警告

以下指标尚未更新以反映我们从 OpenCensus 迁移到 OpenTelemetry。我们正在更新它们。

这些指标可能会随着我们从 OpenCensus 迁移到 OpenTelemetry 的完成而改变。

管理员可以查看 Knative Eventing 组件的指标。

Broker - 入口

使用以下指标来调试 Broker 入口的性能以及通过入口组件调度的事件。

通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。

指标名称 描述 类型 标签 单位 状态
event_count Broker 接收到的事件数量 计数器 broker_name
event_type
namespace_name
response_code
response_code_class
unique_name
无量纲 稳定
event_dispatch_latencies 将事件调度到 Channel 所花费的时间 直方图 broker_name
event_type
namespace_name
response_code
response_code_class
unique_name
毫秒 稳定

Broker - 过滤器

使用以下指标来调试 Broker 过滤器的性能以及通过过滤器组件调度的事件。用户还可以测量事件实际过滤操作的延迟。通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。

指标名称 描述 类型 标签 单位 状态
event_count Broker 接收到的事件数量 计数器 broker_name
container_name=
filter_type
namespace_name
response_code
response_code_class
trigger_name
unique_name
无量纲 稳定
event_dispatch_latencies 将事件调度到 Channel 所花费的时间 直方图 broker_name
container_name
filter_type
namespace_name
response_code
response_code_class
trigger_name
unique_name
毫秒 稳定
event_processing_latencies 在将事件调度到 Trigger 订阅者之前处理事件所花费的时间 直方图 broker_name
container_name
filter_type
namespace_name
trigger_name
unique_name
毫秒 稳定

内存调度器

内存通道可以通过以下指标进行评估。通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。

指标名称 描述 类型 标签 单位 状态
event_count 内存通道调度的事件数量 计数器 container_name
event_type=
namespace_name=
response_code
response_code_class
unique_name
无量纲 稳定
event_dispatch_latencies 从内存通道调度事件所花费的时间 直方图 container_name
event_type
namespace_name=
response_code
response_code_class
unique_name
毫秒 稳定

事件源

事件源由拥有相关系统的用户创建,因此他们可以用事件触发应用程序。每个源默认公开许多指标,以帮助用户监控调度的事件。使用以下指标来验证事件是否已从源端传递,从而验证源以及与源的任何连接是否按预期工作。

指标名称 描述 类型 标签 单位 状态
event_count 源发送的事件数量 计数器 event_source
event_type
名称
namespace_name
resource_group
response_code
response_code_class
response_error
response_timeout
无量纲 稳定
retry_event_count 源在重试中发送的事件数量 计数器 event_source
event_type
名称
namespace_name
resource_group
response_code
response_code_class
response_error
response_timeout
无量纲 稳定

Webhook 指标

Webhook 指标报告有关操作的有用信息。例如,如果大量操作失败,这可能表明用户创建的资源存在问题。

http.server.request.duration

Knative 使用 OpenTelemetry otel-go/otelhttp 包实现了 HTTP 服务器的语义约定

有关其导出的 HTTP 服务器指标的详细信息,请参阅 OpenTelemetry 文档

指标中包含以下属性

名称 类型 描述 示例
kn.webhook.type 字符串 指定调用的 webhook 类型 admissiondefaultingvalidationconversion
kn.webhook.resource.group 字符串 指定资源 Kubernetes 组名称
kn.webhook.resource.version 字符串 指定资源 Kubernetes 组版本
kn.webhook.resource.kind 字符串 指定资源 Kubernetes 组类型
kn.webhook.subresource 字符串 指定子资源 "" (空)、statusscale
kn.webhook.operation.type 字符串 指定调用 webhook 的操作 CREATEUPDATEDELETE
kn.webhook.operation.status 字符串 指定操作是否成功 successfailed

kn.webhook.handler.duration

仪表类型: 直方图

单位 ([UCUM): s

描述: 任务执行的持续时间。

指标中包含以下属性

名称 类型 描述 示例
kn.webhook.type 字符串 指定调用的 webhook 类型 admissiondefaultingvalidationconversion
kn.webhook.resource.group 字符串 指定资源 Kubernetes 组名称
kn.webhook.resource.version 字符串 指定资源 Kubernetes 组版本
kn.webhook.resource.kind 字符串 指定资源 Kubernetes 组类型
kn.webhook.subresource 字符串 指定子资源 "" (空)、statusscale
kn.webhook.operation.type 字符串 指定调用 webhook 的操作 CREATEUPDATEDELETE
kn.webhook.operation.status 字符串 指定操作是否成功 successfailed

工作队列指标

Knative 控制器公开 client-go 工作队列指标

以下指标中包含以下属性

名称 类型 描述
名称 字符串 工作队列的名称

kn.workqueue.depth

仪表类型: Int64UpDownCounter

单位 (UCUM): {item}

描述: 队列中当前项的数量

kn.workqueue.adds

仪表类型: Int64Counter

单位 (UCUM): {item}

描述: 添加到队列中的项的数量

kn.workqueue.queue.duration

仪表类型

单位 (UCUM): s

描述: 项在工作队列中停留的时间

kn.workqueue.process.duration

仪表类型: Float64Histogram

单位 (UCUM): s

描述: 从工作队列处理一个项所需的时间(秒)

kn.workqueue.unfinished_work

仪表类型: Float64Gauge

单位 (UCUM): s

描述: 协调器已完成但正在进行中且未观察到持续时间的工时(秒)。大值表示线程卡住。可以通过观察此值增加的速度来推断卡住的线程数量。

kn.workqueue.longest_running_processor

仪表类型: Float64Gauge

单位 (UCUM): s

描述: 运行时间最长的工作线程已运行的时间

kn.workqueue.retries

仪表类型: Int64Counter

单位 (UCUM): {item}

描述: 重新添加到队列中的项的数量

Go 运行时

Knative 使用 OpenTelemetry otel-go/instrumentation/runtime 包实现了 Go 运行时指标的语义约定

有关其导出的 Go 运行时指标的详细信息,请参阅 OpenTelemetry 文档

我们使用分析和 cookie 来了解网站流量。有关您使用我们网站的信息会与 Google 共享以达到此目的。了解更多。