Knative Eventing 指标¶
警告
以下指标尚未更新以反映我们从 OpenCensus 迁移到 OpenTelemetry。我们正在更新它们。
这些指标可能会随着我们从 OpenCensus 迁移到 OpenTelemetry 的完成而改变。
管理员可以查看 Knative Eventing 组件的指标。
Broker - 入口¶
使用以下指标来调试 Broker 入口的性能以及通过入口组件调度的事件。
通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。
| 指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
|---|---|---|---|---|---|
| event_count | Broker 接收到的事件数量 | 计数器 | broker_name event_type namespace_name response_code response_code_class unique_name |
无量纲 | 稳定 |
| event_dispatch_latencies | 将事件调度到 Channel 所花费的时间 | 直方图 | broker_name event_type namespace_name response_code response_code_class unique_name |
毫秒 | 稳定 |
Broker - 过滤器¶
使用以下指标来调试 Broker 过滤器的性能以及通过过滤器组件调度的事件。用户还可以测量事件实际过滤操作的延迟。通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。
| 指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
|---|---|---|---|---|---|
| event_count | Broker 接收到的事件数量 | 计数器 | broker_name container_name= filter_type namespace_name response_code response_code_class trigger_name unique_name |
无量纲 | 稳定 |
| event_dispatch_latencies | 将事件调度到 Channel 所花费的时间 | 直方图 | broker_name container_name filter_type namespace_name response_code response_code_class trigger_name unique_name |
毫秒 | 稳定 |
| event_processing_latencies | 在将事件调度到 Trigger 订阅者之前处理事件所花费的时间 | 直方图 | broker_name container_name filter_type namespace_name trigger_name unique_name |
毫秒 | 稳定 |
内存调度器¶
内存通道可以通过以下指标进行评估。通过按 HTTP 代码聚合指标,事件可以分为两类:成功事件 (2xx) 和失败事件 (5xx)。
| 指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
|---|---|---|---|---|---|
| event_count | 内存通道调度的事件数量 | 计数器 | container_name event_type= namespace_name= response_code response_code_class unique_name |
无量纲 | 稳定 |
| event_dispatch_latencies | 从内存通道调度事件所花费的时间 | 直方图 | container_name event_type namespace_name= response_code response_code_class unique_name |
毫秒 | 稳定 |
事件源¶
事件源由拥有相关系统的用户创建,因此他们可以用事件触发应用程序。每个源默认公开许多指标,以帮助用户监控调度的事件。使用以下指标来验证事件是否已从源端传递,从而验证源以及与源的任何连接是否按预期工作。
| 指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
|---|---|---|---|---|---|
| event_count | 源发送的事件数量 | 计数器 | event_source event_type 名称 namespace_name resource_group response_code response_code_class response_error response_timeout |
无量纲 | 稳定 |
| retry_event_count | 源在重试中发送的事件数量 | 计数器 | event_source event_type 名称 namespace_name resource_group response_code response_code_class response_error response_timeout |
无量纲 | 稳定 |
Webhook 指标¶
Webhook 指标报告有关操作的有用信息。例如,如果大量操作失败,这可能表明用户创建的资源存在问题。
http.server.request.duration¶
Knative 使用 OpenTelemetry otel-go/otelhttp 包实现了 HTTP 服务器的语义约定。
有关其导出的 HTTP 服务器指标的详细信息,请参阅 OpenTelemetry 文档。
指标中包含以下属性
| 名称 | 类型 | 描述 | 示例 |
|---|---|---|---|
kn.webhook.type |
字符串 | 指定调用的 webhook 类型 | admission、defaulting、validation、conversion |
kn.webhook.resource.group |
字符串 | 指定资源 Kubernetes 组名称 | |
kn.webhook.resource.version |
字符串 | 指定资源 Kubernetes 组版本 | |
kn.webhook.resource.kind |
字符串 | 指定资源 Kubernetes 组类型 | |
kn.webhook.subresource |
字符串 | 指定子资源 | "" (空)、status、scale |
kn.webhook.operation.type |
字符串 | 指定调用 webhook 的操作 | CREATE、UPDATE、DELETE |
kn.webhook.operation.status |
字符串 | 指定操作是否成功 | success、failed |
kn.webhook.handler.duration¶
仪表类型: 直方图
单位 ([UCUM): s
描述: 任务执行的持续时间。
指标中包含以下属性
| 名称 | 类型 | 描述 | 示例 |
|---|---|---|---|
kn.webhook.type |
字符串 | 指定调用的 webhook 类型 | admission、defaulting、validation、conversion |
kn.webhook.resource.group |
字符串 | 指定资源 Kubernetes 组名称 | |
kn.webhook.resource.version |
字符串 | 指定资源 Kubernetes 组版本 | |
kn.webhook.resource.kind |
字符串 | 指定资源 Kubernetes 组类型 | |
kn.webhook.subresource |
字符串 | 指定子资源 | "" (空)、status、scale |
kn.webhook.operation.type |
字符串 | 指定调用 webhook 的操作 | CREATE、UPDATE、DELETE |
kn.webhook.operation.status |
字符串 | 指定操作是否成功 | success、failed |
工作队列指标¶
Knative 控制器公开 client-go 工作队列指标
以下指标中包含以下属性
| 名称 | 类型 | 描述 |
|---|---|---|
名称 |
字符串 | 工作队列的名称 |
kn.workqueue.depth¶
仪表类型: Int64UpDownCounter
单位 (UCUM): {item}
描述: 队列中当前项的数量
kn.workqueue.adds¶
仪表类型: Int64Counter
单位 (UCUM): {item}
描述: 添加到队列中的项的数量
kn.workqueue.queue.duration¶
仪表类型
单位 (UCUM): s
描述: 项在工作队列中停留的时间
kn.workqueue.process.duration¶
仪表类型: Float64Histogram
单位 (UCUM): s
描述: 从工作队列处理一个项所需的时间(秒)
kn.workqueue.unfinished_work¶
仪表类型: Float64Gauge
单位 (UCUM): s
描述: 协调器已完成但正在进行中且未观察到持续时间的工时(秒)。大值表示线程卡住。可以通过观察此值增加的速度来推断卡住的线程数量。
kn.workqueue.longest_running_processor¶
仪表类型: Float64Gauge
单位 (UCUM): s
描述: 运行时间最长的工作线程已运行的时间
kn.workqueue.retries¶
仪表类型: Int64Counter
单位 (UCUM): {item}
描述: 重新添加到队列中的项的数量
Go 运行时¶
Knative 使用 OpenTelemetry otel-go/instrumentation/runtime 包实现了 Go 运行时指标的语义约定。
有关其导出的 Go 运行时指标的详细信息,请参阅 OpenTelemetry 文档。