Knative Serving 指標¶
管理員可以根據每個 Serving 元件公開的指標來監控 Serving 控制平面。指標如下所示。
啟用器¶
以下指標可以幫助您了解應用程式在流量通過啟用器時的反應。例如,從零開始擴展時,高請求延遲可能表示請求需要太長時間才能完成。
指標名稱 | 說明 | 類型 | 標籤 | 單位 | 狀態 |
---|---|---|---|---|---|
request_concurrency |
路由到啟用器的並行請求 這些是並行報告器報告的請求,可能尚未完成。 這是報告期間的平均並行數 |
計量器 | configuration_name container_name namespace_name pod_name revision_name service_name |
無單位 | 穩定 |
request_count |
路由到啟用器的請求數。 這些是已從啟用器處理程式完成的請求。 |
計數器 | configuration_name container_name namespace_name pod_name response_code response_code_class revision_name service_name |
無單位 | 穩定 |
request_latencies |
已完成路由請求的回應時間(以毫秒為單位) | 直方圖 | configuration_name container_name namespace_name pod_name response_code response_code_class revision_name service_name |
毫秒 | 穩定 |
自動調整器¶
自動調整器元件會公開許多與每個修訂版本的決策相關的指標。例如,在任何給定時間,您可以監控自動調整器想要為服務分配的所需 Pod、在穩定期間每秒的平均請求數,或者自動調整器是否處於恐慌模式 (KPA)。
指標名稱 | 說明 | 類型 | 標籤 | 單位 | 狀態 |
---|---|---|---|---|---|
desired_pods |
自動調整器想要分配的 Pod 數量 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
excess_burst_capacity |
在穩定期間觀察到的過度突發容量 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
stable_request_concurrency |
在穩定期間每個觀察到的 Pod 的平均請求計數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
panic_request_concurrency |
在恐慌期間每個觀察到的 Pod 的平均請求計數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
target_concurrency_per_pod |
每個 Pod 的所需並行請求數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
stable_requests_per_second |
在穩定期間每個觀察到的 Pod 的平均每秒請求數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
panic_requests_per_second |
在恐慌期間每個觀察到的 Pod 的平均每秒請求數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
target_requests_per_second |
每個 Pod 的所需每秒請求數 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
panic_mode |
如果自動調整器處於恐慌模式則為 1,否則為 0 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
requested_pods |
自動調整器從 Kubernetes 請求的 Pod 數量 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
actual_pods |
目前已分配且處於就緒狀態的 Pod 數量 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
not_ready_pods |
目前未就緒的 Pod 數量 | 計量器 | configuration_name= namespace_name= revision_name service_name |
無單位 | 穩定 |
pending_pods |
目前處於擱置狀態的 Pod 數量 | 計量器 | configuration_name namespace_name revision_name service_name |
無單位 | 穩定 |
terminating_pods |
目前正在終止的 Pod 數量 | 計量器 | configuration_name namespace_name revision_name service_name<br> |
無單位 | 穩定 |
scrape_time |
自動調整器從服務 Pod 擷取指標所花費的時間(以毫秒為單位) | 直方圖 | configuration_name namespace_name revision_name service_name |
毫秒 | 穩定 |
控制器¶
以下指標由任何實作控制器邏輯的元件發出。指標顯示關於協調操作和協調請求排隊的工作佇列行為的詳細資訊。
指標名稱 | 說明 | 類型 | 標籤 | 單位 | 狀態 |
---|---|---|---|---|---|
work_queue_depth |
工作佇列的深度 | 計量器 | reconciler |
無單位 | 穩定 |
reconcile_count |
協調操作次數 | 計數器 | reconciler success |
無單位 | 穩定 |
reconcile_latency |
協調操作的延遲 | 直方圖 | reconciler success |
毫秒 | 穩定 |
workqueue_adds_total |
工作佇列處理的總新增次數 | 計數器 | name |
無單位 | 穩定 |
workqueue_depth |
工作佇列的目前深度 | 計量器 | reconciler |
無單位 | 穩定 |
workqueue_queue_latency_seconds |
項目在工作佇列中等待被請求的時間(以秒為單位) | 直方圖 | name |
秒 | 穩定 |
workqueue_retries_total |
工作佇列處理的總重試次數 | 計數器 | name |
無單位 | 穩定 |
workqueue_work_duration_seconds |
從工作佇列處理項目的時間(以秒為單位)。 | 直方圖 | name |
秒 | 穩定 |
workqueue_unfinished_work_seconds |
未完成的工作佇列項目已在執行中的時間(以秒為單位,總計)。 | 直方圖 | name |
秒 | 穩定 |
workqueue_longest_running_processor_seconds |
最長未完成的工作佇列項目已在執行中的時間(以秒為單位) | 直方圖 | name |
秒 | 穩定 |
Webhook¶
Webhook 指標會報告關於操作的有用資訊。例如,如果大量操作失敗,這可能表示使用者建立的資源有問題。
指標名稱 | 說明 | 類型 | 標籤 | 單位 | 狀態 |
---|---|---|---|---|---|
request_count |
路由到 Webhook 的請求數 | 計數器 | admission_allowed kind_group kind_kind kind_version request_operation resource_group resource_namespace resource_resource resource_version |
無單位 | 穩定 |
request_latencies |
回應時間(以毫秒為單位) | 直方圖 | admission_allowed kind_group kind_kind kind_version request_operation resource_group resource_namespace resource_resource resource_version |
毫秒 | 穩定 |
Go 執行時間 - memstats¶
每個 Knative Serving 控制平面程序都會發出許多 Go 執行時間記憶體統計(如下所示)。作為監控目的的基準,使用者可以從指標的子集開始:目前配置 (go_alloc)、總配置 (go_total_alloc)、系統記憶體 (go_sys)、mallocs (go_mallocs)、frees (go_frees) 和垃圾收集總暫停時間 (total_gc_pause_ns)、下一個 gc 目標堆積大小 (go_next_gc) 和垃圾收集週期數 (num_gc)。
指標名稱 | 說明 | 類型 | 標籤 | 單位 | 狀態 |
---|---|---|---|---|---|
go_alloc |
已配置的堆積物件的位元組數(與 heap_alloc 相同) | 計量器 | name |
無單位 | 穩定 |
go_total_alloc |
堆積物件配置的累積位元組 | 計量器 | name |
無單位 | 穩定 |
go_sys |
從 OS 取得的總記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_lookups |
執行時間執行的指標查閱次數 | 計量器 | name |
無單位 | 穩定 |
go_mallocs |
已配置的堆積物件的累積計數 | 計量器 | name |
無單位 | 穩定 |
go_frees |
已釋放的堆積物件的累積計數 | 計量器 | name |
無單位 | 穩定 |
go_heap_alloc |
已配置的堆積物件的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_heap_sys |
從 OS 取得的堆積記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_heap_idle |
閒置(未使用)跨度中的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_heap_in_use |
使用中跨度中的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_heap_released |
返回給 OS 的實體記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_heap_objects |
已配置的堆積物件數量 | 計量器 | name |
無單位 | 穩定 |
go_stack_in_use |
堆疊跨度中的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_stack_sys |
從 OS 取得的堆疊記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_mspan_in_use |
已配置的 mspan 結構的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_mspan_sys |
從 OS 取得的 mspan 結構記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_mcache_in_use |
已配置的 mcache 結構的位元組數 | 計量器 | name |
無單位 | 穩定 |
go_mcache_sys |
從 OS 取得的 mcache 結構記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_bucket_hash_sys |
設定檔 bucket 雜湊表中的記憶體位元組數。 | 計量器 | name |
無單位 | 穩定 |
go_gc_sys |
垃圾收集中繼資料中的記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_other_sys |
各種堆外執行時間配置中的記憶體位元組數 | 計量器 | name |
無單位 | 穩定 |
go_next_gc |
下一個 GC 週期的目標堆積大小 | 計量器 | name |
無單位 | 穩定 |
go_last_gc |
上次垃圾收集完成的時間,以 1970 年以來的奈秒數(UNIX 紀元)為單位 | 計量器 | name |
奈秒 | 穩定 |
go_total_gc_pause_ns |
自程式開始以來,GC 停止所有暫停的累積奈秒數 | 計量器 | name |
奈秒 | 穩定 |
go_num_gc |
已完成的 GC 週期數。 | 計量器 | name |
無單位 | 穩定 |
go_num_forced_gc |
應用程式呼叫 GC 函式所強制執行的 GC 週期數。 | 計量器 | name |
無單位 | 穩定 |
go_gc_cpu_fraction |
自程式開始以來,GC 使用的此程式可用 CPU 時間的比例 | 計量器 | name |
無單位 | 穩定 |
注意
名稱標籤為空。