Chuyển tới nội dung chính

Monitoring Architecture

Tổng Quan Kiến Trúc

ZCP thu thập các chỉ số từ nhiều cụm Data Plane bằng cách sử dụng Prometheus Agent và lưu trữ chúng một cách tập trung trong Cortex trong Cụm Control Plane. Nó cung cấp các bảng điều khiển tổng hợp tích hợp sẵn để giám sát khối lượng công việc trên toàn cụm và theo dự án thông qua Grafana, với tính linh hoạt để tùy chỉnh bảng điều khiển khi cần thiết.

Hệ thống triển khai Prometheus trên mỗi Cụm Data Plane để thu thập các chỉ số, sau đó được truyền đến kho Cortex trên Cụm Control Plane bằng cách sử dụng remote_write API.

Trong Cụm Control Plane, một Cortex Gateway được triển khai để nhận dữ liệu chỉ số từ các Đại lý Prometheus đang chạy trên các Cụm Data Plane. Các thành phần Cortex xử lý việc lưu trữ và trực quan hóa các chỉ số trên nhiều cụm. Thêm vào đó, các thành phần Cortex Rule and Alertmanager cho phép các quy tắc cảnh báo dựa trên các chỉ số đã thu thập, kích hoạt thông báo cho các nhà điều hành khi các ngưỡng đã định trước bị vượt qua.

Monitoring Backend Component, chịu trách nhiệm quản lý các Đại lý Prometheus, hỗ trợ nhiều dự án và cấu hình các Tổ chức và bảng điều khiển Grafana, cũng được đặt trong Cụm Control Plane.

Các Thành Phần và Vai Trò

Các Thành Phần Của Control Plane

ComponentRoles
Grafana- Trực quan hóa các chỉ số đã thu thập
Monitoring Backend- Quản lý các tổ chức Grafana, nguồn dữ liệu và bảng điều khiển
- Triển khai Prometheus trên các Cụm Data Plane
Cortex Gateway- Xử lý xác thực đa người dùng
- Chuyển hướng các yêu cầu đến các thành phần Cortex
Distributor- Xác thực các chỉ số đến
- Theo dõi tính khả dụng cao (HA)
- Thực hiện cân bằng tải
Ingester- Lưu trữ các chỉ số trong lưu trữ dài hạn
Querier- Thực hiện các truy vấn PromQL
Giao diện truy vấn (Tùy chọn)- Tăng cường hiệu suất đọc
- Xử lý hàng đợi, phân tách và lưu cache
Ruler (Tùy chọn)- Chạy các truy vấn PromQL cho cảnh báo và quy tắc ghi
Alertmanager (Tùy chọn)- Thêm hỗ trợ đa người dùng cho cảnh báo
Cấu hình (Tùy chọn)- Lưu trữ cài đặt cho Ruler và Alertmanager
Compactor- Gộp nhiều khối thành một khối tối ưu hóa
- Giảm chi phí lưu trữ
- Tăng tốc độ truy vấn
Store Gateway- Xử lý phân mảnh và sao chép khối
- Lưu cache kết quả truy vấn
Bộ nhớ cache chỉ mục- Cải thiện hiệu suất tìm kiếm
Bộ nhớ cache chunks- Lưu trữ các khối dữ liệu đã lấy để truy cập nhanh hơn
Bộ nhớ cache metadata- Lưu cache metadata, chẳng hạn như danh sách người dùng và ánh xạ khối

Các Thành Phần Của Data Plane

ComponentRoles
Prometheus- Hoạt động như một cơ sở dữ liệu chuỗi thời gian
- Thu thập và lưu trữ các chỉ số
- Kích hoạt cảnh báo
Prometheus Node Exporter- Thu thập các chỉ số hệ thống cấp nút
Kube State Metrics- Thu thập các chỉ số liên quan đến API Kubernetes