平台介绍

Redrock Horizon 是由红岩网校工作站运维安全部运维团队基于 Grafana 构建的一站式运维平台。

“Horizon” 意为地平线,象征广阔视野,寓意运维人员能够在统一平台中掌握系统整体运行状态与资源全貌。

平台的核心目标,是将 Grafana 从传统的数据可视化工具,逐步演进为一个具备管理能力与自动化能力的运维平台。通过整合多种插件,尤其是 Business FormsInfinity,Horizon 能够:

  • 触发和封装 API 调用
  • 汇聚并整合多类型数据源
  • 驱动实际的运维与运营工作流程

平台功能

目前,Redrock Horizon 已围绕运维核心场景,建设了四大功能模块:

  • 资源盘点
  • 变更管理
  • 系统监控
  • 自动化工具

资源盘点

资源盘点模块基于 Business Forms 构建,用于对团队所管理的各类资源进行统一管理和持续维护。

平台将服务器、服务实例及其他运维相关资源统一收敛至数据库,通过 Horizon 动态维护资源现状,确保运维人员始终清楚:当前系统中有哪些资源、由谁维护、状态如何

资源盘点的整体流程为:

  1. 资源清单 中新增一项资源记录
  2. 资源信息自动同步至对应分类的 详细资源表
  3. 运维人员人工补充和维护资源的详细属性信息

通过该方式,实现资源信息的集中管理与结构化沉淀。

a6eec8c7-f825-4280-9cf7-806ab3c1f4b4

f8737908-7bd1-4d88-afdf-3fa5a1c6ded2

变更管理

为解决变更操作过程中存在的不透明、难追溯、难复盘等问题,团队将所有变更操作统一纳入 Horizon 进行管理。

平台将变更数据集中收敛于数据库中,通过 Horizon 实现:

  • 变更单的发起
  • 变更执行状态的流转
  • 变更完成后的结单记录

同时,配套制定统一的变更规范,以制度和工具双重手段降低变更风险,提升整体运维质量。

运维人员与研发人员均可通过白屏化界面便捷地发起和处理变更单,减少沟通成本与操作门槛。

image-20260130005352851

系统监控

系统监控模块基于 Grafana 的传统能力,结合多种数据源,对系统运行状态进行可观测性建设。

目前该模块仍处于持续建设阶段,存在监控规则分散、管理较为混乱、可观测覆盖面不足等问题,后续将重点在以下方向进行完善:

  • 统一监控指标与告警规范
  • 提升核心系统的可观测覆盖率
  • 加强监控与实际运维流程的联动能力

自动化工具

TODO

自动化工具模块将基于 Infinity 插件 实现,对各类 API 调用进行白屏化封装。

目标是使运维和研发人员可以直接通过 Horizon 的操作面板完成 API 调用,而无需:

  • 登录目标服务器
  • 手动执行接口请求或脚本

通过将常用 API 操作流程化、可视化,降低操作复杂度,减少人为失误,并提升整体运维效率。