Understand the SLA/SLO/SLI

1 如何区分SLA/SLI/SLO:

  • SLI,服务质量指标,服务的某项质量的一个具体的量化指标,如时延、吞吐量、错误率等。
  • SLO,服务质量目标,服务的某项 SLI 的具体目标值,或者目标范围,如 99% 访问延迟 < 500ms。
  • SLA,服务质量协议,描述在服务不达 SLO 情况下的后果,可简单理解为 “SLA = SLO + 后果(惩罚)”。

    场景

    某外卖平台承诺为用户提供快速且高效的送餐服务,餐厅、骑手、平台以及顾客都会关注服务的质量和速度。

    概念 对象 定义 案例
    SLI(Service Level Indicator) 数据/指标 用于衡量服务表现的数据 实际送餐时间是 25 分钟
    SLO(Service Level Object) 内部目标 平台设定的服务标准目标 95% 订单 30 分钟内送达
    SLA(Service Level Agreement) 用户/商家 明确的服务承诺和赔偿条款 超过 30 分钟赔偿优惠券

Down机时间计算:以月为单位

<99.99%

4.3m

<99.95%

21.6m

<99.9%

43.2m

<99.0%

432m(7.2h)

<95%

2160m(36h)



SLO1 = 1 – T2/(T1+T2+T3+T4)
SLO2 = 1 – T3/(T1+T2+T3+T4)
总体: SLO = 1 – (T2+T3)/(T1+T2+T3+T4)