大模型服务平台百炼模型推理服务等级协议
版本生效日期:2025-09-24
本服务等级协议(Service Level Agreement,简称 “SLA”)规定了阿里云向客户提供的大模型服务平台百炼(下称“百炼”)的模型推理服务(下称“模型推理”)的服务可用性等级指标及赔偿方案。特别提示您,除非另有约定,本协议不适用于百炼模型推理服务的公测、邀测、免费的功能及版本。
1.
定义
1.1 服务周期:一个服务周期为一个自然月。
1.2 有效请求:百炼模型推理服务器端收到的请求视为有效请求,但不包括以下类型的请求:
(1)未通过百炼身份验证和鉴权失败的请求,欠费请求,错误参数等(状态码4XX)的请求;
(2)客户的应用程序受到黑客攻击而发起的请求。
1.3 失败请求:百炼模型推理将状态码为 5xx 的请求和因为百炼模型推理服务故障导致的用户正常请求未能到达百炼模型推理服务器端的请求视为失败请求,但不包括以下类型的请求:
(1)由百炼发起的合理升级、变更、停机而导致的错误请求或服务不可用情况;
(2)客户的应用程序受到黑客攻击而导致被百炼模型推理限制的请求。
1.4 每5分钟错误率:根据模型类型分别以每 5 分钟为单位按照如下方式计算:
每5分钟错误率 =(每5分钟失败请求数 / 每5分钟有效总请求数)x 100%,如果在给定的 5 分钟内,有效总请求数小于 5 ,则假定该时间段内错误率为 0。
1.5 月度服务费用:按一个自然月中客户某一阿里云账号下百炼模型推理的模型类型分别统计月底服务费用,如果客户一次性支付了多个月份的服务费用,则将按照所购买的月数或使用量比例分摊计算月度服务费用。
2.
服务可用性
2.1 服务可用性计算方式
百炼模型推理服务可用性按服务周期统计,根据客户某一阿里云账号下百炼模型推理的模型类型分别统计服务可用性。服务可用性将根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用性,即:
服务可用性=(1-服务周期内∑每5分钟错误率 / 服务周期内5分钟总个数)×100%
(注:服务周期内5分钟总个数=12×24×该服务周期的天数)
2.2 服务可用性承诺
百炼模型推理服务可用性不低于 99.9%,如未达到前述可用性承诺,客户可以根据本协议第 3 条约定获得赔偿。
2.3 除外情形
因下述原因所导致的服务不可用的时长不计入服务不可用时间:
(1)阿里云预先通知客户后及进行系统维护所引起的,包括割接,维修,升级和模拟故障演练;
(2)任何阿里云所属设备以外的网络,设备故障或配置调整引起的;
(3)客户的应用程序收到黑客攻击而引起的;
(4)客户维护不当或保密不当致使数据,口令,密码等丢失或泄漏所引起的;
(5)客户的疏忽或由客户授权的操作引起的;
(6)客户未遵循阿里云产品使用文档或使用建议引起的;
(7)不可抗力引起的。
3.
赔偿方案
3.1 赔偿标准
根据客户某一阿里云账号下百炼模型推理服务的模型类型分别统计月度服务可用性,按照下表中的标准计算赔偿金额,赔偿方式仅限于用于支付百炼模型推理服务的代金券,且赔偿总额不超过未达到服务可用性承诺的当月该模型推理服务所支付月度服务费用总额的 50%(不含用代金券抵扣的费用)。
服务类型 | 服务可用性 | 赔偿代金券金额 |
模型推理服务 | 低于99.90%但等于或高于99.00% | 该模型推理服务月度服务费用的10% |
低于99.00%但等于或高于 95.00% | 该模型推理服务月度服务费用的25% | |
低于 95.00% | 该模型推理服务月度服务费用的 50% |
3.2 赔偿申请时限
客户可以在每个自然月第五(5)个工作日后对上个月没有达到服务可用性承诺的百炼模型推理服务提出赔偿申请。赔偿申请最迟不应晚于百炼模型推理服务未达到服务可用性承诺的相关月份结束后两(2)个月内提出。
4.
其他
阿里云有权对本SLA条款作出修改。如本SLA条款有任何修改,阿里云将提前30天以网站公示或发送邮件的方式通知您。如您不同意阿里云对SLA所做的修改,您有权停止使用百炼模型推理服务,如您继续使用百炼模型推理服务,则视为您接受修改后的SLA。