Skip to content

资源超限处理规则协议

版本号:V1.0
生效日期:2025年6月1日

一、协议适用范围

本协议适用于所有使用“灵犀易算云平台”(以下简称“平台”)计算资源的用户(包括测试用户、正式用户及合作机构用户)。用户在使用平台提交作业时,需严格遵守本协议中关于资源超限作业的处理规则。

二、定义与解释

1.资源超限作业:指用户作业运行时占用资源(包括但不限于CPU核数、GPU核数、存储空间)超出其账号配额或平台预设阈值的行为。

2.基础配额:用户账号默认分配的计算资源上限,根据用户类型(测试/正式)动态调整。

3.紧急熔断:平台为保障系统稳定性,对资源超限作业采取的强制终止或资源限制措施。

三、资源超限判定规则

平台通过自动化监控系统实时检测作业资源使用情况,超限判定标准如下:

资源类型超限规则检测频率
CPU核时/GPU卡时预购额度用尽或资源过期每20分钟采样
HPC包节点资源过期每20分钟采样
AI计算资源过期每20分钟采样
存储空间存储资源过期每20分钟采样

四、超限作业处理流程

1.预警与缓冲期

  • 提前预警:资源量/有效期达到 “ 预警值(默认20%/7天,用户可自定义)”,平台向用户发送短信/站内信/公众号通知。
  • 已超限:平台将触发资源限制策略。

2.资源限制策略

资源类型处理策略
CPU核时/GPU卡时立即终止作业,实例停机,资源账号SSH不可访问,SFTP可访问
HPC包节点立即终止作业,实例停机,资源账号SSH不可访问,SFTP可访问
AI计算实例停机,资源账号SSH不可访问,SFTP可访问
存储空间实例停机,挂在目录不可访问

3.数据保留与恢复

  • 临时数据:超限作业的临时文件(如/tmp目录)将被立即清理。
  • 用户数据:个人存储目录超限时,平台保留文件管理中的数据,允许用户下载数据文件。

五、用户权利与义务

1.用户义务:

  • 确保作业资源需求与账号配额匹配,主动监控作业状态。
  • 收到资源超限通知后,需在资源可用时间内主动处理相关作业/文件,否则平台将触发资源限制策略。

2.申诉与豁免:

  • 对误判超限的作业,用户可提交日志与性能数据申请复核(3个工作日内反馈)。

六、平台免责声明

1.因用户资源超限导致的作业中断、数据丢失等后果,平台不承担赔偿责任。

2.因系统故障或外部攻击导致的误判超限,平台将在修复后优先恢复受影响作业或补偿相应的机时资源。

七、协议修改与终止

1.平台保留根据技术升级或政策要求调整本协议的权利,修改内容通过平台公告生效。 2.用户连续3次触发超限熔断且未申诉,平台有权暂停其资源账号使用权。

附件

《超限作业申诉流程指南》