Appearance
资源超限处理规则协议
版本号:V1.0
生效日期:2025年6月1日
一、协议适用范围
本协议适用于所有使用“灵犀易算云平台”(以下简称“平台”)计算资源的用户(包括测试用户、正式用户及合作机构用户)。用户在使用平台提交作业时,需严格遵守本协议中关于资源超限作业的处理规则。
二、定义与解释
1.资源超限作业:指用户作业运行时占用资源(包括但不限于CPU核数、GPU核数、存储空间)超出其账号配额或平台预设阈值的行为。
2.基础配额:用户账号默认分配的计算资源上限,根据用户类型(测试/正式)动态调整。
3.紧急熔断:平台为保障系统稳定性,对资源超限作业采取的强制终止或资源限制措施。
三、资源超限判定规则
平台通过自动化监控系统实时检测作业资源使用情况,超限判定标准如下:
资源类型 | 超限规则 | 检测频率 |
---|---|---|
CPU核时/GPU卡时 | 预购额度用尽或资源过期 | 每20分钟采样 |
HPC包节点 | 资源过期 | 每20分钟采样 |
AI计算 | 资源过期 | 每20分钟采样 |
存储空间 | 存储资源过期 | 每20分钟采样 |
四、超限作业处理流程
1.预警与缓冲期
- 提前预警:资源量/有效期达到 “ 预警值(默认20%/7天,用户可自定义)”,平台向用户发送短信/站内信/公众号通知。
- 已超限:平台将触发资源限制策略。
2.资源限制策略
资源类型 | 处理策略 |
---|---|
CPU核时/GPU卡时 | 立即终止作业,实例停机,资源账号SSH不可访问,SFTP可访问 |
HPC包节点 | 立即终止作业,实例停机,资源账号SSH不可访问,SFTP可访问 |
AI计算 | 实例停机,资源账号SSH不可访问,SFTP可访问 |
存储空间 | 实例停机,挂在目录不可访问 |
3.数据保留与恢复
- 临时数据:超限作业的临时文件(如/tmp目录)将被立即清理。
- 用户数据:个人存储目录超限时,平台保留文件管理中的数据,允许用户下载数据文件。
五、用户权利与义务
1.用户义务:
- 确保作业资源需求与账号配额匹配,主动监控作业状态。
- 收到资源超限通知后,需在资源可用时间内主动处理相关作业/文件,否则平台将触发资源限制策略。
2.申诉与豁免:
- 对误判超限的作业,用户可提交日志与性能数据申请复核(3个工作日内反馈)。
六、平台免责声明
1.因用户资源超限导致的作业中断、数据丢失等后果,平台不承担赔偿责任。
2.因系统故障或外部攻击导致的误判超限,平台将在修复后优先恢复受影响作业或补偿相应的机时资源。
七、协议修改与终止
1.平台保留根据技术升级或政策要求调整本协议的权利,修改内容通过平台公告生效。 2.用户连续3次触发超限熔断且未申诉,平台有权暂停其资源账号使用权。