Appearance
一、什么是高性能计算(HPC)?
高性能计算(HPC)是一种通过 分布式计算资源 (多核CPU、GPU集群、高速网络)和 并行计算技术 ,快速解决复杂科学、工程问题的计算方法。
- 核心目标:将传统单机无法完成的任务,通过 “分而治之”策略 大幅缩短计算时间。
- 灵犀易算云平台的作用:提供免运维的云端HPC服务,用户无需自建超算集群即可调用海量计算资源。
二、 为什么需要HPC?
典型场景
领域 | 应用案例 |
---|---|
工程仿真 | 飞行器气动设计、汽车碰撞模拟、核反应堆安全性分析 |
材料科学 | 纳米材料分子动力学模拟、电池电极性能优化 |
生物医学 | 蛋白质折叠分析、药物分子虚拟筛选、基因组测序数据处理 |
气候与能源 | 气象预测模型、石油勘探地震波反演、风电场布局优化 |
何时使用HPC?
- 单任务耗时超过 24小时
- 计算需求存在 天然并行性 (如参数扫描、独立子任务)
- 需要 大规模内存 (TB级)或 高速存储 支持
三、灵犀易算云平台的HPC优势
特性 | 传统自建HPC | 灵犀易算云平台 |
---|---|---|
资源获取 | 采购周期长,固定成本高 | 按需秒级弹性扩展 |
运维复杂度 | 需专业团队维护硬件/软件 | 全托管服务,自动负载均衡 |
成本效率 | 空闲资源浪费严重 | 按实际用量计费,支持动态调度空闲计算节点资源 |
技术门槛 | 需掌握MPI/OpenMP等底层编程 | 提供可视化图形界面模板与技术支持服务 |
四、 新手快速上手流程
步骤1:准备计算任务
- 确认并行性:检查任务是否可拆分(如不同参数、数据分块)
- 输入文件规范:
- 单任务模式:单个输入文件(如
input.in
) - 多任务模式:使用
joblist.csv
定义批量参数
- 单任务模式:单个输入文件(如
步骤2:提交任务
Bash
# 示例:提交OpenMP多线程任务
yisuan submit \
--name=material_simulation \
--type=openmp \
--nodes=4 \ # 使用4个计算节点
--cpus-per-node=32 \ # 每个节点分配32核
--input=inputs.zip \
--script=run.sh # 包含编译和运行命令的脚本
五、常见HPC任务示例
5.1 MPI并行任务
Bash
# 提交MPI跨节点计算
yisuan submit \
--type=mpi \
--nodes=16 \
--mpi-args="-n 256" \ # 启动256个MPI进程
--image=docker.yisuan/mpi-latest # 使用预装MPI的容器镜像
5.2 GPU加速计算
Bash
# 使用A100 GPU进行深度学习训练
yisuan submit \
--type=deep_learning \
--gpu-type=a100 \ # 指定GPU型号
--gpu-count=4 \ # 每节点4卡
--framework=pytorch \ # 自动配置PyTorch环境
--script=train.py