算力服务 · HPC / AI Computing

算力服务

面向科研计算、AI 训练和工程仿真任务，提供 CPU、GPU、国产 NPU、集群建设与调度平台的一体化算力服务。

获取算力方案查看资源规格

CPU 算力配置

6 类

Intel Xeon / AMD EPYC 多规格节点

国产 NPU 算力

313 TFLOPS

华为 Atlas 800T，Ascend 910B x8

GPU 集群

3 档

RTX 4090 / 3090 / 5090 八卡节点

高速网络

25G-200G

RoCE / IB 按资源类型接入

SERVICE PORTFOLIO

算力不是单一资源，而是一套可交付的服务矩阵

从短期租赁到平台化调度，栏目内容按行业站方式展开，方便用户理解“能用什么、怎么用、适合什么任务”。

弹性算力租赁

超算租赁

面向科研计算、AI 训练、仿真模拟、大数据处理和渲染集群等场景，提供弹性灵活的超算算力租赁服务。

超算资源租赁

查看详情

一体化智算平台

智算中心

集成资源监控、模型开发、模型训练、数据管理、模型服务和安全审计的人工智能资源调度与任务管理平台。

平台概述资产与资源概览 (Dashboard) 模型开发与环境管理 (Development Environment) 模型训练 (Model Training)

查看详情

Compute Service

私有化部署

面向数据敏感和长期任务场景，提供本地化算力环境交付。

本地部署安全隔离运维交付

查看详情

私有化算力硬件

集群建设

面向私有化 AI 算力和仿真计算场景，提供 AI 训推一体机、塔式仿真工作站等服务器定制方案。

AI训推一体机（8U）塔式仿真工作站

查看详情

SERVICE ROUTE

先判断使用路径，再落到资源规格

算力需求通常不是单选题：短期任务适合租用，团队协作适合平台化调度，长期硬件建设则进入独立的硬件定制页。

Elastic HPC

短期项目先租算力池

CPU、GPU 与国产 NPU 资源按任务开通，适合临时扩容、批量计算和阶段性科研攻关。

CPU 多核国产 NPU GPU 集群

进入路径

AI Platform

多人协作交给平台调度

数据集、镜像、开发环境、训练任务、模型服务和操作记录统一管理，适合团队化 AI 研发。

Notebook 训练编排模型服务

进入路径

Private Cluster

长期稳定任务建设私有化节点

服务器、工作站、GPU、网络和存储按实验室部署方式组合，适合固定团队和长期负载。

集群建设硬件定制 GPU 选型

进入路径

SELECTION GUIDE

按任务信号快速缩小选型范围

Workload / Resource / Delivery

任务类型	推荐路径	判断信号	典型任务
CPU 密集型科研计算	超算租赁 / 私有 CPU 节点	核心数、内存容量、MPI 并行、队列策略、任务周期	VASP、Gaussian、LAMMPS、有限元求解、参数扫描
模型训练与推理服务	GPU 集群 / AI 调度平台	显存、GPU 数量、镜像环境、训练数据、服务发布方式	深度学习训练、视觉算法、推理服务、可视化渲染
国产化 AI 验证	Atlas 国产算力 / MindSpore 生态	Ascend 卡型、框架适配、模型结构、数据吞吐和迁移成本	国产化训练验证、推理适配、信创环境测试
实验室长期负载	集群建设 / 硬件定制	固定团队、长周期运行、机房条件、供电散热、扩容周期	私有化 GPU 节点、塔式工作站、AI 训推一体机、实验室集群

RESOURCE SPECIFICATION

可选算力资源参数

资源规格按 CPU、国产算力和 GPU 集群拆分展示，便于用户快速比较核心数、内存、显存和互联网络。

CPU 算力

适合 VASP、Gaussian、LAMMPS、有限元求解、批量参数扫描等 CPU 密集型科研计算任务。

CPU / NPU / GPU

节点类型	CPU 配置	总核数	主频	内存
Intel Xeon	2 x Gold 6258R	56	2.7GHz	192G
Intel Xeon	2 x Gold 6258R	56	2.7GHz	1.5T
Intel Xeon	2 x Platinum 8368Q	76	2.6GHz	384G
AMD EPYC	2 x EPYC 7H12	128	2.6GHz	512G
AMD EPYC	2 x EPYC 9755	256	2.7GHz	768G
AMD EPYC	2 x EPYC 9554	128	3.1GHz	768G

国产算力（华为 Atlas）

适合国产化 AI 推理训练、昇腾生态适配和信创环境下的模型任务验证。

CPU / NPU / GPU

节点类型	CPU 配置	总核数	内存	加速卡	显存	网络	算力
Atlas 800T	4 x 鲲鹏 920	192	1.6T	Ascend 910B x8	8 x 80G	200G RoCE	313 TFLOPS

GPU 算力集群

适合深度学习训练、推理服务、可视化渲染和 GPU 加速仿真任务。

CPU / NPU / GPU

集群类型	CPU 配置	总核数	内存	GPU 型号	显存	网络
RTX 4090	2 x AMD EPYC 7402	96	512G	4090 x8	24G x8	25G RoCE
RTX 3090	2 x AMD EPYC 7402	96	512G	3090 x8	24G x8	25G RoCE
RTX 5090	2 x Gold 6530	56	1024G	5090 x8	32G x8	200G IB

PLATFORM CAPABILITY

把算力、环境、调度和交付组织成一套平台能力

算力池化与弹性租赁

CPU、GPU、国产 NPU 资源按任务类型组合，支持短期扩容、批量计算和按需开通。

AI 调度平台

覆盖资源监控、模型开发、训练编排、数据集管理、模型服务、镜像仓库和操作审计。

科研软件环境

面向材料模拟、分子动力学、有限元、AI 训练等任务准备镜像、依赖和运行模板。

高速互联与数据流转

按资源类型接入 RoCE / IB 网络，支持大规模训练、轨迹文件和仿真结果的高吞吐读写。

集群建设与硬件定制

围绕 AI 训推一体机、塔式仿真工作站和实验室集群建设，衔接独立硬件定制页完成方案深化。

运维与安全审计

保留任务、资源、模型与代码操作记录；SLA、备份和权限策略待客户进一步确认。

PLATFORM PREVIEW

平台界面按实际使用流程展开

查看 AI Computing

资源总览与新手引导

面向 GPU、CPU、内存、存储等资源使用情况提供总览入口，并串联数据处理、模型开发、训练、管理与服务。

模型开发环境

支持 Notebook、镜像、任务模板和交互式开发流程，适合科研算法验证与模型调试。

开发实例与远程访问

开发环境支持镜像、端口、数据存储、SSH / Web 访问和节点配置统一管理，方便多人按项目进入同一工作流。

数据集与存储管理

集中管理数据集、数据标注、存储路径和任务输入，便于多项目、多人员协作。

PRIVATE HARDWARE

集群建设需要同时看性能、空间和扩展边界

服务器、塔式工作站、接口、供电、散热和应用场景会共同决定硬件路线；更完整的产品图、规格表和选型图进入硬件定制专题页。

进入硬件定制

扩展架构

处理器、内存、硬盘、网络、GPU 和电源能力集中展示，适合快速理解工作站扩展边界。

服务器规格总览

处理器、内存、硬盘、PCIe、网口、电源和系统支持集中呈现，便于在沟通阶段快速框定服务器能力。

工作站外观

塔式机箱更适合实验室、本地建模、前后处理和中小规模训练部署。

接口与面板

工作站后置接口、网络、USB、音频和顶部快捷接口影响日常接入、调试和本地设备协同。

DELIVERY PROCESS

从需求到结果交付，算力服务要有流程感

参考行业平台的表达方式，把“咨询后怎么推进”拆成清晰步骤，降低科研用户的决策成本。

01

需求评估

确认任务类型、软件栈、数据规模、并行方式和交付周期。
02

资源选型

在 CPU、GPU、国产 NPU 和平台资源中匹配合适配置。
03

环境准备

配置镜像、依赖、队列参数、访问方式和数据目录。
04

任务运行

提交作业、监控队列、跟踪资源利用率并处理异常。
05

结果交付

整理输出文件、日志、可视化结果和必要的复现实验说明。
06

长期运维

沉淀模板、镜像、数据规范和后续扩容建议。

SCENARIOS

算力服务承接的典型场景

查看全部场景

人工智能

AI 训练场景

面向科研模型训练、调参和推理验证的 GPU 算力与环境支持。

高性能计算

弹性超算租赁场景

面向科研计算、AI 训练、仿真模拟、大数据处理和渲染集群的短期或弹性算力扩容。

人工智能

AI 调度平台场景

面向模型开发、训练编排、数据管理、模型服务和安全审计的一体化智算平台。

FAQ

算力服务常见问题

围绕资源选择、使用路径和项目确认边界，先回答咨询前最容易卡住的问题。

CPU 节点、GPU 节点和 NPU 节点怎么选？ +

CPU 更适合大量通用并行计算、批处理和部分传统仿真；GPU 更适合深度学习训练、GPU 加速求解和可视化；NPU 通常用于国产化 AI 训练、推理或适配验证。具体选择需要看软件和任务规模。

显存不够时一定要增加 GPU 卡数吗？ +

不一定。显存不足可能需要降低 batch、使用混合精度、模型切分或更换更大显存卡。增加卡数是否有效取决于训练方式、互联网络和代码并行能力。

资源规格表里的配置是否代表实时库存？ +

资源规格表用于说明可评估的资源类型和配置口径，不等同于实时库存、排队策略或固定交付时间。正式使用前仍需结合任务和当前资源安排确认。

AI 训练任务需要提前准备什么？ +

建议准备模型框架、训练脚本、数据规模、预期显存、运行方式和目标结果。如果已有日志或历史运行配置，也可以一起提供，便于判断瓶颈。

私有化服务器选型为什么要看散热和电源？ +

多 GPU 服务器长期高负载运行时，散热、电源、机箱空间和噪声会直接影响稳定性。只按显卡型号选型容易忽略整机约束。

能否支持国产算力适配？ +

可以先评估国产算力适配路径。需要确认模型框架、算子支持、数据格式、目标硬件和推理或训练目标。是否能迁移以及工作量需要按项目验证。

READY TO START

带着任务类型和数据规模来，我们帮你匹配算力与交付路径

固定 SLA、价格、排队策略和账号权限会在咨询后按任务规模确认，避免用统一口径误导不同项目。

提交算力需求

算力服务

算力不是单一资源，而是一套可交付的服务矩阵

超算租赁

智算中心

私有化部署

集群建设

先判断使用路径，再落到资源规格

短期项目先租算力池

多人协作交给平台调度

长期稳定任务建设私有化节点

按任务信号快速缩小选型范围

可选算力资源参数

CPU 算力

国产算力（华为 Atlas）

GPU 算力集群

把算力、环境、调度和交付组织成一套平台能力

算力池化与弹性租赁

AI 调度平台

科研软件环境

高速互联与数据流转

集群建设与硬件定制

运维与安全审计

平台界面按实际使用流程展开

资源总览与新手引导

模型开发环境

开发实例与远程访问

数据集与存储管理

集群建设需要同时看性能、空间和扩展边界

扩展架构

服务器规格总览

工作站外观

接口与面板

从需求到结果交付，算力服务要有流程感

需求评估

资源选型

环境准备

任务运行

结果交付

长期运维

算力服务承接的典型场景

AI 训练场景

弹性超算租赁场景

AI 调度平台场景

算力服务常见问题

带着任务类型和数据规模来，我们帮你匹配算力与交付路径