算力服务 · HPC / AI Computing

算力服务

面向科研计算、AI 训练和工程仿真任务,提供 CPU、GPU、国产 NPU、集群建设与调度平台的一体化算力服务。

CPU 算力配置
6

Intel Xeon / AMD EPYC 多规格节点

国产 NPU 算力
313 TFLOPS

华为 Atlas 800T,Ascend 910B x8

GPU 集群
3

RTX 4090 / 3090 / 5090 八卡节点

高速网络
25G-200G

RoCE / IB 按资源类型接入

SERVICE PORTFOLIO

算力不是单一资源,而是一套可交付的服务矩阵

从短期租赁到平台化调度,栏目内容按行业站方式展开,方便用户理解“能用什么、怎么用、适合什么任务”。

超算租赁
弹性算力租赁

超算租赁

01

面向科研计算、AI 训练、仿真模拟、大数据处理和渲染集群等场景,提供弹性灵活的超算算力租赁服务。

超算资源租赁
查看详情
智算中心
一体化智算平台

智算中心

02

集成资源监控、模型开发、模型训练、数据管理、模型服务和安全审计的人工智能资源调度与任务管理平台。

平台概述 资产与资源概览 (Dashboard) 模型开发与环境管理 (Development Environment) 模型训练 (Model Training)
查看详情
Compute Service

私有化部署

03

面向数据敏感和长期任务场景,提供本地化算力环境交付。

本地部署 安全隔离 运维交付
查看详情
集群建设
私有化算力硬件

集群建设

04

面向私有化 AI 算力和仿真计算场景,提供 AI 训推一体机、塔式仿真工作站等服务器定制方案。

AI训推一体机(8U) 塔式仿真工作站
查看详情
SERVICE ROUTE

先判断使用路径,再落到资源规格

算力需求通常不是单选题:短期任务适合租用,团队协作适合平台化调度,长期硬件建设则进入独立的硬件定制页。

短期项目先租算力池
Elastic HPC

短期项目先租算力池

CPU、GPU 与国产 NPU 资源按任务开通,适合临时扩容、批量计算和阶段性科研攻关。

CPU 多核 国产 NPU GPU 集群
进入路径
多人协作交给平台调度
AI Platform

多人协作交给平台调度

数据集、镜像、开发环境、训练任务、模型服务和操作记录统一管理,适合团队化 AI 研发。

Notebook 训练编排 模型服务
进入路径
长期稳定任务建设私有化节点
Private Cluster

长期稳定任务建设私有化节点

服务器、工作站、GPU、网络和存储按实验室部署方式组合,适合固定团队和长期负载。

集群建设 硬件定制 GPU 选型
进入路径
SELECTION GUIDE

按任务信号快速缩小选型范围

Workload / Resource / Delivery
任务类型 推荐路径 判断信号 典型任务
CPU 密集型科研计算 超算租赁 / 私有 CPU 节点 核心数、内存容量、MPI 并行、队列策略、任务周期 VASP、Gaussian、LAMMPS、有限元求解、参数扫描
模型训练与推理服务 GPU 集群 / AI 调度平台 显存、GPU 数量、镜像环境、训练数据、服务发布方式 深度学习训练、视觉算法、推理服务、可视化渲染
国产化 AI 验证 Atlas 国产算力 / MindSpore 生态 Ascend 卡型、框架适配、模型结构、数据吞吐和迁移成本 国产化训练验证、推理适配、信创环境测试
实验室长期负载 集群建设 / 硬件定制 固定团队、长周期运行、机房条件、供电散热、扩容周期 私有化 GPU 节点、塔式工作站、AI 训推一体机、实验室集群
RESOURCE SPECIFICATION

可选算力资源参数

资源规格按 CPU、国产算力和 GPU 集群拆分展示,便于用户快速比较核心数、内存、显存和互联网络。

CPU 算力

适合 VASP、Gaussian、LAMMPS、有限元求解、批量参数扫描等 CPU 密集型科研计算任务。

CPU / NPU / GPU
节点类型 CPU 配置 总核数 主频 内存
Intel Xeon 2 x Gold 6258R 56 2.7GHz 192G
Intel Xeon 2 x Gold 6258R 56 2.7GHz 1.5T
Intel Xeon 2 x Platinum 8368Q 76 2.6GHz 384G
AMD EPYC 2 x EPYC 7H12 128 2.6GHz 512G
AMD EPYC 2 x EPYC 9755 256 2.7GHz 768G
AMD EPYC 2 x EPYC 9554 128 3.1GHz 768G

国产算力(华为 Atlas)

适合国产化 AI 推理训练、昇腾生态适配和信创环境下的模型任务验证。

CPU / NPU / GPU
节点类型 CPU 配置 总核数 内存 加速卡 显存 网络 算力
Atlas 800T 4 x 鲲鹏 920 192 1.6T Ascend 910B x8 8 x 80G 200G RoCE 313 TFLOPS

GPU 算力集群

适合深度学习训练、推理服务、可视化渲染和 GPU 加速仿真任务。

CPU / NPU / GPU
集群类型 CPU 配置 总核数 内存 GPU 型号 显存 网络
RTX 4090 2 x AMD EPYC 7402 96 512G 4090 x8 24G x8 25G RoCE
RTX 3090 2 x AMD EPYC 7402 96 512G 3090 x8 24G x8 25G RoCE
RTX 5090 2 x Gold 6530 56 1024G 5090 x8 32G x8 200G IB
PLATFORM CAPABILITY

把算力、环境、调度和交付组织成一套平台能力

算力池化与弹性租赁

CPU、GPU、国产 NPU 资源按任务类型组合,支持短期扩容、批量计算和按需开通。

AI 调度平台

覆盖资源监控、模型开发、训练编排、数据集管理、模型服务、镜像仓库和操作审计。

科研软件环境

面向材料模拟、分子动力学、有限元、AI 训练等任务准备镜像、依赖和运行模板。

高速互联与数据流转

按资源类型接入 RoCE / IB 网络,支持大规模训练、轨迹文件和仿真结果的高吞吐读写。

集群建设与硬件定制

围绕 AI 训推一体机、塔式仿真工作站和实验室集群建设,衔接独立硬件定制页完成方案深化。

运维与安全审计

保留任务、资源、模型与代码操作记录;SLA、备份和权限策略待客户进一步确认。

PLATFORM PREVIEW

平台界面按实际使用流程展开

查看 AI Computing
资源总览与新手引导

资源总览与新手引导

面向 GPU、CPU、内存、存储等资源使用情况提供总览入口,并串联数据处理、模型开发、训练、管理与服务。

模型开发环境

模型开发环境

支持 Notebook、镜像、任务模板和交互式开发流程,适合科研算法验证与模型调试。

开发实例与远程访问

开发实例与远程访问

开发环境支持镜像、端口、数据存储、SSH / Web 访问和节点配置统一管理,方便多人按项目进入同一工作流。

数据集与存储管理

数据集与存储管理

集中管理数据集、数据标注、存储路径和任务输入,便于多项目、多人员协作。

PRIVATE HARDWARE

集群建设需要同时看性能、空间和扩展边界

服务器、塔式工作站、接口、供电、散热和应用场景会共同决定硬件路线;更完整的产品图、规格表和选型图进入硬件定制专题页。

进入硬件定制
扩展架构

扩展架构

处理器、内存、硬盘、网络、GPU 和电源能力集中展示,适合快速理解工作站扩展边界。

服务器规格总览

服务器规格总览

处理器、内存、硬盘、PCIe、网口、电源和系统支持集中呈现,便于在沟通阶段快速框定服务器能力。

工作站外观

工作站外观

塔式机箱更适合实验室、本地建模、前后处理和中小规模训练部署。

接口与面板

接口与面板

工作站后置接口、网络、USB、音频和顶部快捷接口影响日常接入、调试和本地设备协同。

DELIVERY PROCESS

从需求到结果交付,算力服务要有流程感

参考行业平台的表达方式,把“咨询后怎么推进”拆成清晰步骤,降低科研用户的决策成本。

  1. 01

    需求评估

    确认任务类型、软件栈、数据规模、并行方式和交付周期。

  2. 02

    资源选型

    在 CPU、GPU、国产 NPU 和平台资源中匹配合适配置。

  3. 03

    环境准备

    配置镜像、依赖、队列参数、访问方式和数据目录。

  4. 04

    任务运行

    提交作业、监控队列、跟踪资源利用率并处理异常。

  5. 05

    结果交付

    整理输出文件、日志、可视化结果和必要的复现实验说明。

  6. 06

    长期运维

    沉淀模板、镜像、数据规范和后续扩容建议。

SCENARIOS

算力服务承接的典型场景

查看全部场景
人工智能

AI 训练场景

面向科研模型训练、调参和推理验证的 GPU 算力与环境支持。

高性能计算

弹性超算租赁场景

面向科研计算、AI 训练、仿真模拟、大数据处理和渲染集群的短期或弹性算力扩容。

人工智能

AI 调度平台场景

面向模型开发、训练编排、数据管理、模型服务和安全审计的一体化智算平台。

FAQ

算力服务常见问题

围绕资源选择、使用路径和项目确认边界,先回答咨询前最容易卡住的问题。

CPU 节点、GPU 节点和 NPU 节点怎么选? +

CPU 更适合大量通用并行计算、批处理和部分传统仿真;GPU 更适合深度学习训练、GPU 加速求解和可视化;NPU 通常用于国产化 AI 训练、推理或适配验证。具体选择需要看软件和任务规模。

显存不够时一定要增加 GPU 卡数吗? +

不一定。显存不足可能需要降低 batch、使用混合精度、模型切分或更换更大显存卡。增加卡数是否有效取决于训练方式、互联网络和代码并行能力。

资源规格表里的配置是否代表实时库存? +

资源规格表用于说明可评估的资源类型和配置口径,不等同于实时库存、排队策略或固定交付时间。正式使用前仍需结合任务和当前资源安排确认。

AI 训练任务需要提前准备什么? +

建议准备模型框架、训练脚本、数据规模、预期显存、运行方式和目标结果。如果已有日志或历史运行配置,也可以一起提供,便于判断瓶颈。

私有化服务器选型为什么要看散热和电源? +

多 GPU 服务器长期高负载运行时,散热、电源、机箱空间和噪声会直接影响稳定性。只按显卡型号选型容易忽略整机约束。

能否支持国产算力适配? +

可以先评估国产算力适配路径。需要确认模型框架、算子支持、数据格式、目标硬件和推理或训练目标。是否能迁移以及工作量需要按项目验证。

READY TO START

带着任务类型和数据规模来,我们帮你匹配算力与交付路径

固定 SLA、价格、排队策略和账号权限会在咨询后按任务规模确认,避免用统一口径误导不同项目。

提交算力需求
电话 微信 提交