x86 架构 · 服务器

枢密AI x86服务器 Ultra

顶级算力 · 多模型并行 · 大规模部署

基于Intel Xeon和NVIDIA GPU的高性能AI推理服务器，支持千人并发、多模型并行推理、视觉大模型和代码生成，适合大型企业和集团总部。

硬件价格

¥19.8万

软件授权/年

¥12.8万

套装价（硬件+软件） ¥29.8万

支持GPU扩展，4卡配置加价12万

预约咨询查看所有产品

x86

技术规格

硬件配置

处理器

Intel Xeon Silver 4314 16核 2.4GHz x2

内存

256GB DDR4 ECC

存储

4TB NVMe SSD RAID10 + 12TB SATA HDD RAID5

GPU / AI加速卡

NVIDIA A10 24GB x2 (可扩展至4卡)

网络

双万兆光纤网口 + 双万兆电口

操作系统

CentOS / Ubuntu Server / Windows Server

性能指标

推理速度

1000-1500 tokens/s (13B模型)

并发用户

500-1000 并发用户

模型支持

支持70B模型流畅推理，可同时加载3-5个模型

处理能力

单节点日处理200万次对话

物理规格

外形尺寸

4U 机架式 482x177x850mm

重量

35kg

电源

1200W 1+1冗余白金电源

散热方式

前后热插拔冗余风扇 + GPU独立风道

接口扩展

8x USB 3.0

2x VGA

2x 光纤口

4x RJ45

2x 管理口

产品亮点

NVIDIA A10专业AI加速卡

支持文本、图像、代码多模态推理

可扩展至4卡，算力翻倍

企业级冗余设计，99.9%可用性

支持Docker/K8s容器化部署

适用场景

1000+人大型企业AI平台

集团总部统一AI门户

多模态AI应用（文本+图像+代码）

证券/银行智能投研

互联网公司内部AI基础设施

预装软件

硬件出厂时已预装以下软件，开箱即用

枢密AI助手

统一对话入口、多模型接入、权限控制、审计留痕

了解详情

企业知识库

文档管理、向量检索、权限隔离、知识问答

了解详情

大模型推理引擎

支持主流开源模型、模型网关、配额管理、性能监控

了解详情

准备开始使用？

联系我们获取详细报价、技术方案和演示环境

预约产品演示返回产品列表