x86 架构 · 服务器

枢密AI x86服务器 Ultra

顶级算力 · 多模型并行 · 大规模部署

基于Intel Xeon和NVIDIA GPU的高性能AI推理服务器,支持千人并发、多模型并行推理、视觉大模型和代码生成,适合大型企业和集团总部。

硬件价格

¥19.8万

软件授权/年

¥12.8万

套装价(硬件+软件) ¥29.8万

支持GPU扩展,4卡配置加价12万

x86

技术规格

硬件配置

处理器

Intel Xeon Silver 4314 16核 2.4GHz x2

内存

256GB DDR4 ECC

存储

4TB NVMe SSD RAID10 + 12TB SATA HDD RAID5

GPU / AI加速卡

NVIDIA A10 24GB x2 (可扩展至4卡)

网络

双万兆光纤网口 + 双万兆电口

操作系统

CentOS / Ubuntu Server / Windows Server

性能指标

推理速度

1000-1500 tokens/s (13B模型)

并发用户

500-1000 并发用户

模型支持

支持70B模型流畅推理,可同时加载3-5个模型

处理能力

单节点日处理200万次对话

物理规格

外形尺寸

4U 机架式 482x177x850mm

重量

35kg

电源

1200W 1+1冗余白金电源

散热方式

前后热插拔冗余风扇 + GPU独立风道

接口扩展

8x USB 3.0
2x VGA
2x 光纤口
4x RJ45
2x 管理口

产品亮点

NVIDIA A10专业AI加速卡
支持文本、图像、代码多模态推理
可扩展至4卡,算力翻倍
企业级冗余设计,99.9%可用性
支持Docker/K8s容器化部署

适用场景

1000+人大型企业AI平台

集团总部统一AI门户

多模态AI应用(文本+图像+代码)

证券/银行智能投研

互联网公司内部AI基础设施

预装软件

硬件出厂时已预装以下软件,开箱即用

枢密AI助手

统一对话入口、多模型接入、权限控制、审计留痕

了解详情

企业知识库

文档管理、向量检索、权限隔离、知识问答

了解详情

大模型推理引擎

支持主流开源模型、模型网关、配额管理、性能监控

了解详情

准备开始使用?

联系我们获取详细报价、技术方案和演示环境