枢密AI · 企业内网可信 AI 平台

把大模型部署在企业内网,安全、可控、可审计

统一纳管模型、知识库、权限和审计日志,让员工在内网中使用 枢密AI助手,敏感数据不出企业边界。

枢密AI 控制台

内网环境 · RBAC · 审计开启

本地推理中

员工提问

帮我总结这份内网招标文件的风险点

已调用企业知识库、权限策略和敏感词规则

模型

Qwen 私有版

知识库

招采制度

审计

已留痕

100%
数据主权
0
数据外泄
6周
交付上线

TRUSTED & COMPLIANT

围绕合规要求和国产软硬件生态做部署验证

等保三级建设支持

围绕身份认证、访问控制、日志审计和边界隔离提供配置基线。

数据安全评估材料

输出数据流向、权限矩阵、审计留痕和敏感信息治理说明。

信创适配验证

按客户环境验证操作系统、AI 加速卡、数据库和容器平台兼容性。

兼容与适配生态

昇腾
寒武纪
NVIDIA
麒麟软件
统信UOS
达梦数据
人大金仓
智谱AI
DeepSeek

企业用AI,最怕这4件事

企业部署 AI 应用所面对的挑战

公有云AI怕数据泄露

员工偷用ChatGPT/通义千问,敏感数据可能外泄,违反内控与监管要求。
枢密AI 对策:数据、模型、推理全链路留在企业内网,四层网络纵深隔离,数据永不出网。

不知该用哪个大模型

市面上模型太多,各有优劣,不知道哪个最适合企业场景,试错成本高。
枢密AI 对策:模型管理中心统一纳管国产模型,按需上下架、灵活调度,一个平台对比择优。

员工乱用AI没法管控

缺乏统一管理平台,无法审计AI对话内容,过不了等保和数据安全评估。
枢密AI 对策:RBAC 细粒度权限 + 全链路对话审计留痕,满足等保三级与数据安全评估。

信创要求无法满足

政企客户要求国产化全栈,但缺乏成熟的信创AI解决方案。
枢密AI 对策:从操作系统到推理框架全栈信创适配,提供麒麟/统信、昇腾/寒武纪等国产化验证方案。

WHY PRIVATE

公有云 API vs 内网私有化,差别在哪?

同样是用大模型,部署方式决定了数据安全、合规与可控性的天花板

对比维度 公有云 AI API 枢密AI 内网私有化
数据位置 上传至第三方云端 全程留在企业内网,永不出网
数据主权 受服务商条款约束 企业 100% 自主掌控
模型可控性 随厂商升级/下线,无法干预 统一纳管,自主选型与版本固定
合规审计 难以满足等保与数据安全评估 全链路审计留痕,过等保三级
信创适配 基本不支持国产化 操作系统到推理框架全栈信创
长期成本 按调用量计费,规模越大越贵 一次性投入,规模化后更省

ARCHITECTURE

枢密AI 企业内网架构

从入口、治理、Agent 编排到审计与存储,把模型、工具、知识库和业务系统纳入同一套企业安全边界。

枢密AI助手

Portal / REST / SDK

Policy Firewall

SSO、RBAC、组织隔离、额度、敏感词、命令审批和风险评级统一拦截。

身份校验 权限计算 审批策略 敏感过滤 配额限制
Quarantine Queue
未授权工具调用
敏感数据片段
高风险命令

MCP Registry

服务发现、配置分发、沙箱策略

枢密AI 工作台

13+ Agent 并行、统一上下文、结果预览

Skills Market

技能审核、依赖校验、组织分发

Claude Code
Codex
Qwen Code
Hermes Agent
Snow CLI
Cursor Agent

运行状态

自动检测

识别本机和服务器可用 Agent

并行运行

多个 Agent 同时执行任务

统一上下文

会话、文件、工具结果共享

acme-corp
组织策略 知识库 模型配额 审计域
isolated
project-orion
项目空间 MCP 权限 Agent 列表 日志隔离
isolated
user-alice
个人会话 文件权限 工具审批 结果留痕
isolated

管理者看到的是“谁做了什么”,不是一串技术日志

对话、工具、文件、审批、风险命中都会汇总成可搜索、可筛选、可导出的记录。

谁在使用

记录员工、部门、角色和登录来源,方便定位责任人。

问了什么

保留对话、上传文件、引用知识库和模型返回结果。

调用了什么

追踪 MCP 工具、业务系统接口、执行参数和审批结果。

是否有风险

标记敏感词命中、越权访问、高风险命令和拦截原因。

如何复盘

按部门、人员、模型、工具和时间导出合规报表。

统一模型网关 + 知识库 RAG + 企业数据底座

数据库

Vector / RAG

GPUStack

vLLM

MinIO

备份恢复

WHY 枢密AI

软硬一体 · 弹性部署 · 快速落地

以全栈自主可控为基础,整合算力、模型与场景,帮助企业在内网环境中快速构建真正可用的AI能力

快速交付

开箱即用的AI能力组件,按场景以自然语言快速编排,6周即可完成部署上线

软硬整合

从GPU集群到推理框架全栈适配,支持多样化国产硬件按需选型部署

自主可控

数据、模型、推理全链路留在企业内网,第三方无法访问,全程审计留痕

PLATFORM CAPABILITIES

六大核心能力,覆盖企业AI全场景

AI对话工作台

简洁对话界面 + 企业知识库 + 合规提示,让员工安全高效使用枢密AI助手。支持上下文记忆 100+ 轮对话,响应延迟 <2s。

模型管理中心

统一管理国产模型(通义/智谱/DeepSeek),按需上架/下架,灵活调度。支持 10+ 主流模型,一键切换无缝迁移。

企业知识库

基于企业内部文档构建RAG能力,支持权限隔离和引用溯源。索引 10 万+文档,检索准确率 >95%,响应 <50ms。

MCP服务市场

中心化MCP服务治理,沙箱隔离、权限分发、调用审计。内置 20+ 企业级服务,支持自定义扩展与版本管理。

Skills技能市场

企业Skills发布与共享平台,支持版本管理、AB测试和使用统计。覆盖办公/财务/HR/客服等 50+ 场景技能。

模型定制工作台

零门槛微调定制,将审计数据和知识库转化为专属模型。支持 LoRA/QLoRA 高效微调,最快 2 小时完成训练。

四层网络纵深隔离

SECURITY ARCHITECTURE

从办公网到GPU核心区,层层隔离,数据永不离开企业机房

VLAN隔离 防火墙策略 端口最小化 全链路加密

办公网络

员工PC通过HTTPS访问,只暴露443端口

AI服务网络(DMZ)

枢密AI 平台服务层,VLAN隔离+防火墙

GPU推理网络(核心区)

完全隔离,不对外暴露任何端口

数据网络(核心区)

双机热备,定时备份到磁带/离线存储

打通企业系统,零代码落地AI场景

ZERO-CODE INTEGRATION

CRM系统

客户关系管理

ERP系统

企业资源计划

OA办公

企业协同办公

数据库

SQL查询与分析

灵活部署,按需选择

DEPLOYMENT OPTIONS

推荐

企业版

适合中大型企业生产环境

$ 50-100万
  • 支持 500+ 并发用户
  • 弹性 GPU 集群
  • 全链路审计与合规
  • RBAC 细粒度权限
  • 7×24 专属技术支持
  • 定制化部署服务

PROVEN DELIVERY

标准化 6 周交付流程

从需求到上线,透明可控的私有化部署全流程

Week 1:需求调研与方案设计

深入了解业务场景、数据规模与合规要求,输出定制化架构方案与硬件选型建议。

Week 2:环境配置与基础搭建

协助完成服务器、网络与存储配置,部署基础平台与容器环境,完成安全策略设置。

Week 3-4:平台部署与模型上架

枢密AI 平台安装部署,模型管理中心配置,企业知识库与权限体系初始化。

Week 4-5:系统集成与联调测试

打通 CRM/ERP/OA 等企业系统,端到端测试验证,压测与安全扫描。

Week 5:用户培训与试运行

管理员与最终用户分层培训,小范围试用收集反馈,调优配置参数。

Week 6:正式上线与持续护航

全量发布上线,7×24 技术支持响应,定期巡检与版本升级服务。

XINCHUANG READY

全栈信创适配

参考政企私有化部署和大模型一体机友商实践,覆盖从底层硬件到容器平台的国产化适配生态

操作系统

麒麟 V10 统信 UOS openEuler 欧拉 中科方德 凝思磐石

支持按客户现有服务器环境验证适配。

处理器

鲲鹏 海光 飞腾 龙芯 兆芯 申威

覆盖 ARM、x86、LoongArch 等国产 CPU 架构部署场景。

AI 加速卡

华为昇腾 寒武纪 海光 DCU 沐曦 燧原 摩尔线程 昆仑芯 天数智芯 壁仞

按模型规模做推理性能验证。

数据库

达梦 人大金仓 南大通用 神通 OceanBase openGauss GaussDB TDSQL

支持元数据、审计日志和业务库对接。

推理框架

MindSpore vLLM SGLang Xinference LMDeploy llama.cpp TensorRT-LLM

结合国产算力做模型服务化和吞吐调优。

容器平台

iSula Kubernetes KubeSphere Rainbond DaoCloud Alauda 麒麟容器云 统信有云

支持离线部署、镜像仓库和集群运维。

让企业AI安全落地 从一次咨询开始

我们的团队将为您定制专属的AI部署方案,覆盖从架构设计到上线运维的全流程
销售与技术咨询:service@shumi.ai · 1 个工作日内响应