# enterprise-docs
**Repository Path**: xorbitsai/enterprise-docs
## Basic Information
- **Project Name**: enterprise-docs
- **Description**: Official enterprise version docs.
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: docs
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-07-01
- **Last Updated**: 2025-07-01
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README

# Xorbits Inference Enterprise
# Xinference 企业级推理服务产品介绍
Xinference 是针对生成式 AI 场景度身定制的能力全面的推理服务平台。通过提供统一的异构算力推理服务、模型全生命周期管理以及可运维可观测的企业级管理能力,助力客户快速构建 AI 应用,加速业务创新
### 产品优势
- **统一的异构算力推理服务**
- 支持多厂商、多型号 GPU/NPU (包括国产) 异构算力同时调度。
- 智能调度算法优化算力资源配置,提高资源利用率。
- 按需扩展算力资源,针对不同场景动态配置基础算力
- **全生命周期管理**
- 提供模型自定义注册、微调、一键部署、删除等全流程管理工具。
- 支持模型热加载,支持针对 GPU 的模型部署隔离
- 支持模型版本管理,确保模型可控性和稳定性
- **多引擎、多模型支持**
- 支持多种推理引擎,如 vLLM、SGLang、Pytorch、MindIE 等,灵活适配不同模型和场景
- 兼容主流应用框架,包括,Langchain、Dify、Ragflow 等,方便一键集成。
- 支持 100+ 最新模型,覆盖文本生成、多模态、音频生成等多种类型。
- **企业级特性**
- 提供用户权限管理、单点登录、多租户隔离、高可用等企业级能力
- 支持模型微调和持续预训练,支持离线任务处理
- 提供监控运维和可观测工具,保障系统稳定运行
### 核心功能
- **平台监控**:实时监测模型实例、GPU 使用率、Token 消耗等关键指标。
- **模型管理**:支持模型注册、模型仓库管理、运行实例管理、微调任务管理等。
- **用户管理**:提供角色管理、用户管理、密钥管理、集群管理等功能。
### 功能列表
| 一级功能 | 二级功能 | 功能描述 |
| ---- | ----- | -------------------------------- |
| 基础模块 | 登录/注册 | 支持微信扫码进行新用户注册、支持两种登录方式(账号密码&扫码) |
| | 个人中心 | 查看账号信息,支持更改手机号和重置密码 |
| | 国际化 | 支持中文&英文切换 |
| 系统管理 | 用户管理 | 列表展示用户,支持添加新用户、编辑资料、删除账户、分配令牌操作。 |
| | 租户管理 | 列表展示租户、修改、删除租户操作, 支持给租户分配用户。 |
| | 角色管理 | 自定义角色名称,选择权限集合,支持复制已有角色快速设置。 |
| | 菜单管理 | 树状结构展示菜单,支持调整顺序,勾选分配权限。 |
| 本地模型 | 平台监控 | 实时性能指标展示、集群管理、模型管理、节点、资源监控 |
| | 模型监控 | 已安装模型监控 |
| | 模型仓库 | 用于存储、分类和管理本地模型文件 |
| | 模型注册 | 登记和配置新模型,方便调用和使用 |
| | 运行实例 | 展示、监控和管理模型的实际运行实例及状态 |
| | 微调任务 | 微调任务创建、监控,微调结果评估,一键上线 |
### 企业版和开源版本的对比
| | 企业版本 | 开源版本 |
| --------- | ------------------------ | --------------------------- |
| 用户权限管理 | 用户权限、单点登录、加密认证 | tokens 授权 |
| 集群能力 | SLA 调度、租户隔离、弹性伸缩 | 抢占调度 |
| 引擎支持 | 优化过的vLLM、SGLang、TensorRT | vLLM、SGLang |
| 批处理 | 支持大量调用的定制批处理 | 无 |
| 微调 | 支持上传数据集微调 | 无 |
| 国产 GPU 支持 | 昇腾、海光、天数、寒武纪、沐曦 | 无 |
| 模型管理 | 可私有部署的模型下载和管理服务 | 依赖 modelscope 和 huggingface |
| 故障检测和恢复 | 自动检测节点故障并进行故障复位 | 无 |
| 高可用 | 所有节点都是冗余部署支持服务高可用 | 无 |
| 监控 | 监控指标 API 接口,和现有系统集成 | 页面显示 |
| 运维 | 远程 cli 部署、不停机升级 | 无 |
| 服务 | 远程技术支持和自动升级服务 | 社区支持 |
### 产品界面


### 联系我们
