# AI客服FSHI质检系统

**Repository Path**: full-spectrum/FSHI

## Basic Information

- **Project Name**: AI客服FSHI质检系统
- **Description**: FSHI 全频谱健康指数平台｜企业 AI 治理免疫系统，从 “事后质检” 到 “事前预测”，让每一个 AI 都安全、可控、可量化回报。基于全频谱认知架构与 S/R/M/B 四维健康模型，实现对 AI 客服、销售、运营、风控等系统的零侵入、全链路、可量化治理，实时发现风险、精准定位根因、一键启动治理战役、自动计算 ROI，让 AI 从 “不可控成本” 变为 “可量化资产”。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-06-02
- **Last Updated**: 2026-06-05

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# FSHI — 全频谱健康指数 AI 治理平台

> **V0.2** | 2026-06-02 | 企业 AI 治理免疫系统

## 概述

FSHI（全频谱健康指数平台）是零侵入、全链路、可量化的 AI 治理平台。基于全频谱认知架构与 **S/R/M/B 四维健康模型**，实现实时风险发现、精准根因定位、一键治理战役启动、自动 ROI 计算——让 AI 从"不可控成本"变为"可量化资产"。

### 四维评分引擎（S/R/M/B）

| 维度 | 简写 | 说明 |
|------|------|------|
| **服务质量** | S | 礼貌度、共情力、语气一致性 |
| **风险检测** | R | 合规违规检测、P1/P2 禁用语 |
| **模型鲁棒性** | M | 防幻觉、上下文保持 |
| **业务准确度** | B | B1 产品意图一致性 + B2 行业规范准确度 |

## 当前版本 — V0.2 RC

### 测试覆盖

| 测试集 | 通过/总数 | 通过率 | 判定 |
|--------|:--------:|:------:|:----:|
| L1 冒烟测试 | 5/5 | 100% | ✅ |
| L2 回归测试 | 100/100 | 100% | ✅ |
| L3 对抗测试（人工） | 18/20 | 90% | ✅ |
| TS-B1/B2（业务维度） | 56/60 | 93% | ✅ |
| TS-CFSM/CFG/INT/API | 72/80 | 90% | ✅ |
| TS-PERF（性能） | 7/10 | 70% | ❌ |
| **合计** | **257/275** | **93%** | — |

### 已修复缺陷（DEFECT-001 ~ DEFECT-009）

- **DEFECT-004**：B1 零命中回复新增"服务近邻"识别（物流语境 14 个模式），给 60 分楼层（原为 0）
- **DEFECT-005**：B2 required_words 策略从逐项扣分改为 all-or-nothing（命中 ≥1 词不扣分）
- **DEFECT-008**：API v2 管道修复——user-only 轮次不再拉低 B 维度平均分
- **DEFECT-001~003, 006, 007, 009**：禁用语检测、冷链场景、操作指引、关键词扩展等校准修复

全部 9 条缺陷已修复，详见 `bug-list.md`。

### 剩余问题

- **B2 扣分力度**：MANUAL-01/06 得分 65-66，应 ≤50（禁用语扣分当前 -15，需调至 -25~-30）
- **PERF 超阈值**：3 项性能测试超 P95 目标
- **CFG/API 回滚**：2 个端点回滚后返回 404

## 技术架构

```
                   ┌──────────────────────────┐
   对话记录 ──────▶│     Fusion Engine V2     │
                  │   S/R/M/B 四维评分融合    │────▶ 健康报告
                   └──────────┬───────────────┘
                              │
        ┌─────────────────────┼─────────────────────┐
        ▼                     ▼                     ▼
┌───────────────┐    ┌───────────────┐    ┌───────────────┐
│  S-评分器     │    │  R-评分器     │    │  M-评分器     │
│  (服务质量)   │    │  (风险检测)    │    │  (模型鲁棒性)  │
└───────────────┘    └───────────────┘    └───────────────┘
                              │
                     ┌────────┴────────┐
                     ▼                 ▼
              ┌───────────┐    ┌───────────┐
              │ B1-评分器  │    │ B2-评分器  │
              │ (产品意图) │    │ (行业精度) │
              └───────────┘    └───────────┘
```

### 行业适配器

- `logistics-zto` — 中通快递物流（22 个 product_intent 关键词，4 类合规检查）
- 可扩展 JSON 配置体系——新增行业只需添加 `config/industry/*.json`，无需改动代码

## 技术栈

| 层级 | 技术 |
|------|------|
| 运行时 | Node.js 22 (TypeScript) |
| API 框架 | Express.js |
| 存储 | JSON 文件（配置 + 测试数据） |
| 测试框架 | 自定义 Test Harness (tsx) |
| 包管理 | npm |

## 快速开始

```bash
# 1. 安装依赖
npm install

# 2. 编译
npm run build

# 3. 启动服务
npm start

# 4. 运行测试
npm test                           # 全量测试
node tests/_debug_l3.js            # 仅 L3 对抗测试（直连调试）
node tests/_run_l3.js              # 仅 L3 对抗测试（通过 API）
```

### API 端点

```
POST /api/v2/score
Content-Type: application/json

{
  "industry": "logistics-zto",
  "messages": [
    { "role": "user", "content": "我的快递到哪了？" },
    { "role": "assistant", "content": "帮您查一下，请稍等。" }
  ]
}
```

## 项目结构

```
fsi-v02-rd/
├── src/
│   ├── core/
│   │   ├── fusion-engine.ts       # 四维融合引擎
│   │   ├── industry-adapter.ts     # 行业配置加载 + B 维度聚合
│   │   └── scorers/
│   │       ├── s-scorer.ts         # 服务质量评分
│   │       ├── r-scorer.ts         # 风险检测评分
│   │       ├── m-scorer.ts         # 模型鲁棒性评分
│   │       ├── b1-scorer.ts        # 产品意图一致性（B1）
│   │       └── b2-scorer.ts        # 行业规范准确度（B2）
│   └── routes/
│       └── v2.ts                   # V2 API 端点
├── config/
│   └── industry/
│       └── logistics-zto.json      # 中通快递行业配置
├── tests/
│   ├── test-data/
│   │   └── l3-tests.json           # 20 条对抗测试用例
│   ├── _debug_l3.js                # 直连调试脚本（不经 API）
│   └── _run_l3.js                  # L3 API 测试运行器
├── reports/
│   └── AI自测报告_v1.6_第一轮.md    # 第一轮自测报告
├── bug-list.md                      # 缺陷跟踪（9 条已修复）
├── README.md                        # 本文件（中文）
├── README.en.md                     # 英文版
└── .gitignore
```

## 路线图

| 阶段 | 范围 | 状态 |
|------|------|------|
| V0.1 | 四维评分引擎、L1 冒烟测试 | ✅ 已完成 |
| V0.2 | L2 回归、L3 对抗、B1/B2 校准 | ✅ RC |
| V0.3 | B2 扣分调优、PERF 优化、API 回滚修复 | 🔜 规划中 |
| V1.0 | 多行业支持、仪表盘 UI、配置驱动行业 | 🔜 规划中 |

## 许可证

版权所有 © 照颖科技。保留所有权利。