# AI客服FSHI质检系统 **Repository Path**: full-spectrum/FSHI ## Basic Information - **Project Name**: AI客服FSHI质检系统 - **Description**: FSHI 全频谱健康指数平台|企业 AI 治理免疫系统,从 “事后质检” 到 “事前预测”,让每一个 AI 都安全、可控、可量化回报。基于全频谱认知架构与 S/R/M/B 四维健康模型,实现对 AI 客服、销售、运营、风控等系统的零侵入、全链路、可量化治理,实时发现风险、精准定位根因、一键启动治理战役、自动计算 ROI,让 AI 从 “不可控成本” 变为 “可量化资产”。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-06-02 - **Last Updated**: 2026-06-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # FSHI — 全频谱健康指数 AI 治理平台 > **V0.2** | 2026-06-02 | 企业 AI 治理免疫系统 ## 概述 FSHI(全频谱健康指数平台)是零侵入、全链路、可量化的 AI 治理平台。基于全频谱认知架构与 **S/R/M/B 四维健康模型**,实现实时风险发现、精准根因定位、一键治理战役启动、自动 ROI 计算——让 AI 从"不可控成本"变为"可量化资产"。 ### 四维评分引擎(S/R/M/B) | 维度 | 简写 | 说明 | |------|------|------| | **服务质量** | S | 礼貌度、共情力、语气一致性 | | **风险检测** | R | 合规违规检测、P1/P2 禁用语 | | **模型鲁棒性** | M | 防幻觉、上下文保持 | | **业务准确度** | B | B1 产品意图一致性 + B2 行业规范准确度 | ## 当前版本 — V0.2 RC ### 测试覆盖 | 测试集 | 通过/总数 | 通过率 | 判定 | |--------|:--------:|:------:|:----:| | L1 冒烟测试 | 5/5 | 100% | ✅ | | L2 回归测试 | 100/100 | 100% | ✅ | | L3 对抗测试(人工) | 18/20 | 90% | ✅ | | TS-B1/B2(业务维度) | 56/60 | 93% | ✅ | | TS-CFSM/CFG/INT/API | 72/80 | 90% | ✅ | | TS-PERF(性能) | 7/10 | 70% | ❌ | | **合计** | **257/275** | **93%** | — | ### 已修复缺陷(DEFECT-001 ~ DEFECT-009) - **DEFECT-004**:B1 零命中回复新增"服务近邻"识别(物流语境 14 个模式),给 60 分楼层(原为 0) - **DEFECT-005**:B2 required_words 策略从逐项扣分改为 all-or-nothing(命中 ≥1 词不扣分) - **DEFECT-008**:API v2 管道修复——user-only 轮次不再拉低 B 维度平均分 - **DEFECT-001~003, 006, 007, 009**:禁用语检测、冷链场景、操作指引、关键词扩展等校准修复 全部 9 条缺陷已修复,详见 `bug-list.md`。 ### 剩余问题 - **B2 扣分力度**:MANUAL-01/06 得分 65-66,应 ≤50(禁用语扣分当前 -15,需调至 -25~-30) - **PERF 超阈值**:3 项性能测试超 P95 目标 - **CFG/API 回滚**:2 个端点回滚后返回 404 ## 技术架构 ``` ┌──────────────────────────┐ 对话记录 ──────▶│ Fusion Engine V2 │ │ S/R/M/B 四维评分融合 │────▶ 健康报告 └──────────┬───────────────┘ │ ┌─────────────────────┼─────────────────────┐ ▼ ▼ ▼ ┌───────────────┐ ┌───────────────┐ ┌───────────────┐ │ S-评分器 │ │ R-评分器 │ │ M-评分器 │ │ (服务质量) │ │ (风险检测) │ │ (模型鲁棒性) │ └───────────────┘ └───────────────┘ └───────────────┘ │ ┌────────┴────────┐ ▼ ▼ ┌───────────┐ ┌───────────┐ │ B1-评分器 │ │ B2-评分器 │ │ (产品意图) │ │ (行业精度) │ └───────────┘ └───────────┘ ``` ### 行业适配器 - `logistics-zto` — 中通快递物流(22 个 product_intent 关键词,4 类合规检查) - 可扩展 JSON 配置体系——新增行业只需添加 `config/industry/*.json`,无需改动代码 ## 技术栈 | 层级 | 技术 | |------|------| | 运行时 | Node.js 22 (TypeScript) | | API 框架 | Express.js | | 存储 | JSON 文件(配置 + 测试数据) | | 测试框架 | 自定义 Test Harness (tsx) | | 包管理 | npm | ## 快速开始 ```bash # 1. 安装依赖 npm install # 2. 编译 npm run build # 3. 启动服务 npm start # 4. 运行测试 npm test # 全量测试 node tests/_debug_l3.js # 仅 L3 对抗测试(直连调试) node tests/_run_l3.js # 仅 L3 对抗测试(通过 API) ``` ### API 端点 ``` POST /api/v2/score Content-Type: application/json { "industry": "logistics-zto", "messages": [ { "role": "user", "content": "我的快递到哪了?" }, { "role": "assistant", "content": "帮您查一下,请稍等。" } ] } ``` ## 项目结构 ``` fsi-v02-rd/ ├── src/ │ ├── core/ │ │ ├── fusion-engine.ts # 四维融合引擎 │ │ ├── industry-adapter.ts # 行业配置加载 + B 维度聚合 │ │ └── scorers/ │ │ ├── s-scorer.ts # 服务质量评分 │ │ ├── r-scorer.ts # 风险检测评分 │ │ ├── m-scorer.ts # 模型鲁棒性评分 │ │ ├── b1-scorer.ts # 产品意图一致性(B1) │ │ └── b2-scorer.ts # 行业规范准确度(B2) │ └── routes/ │ └── v2.ts # V2 API 端点 ├── config/ │ └── industry/ │ └── logistics-zto.json # 中通快递行业配置 ├── tests/ │ ├── test-data/ │ │ └── l3-tests.json # 20 条对抗测试用例 │ ├── _debug_l3.js # 直连调试脚本(不经 API) │ └── _run_l3.js # L3 API 测试运行器 ├── reports/ │ └── AI自测报告_v1.6_第一轮.md # 第一轮自测报告 ├── bug-list.md # 缺陷跟踪(9 条已修复) ├── README.md # 本文件(中文) ├── README.en.md # 英文版 └── .gitignore ``` ## 路线图 | 阶段 | 范围 | 状态 | |------|------|------| | V0.1 | 四维评分引擎、L1 冒烟测试 | ✅ 已完成 | | V0.2 | L2 回归、L3 对抗、B1/B2 校准 | ✅ RC | | V0.3 | B2 扣分调优、PERF 优化、API 回滚修复 | 🔜 规划中 | | V1.0 | 多行业支持、仪表盘 UI、配置驱动行业 | 🔜 规划中 | ## 许可证 版权所有 © 照颖科技。保留所有权利。