# Medical Fraud Guard

**Repository Path**: donglab-zzu/Medical-Fraud-Guard

## Basic Information

- **Project Name**: Medical Fraud Guard
- **Description**: 本项目为基于联邦图学习与大模型语义增强的医保欺诈智能检测预警系统，面向多医院跨机构隐私合规建模需求，通过联邦图神经网络实现多源医疗数据的隐私保护协同建模，结合大模型语义增强技术深度挖掘医保单据中的欺诈风险特征，精准识别骗保行为并实现智能预警。系统可有效提升医保基金监管效率，守护医保资金安全，为医疗大数据风控提供技术支撑。
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 5
- **Forks**: 4
- **Created**: 2026-04-03
- **Last Updated**: 2026-04-09

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 医疗智能欺诈检测系统
## 项目简介
基于联邦图学习和大模型语义增强的医疗保险欺诈检测系统，支持多医院数据隐私保护下的联合建模。

## 技术栈
- Python 3.8+
- PyTorch / PyTorch Geometric
- DGL (Deep Graph Library)
- XGBoost
- FastAPI
- Vue.js / Django
- Transformers (Hugging Face)

## 项目结构
```
├── feature_engineering/     # 特征工程模块
│   ├── data_loader.py       # 数据加载与预处理
│   ├── semantic_enhancement.py  # 语义特征增强
│   ├── semantic_enhancement_test.py  # 语义增强测试
│   ├── preprocess.py        # 数据预处理脚本
│   ├── XGBOOST.py          # XGBoost特征分析
│   ├── verify_complete.py   # 完整性验证
│   ├── verify_dataload.py   # 数据加载验证
│   └── ...
├── definition/              # 模型定义模块
│   ├── federated_graph.py   # 联邦图学习模型
│   ├── xgboost.py           # XGBoost分类模型
│   └── semantic_plots.py    # 语义特征可视化
├── building_code/           # 模型构建代码
│   ├── CNN.py              # CNN模型
│   ├── GNN.py              # GNN模型
│   ├── XGBall.py           # XGBoost完整实现
│   └── ...
├── data/                    # 数据集（敏感数据不上传）
│   └── README.md           # 数据文件夹说明
├── frontend/                # 可视化前端（Django）
│   ├── helloworld/         # Django主配置
│   ├── login/              # 登录模块
│   ├── ceshi/              # 数据展示模块
│   └── weblog2/            # 日志与监控模块
├── requirements.txt         # 依赖包列表
├── README.md               # 项目说明
└── 验证报告.md             # 验证报告
```

## 快速开始
### 1. 安装依赖

```bash
pip install -r requirements.txt
```

### 2. 配置环境变量
```bash
# Django SECRET_KEY
export SECRET_KEY='your-secret-key-here'

# 大模型API密钥（如使用语义增强API模式）
export API_KEY='your-api-key-here'
```
### 3. 准备数据
将脱敏后的医疗数据放入 `data/` 文件夹，格式参考 `data/README.md`。

### 4. 运行项目
```bash
# 运行前端（Django）
cd frontend
python manage.py runserver

# 运行特征工程模块
cd feature_engineering
python semantic_enhancement.py

# 运行模型构建
cd building_code
python predict.py
```
## 核心功能
### 1. 联邦图学习

- 多医疗机构本地训练图神经网络
- FedAvg联邦聚合算法保护数据隐私
- 支持GCN、GraphSAGE、GAT等多种图模型
### 2. 语义特征增强

- 基于大模型的10维语义特征提取
- 支持API调用和本地BERT模型
- 规则-based备选方案
### 3. 多模态特征融合

- 结构化特征 + 语义特征 + 图特征拼接
- XGBoost最终分类
### 4. 可视化前端

- Django实现的Web管理界面
- 实时数据监控与展示
- 欺诈检测结果可视化
## 安全与隐私

- **数据隐私**：联邦学习确保原始数据不出本地
- **敏感信息**：所有密钥通过环境变量管理
- **数据脱敏**：mydata文件夹仅存放脱敏示例数据
## 贡献指南

1. Fork 本仓库
2. 创建特性分支 (`git checkout -b feature/AmazingFeature`)
3. 提交更改 (`git commit -m 'Add some AmazingFeature'`)
4. 推送到分支 (`git push origin feature/AmazingFeature`)
5. 打开 Pull Request

## 许可证
本项目仅供学习和研究使用。

## 联系方式
如有问题或建议，欢迎提交 Issue 或联系项目维护者。

---

**注意**：本项目为医疗欺诈检测研究用途，实际部署需遵守相关法律法规。