# 清问智答_基于KG的地铁清分失效诊断
**Repository Path**: weyumm/Qingwen-Zhida-A-Knowledge-Graph-Based-Metro-Clearing-Failure-Diagnosis-System
## Basic Information
- **Project Name**: 清问智答_基于KG的地铁清分失效诊断
- **Description**: 全国大学交通科技大赛作品(“清问智答”小队)
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 0
- **Created**: 2025-04-06
- **Last Updated**: 2025-04-06
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# “清问智答”——基于知识图谱的地铁清分失效诊断系统

# "QingwenZhida"——A Knowledge Graph Based Metro Clearing Failure Diagnosis System
全国大学生交通科技大赛作品(“清问智答”小组)
# 设计思路
## 1,双轨并行的推理检验架构

## 2,面向垂直领域的L2大模型
- L0通识大模型 是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”
- L1行业大模型 是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度,相当于AI成为“行业专家”
- **L2垂直大模型** 是指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效果,如该作品“清问智答”

# 视频演示
【最新一代模型】以下为演示视频
https://github.com/user-attachments/assets/f1773b8b-fb7e-4023-8c1a-37b20a1a6ff2
# 旧版本线上应用
【旧模型应用】可扫码试用


# 成果梗概
## 1,知识图谱

## 2,模型训练AUC、ROC曲线
在训练轮次达173次后,测试集数据交叉熵损失持续大于最低计算损失,早停机制触发停止训练;模型在训练集和验证集上都表现出了良好的收敛性和稳定性,最终训练损失和验证损失分别收敛于0.129、0.123;验证AUC在训练中期就一直保持在0.986,训练效果接近理想水平,表明模型具有较强的特征学习能力和泛化能力,能够有效地对数据进行拟合和预测,整体训练效果较为理想。

## 3,上海地铁案例研究
根据三元组数据中龙阳路具有换乘站、大站车车站、早高峰大客流等特点,滴水湖、11号线、10号线、东方体育中心等也都有类似特点,故作为预测组;6号线、7号线、华宁路、五莲路、国帆路等均不具有相关特征,故作为参照组。分别检验它们与失效致因之间的可能性大小:


# 大模型特色
## 1,LoRA技术


## 2,GraphRAG检索增强


## 3,Prompt交互工程
- Prompt由人类设计的,以帮助模型更好地理解特定任务或领域。
- 对于大语言模型,一个好的 Prompt 决定了其能力的上限与下限,且会塑造其输出文本的内容、风格和整体质量。
- 我们基于乔哈里视窗的概念,并且结合地铁清分工作人员的专有名词与惯用语,设计了Prompt模版,旨在准确地将信息与任务传达给大模型。


# 神经网络特色
## 1,基于文献驱动的数据集构建
使用VOSviewer工具,从237篇中文文献、262篇英文文献中,精炼核心关键词,并且根据其词频、热度、关联度等,形成【节点-边-节点】的网络结构,作为原始知识库,进行关键词消歧后,构造为数据集的一部分。

## 2,图卷积神经网络(R-GCN)
为了对城市轨道交通网络客流分布计算失效知识图谱进行推理,并开展链路预测任务。我们构建了构建关系图卷积神经网络(R-GCN)模型。
- 从知识图谱中,随机抽取90%的“实体-关系”上海地铁10号线的数据作为正样本,共计166条。
- 在编码器-解码器框架下,输入为知识图谱中由实体和关系构成的三元组。
- 其中,编码器模块是一个R-GCN模型,用于实现交叉熵的计算。

## 3,知识推理与知识类比的拓展方案
结果表明:
- 轨道交通10号线与轨道交通1号线、2号线、8号线、9号线及11号线都具有日均客流量大的特征。
- 当其他几条线路与留乘现象相关时,模型也能通过知识类比推理出10号线与留乘现象相关的可能性较高。
- 即10号线进站客流易出现留乘行为。相反,6号线与留乘现象相关的可能性较低。

# 双轨并行
借助两种人工智能学派的不同观点,分别以人工赋予智能(神经网络)、自主学习智能(大语言模型)的双轨并行架构,赋予【清问智答】既准确又灵活的输出结果。为赋能轨道交通领域智能化展现出一类创新的思路。

