代码拉取完成,页面将自动刷新
Sqldiag
├── data --测试数据集
├── src --源码文件
├── README.md --说明文档
└── main.py --程序入口
python 3.6+
sqlparse
sklearn
gensim
使用GUC参数 log_statement 与 log_statement_stats 即可开启日志收集,参数配置为:
参数开启后,可能占用一定的系统资源,但一般不大。持续的高并发场景可能产生5%以内的损耗,数据库并发较低的场景,性能损耗可忽略。开启参数后,会向数据库日志文件中记录具体的执行语句以及其开销。
提供历史日志以供模型训练:
训练数据格式为:
SQL语句执行耗时,SQL语句文本
说明:
- 列之间的分隔符为','
测试数据格式为:
SQL语句文本
进行训练与预测操作:
python main.py -m {train, predict} -f FILE
train: 训练模式。
predict: 预测模式
FILE: 文件路径
使用提供的训练数据进行训练:
python main.py -m train -f data/train.csv
使用提供的测试数据进行预测:
python main.py -m predict -f data/predict.csv
预测结果分析:
status: 预测状态
data:
time: sql执行时间
point: sql空间点坐标
cluster: sql类别id
background: 模板化模型总结
stmts: 对应类别的sql样例
center: 对应类别的sql的中心点坐标
points: 样例sql的空间点坐标
avg_time: 对应类别的平均执行时间
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。