现有问题:
- Pipeline与application下同时存在两份MEGA-Fold代码,代码冗余较大;Pipeline MEGA-Fold功能不完整,缺乏数据库检索,无法独立使用。
- 训练与推理代码不统一,训练代码基于for循环展开,编译速度慢;推理代码基于while控制流,导致训练生成的权重文件需转换,才能用于推理。
解决方案:建议合并Pipeline与application下的MEGA-Fold代码,提取蛋白质结构预测需要的数据库检索与结构弛豫作为独立模块提供,补全Pipeline端到端结构预测模型能力。