# RNAGCN **Repository Path**: dcw-RNAGCN/rnagcn ## Basic Information - **Project Name**: RNAGCN - **Description**: RNAGCN : RNA Graph convolutional network. A deep learning model for RNA 3D structure assessment. - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2022-08-10 - **Last Updated**: 2022-10-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # RNAGCN #### 介绍 RNAGCN: RNA tertiary structure assessment with a graph convolutional network. RNAGCN 是一个用图卷积神经网络来评估RNA分子结构的深度学习算法 #### 软件架构 主要程序放在文件夹RNAGCN_SRC下 主要包含以下几个程序: 1. compute_index_files.py 计算PDB索引 2. GNN_NET.py 保存的GNN模型 3. Distributed_RUN.py 分布式训练GNN模型程序 4. test_GNN.py 利用训练好的模型进行测试或评分的程序 5. pro.cpp 核心计算程序,用来读取PDB和索引文件并计算成图 6. pro.so 和pro.exe 为pro.cpp的编译文件,非必须。程序运行时会自动将pro.cpp编译, #### 安装教程 程序由python和C++程序共同运行。运行在python 3.8+ 和 C++ 11下。C++ 11版本对应的GCC 7.0 以上编译器,确保系统中有GCC 较新版本的编译器。 程序依赖于图深度学习库Deep graph library 和深度学习库pytorch。除此之外,可能还会需要一些python第三方库,比如biopython库。当运行程序报错时可根据缺失文件自行下载安装相应库。安装后配置好环境变量,确认这些库可以正常调用。 1. Deep graph library 地址:https://www.dgl.ai/ 2. Pytorch https://pytorch.org/ 备注:DGL 需要Pytorch的支持,注意安装时两者版本的匹配(官网会提示)。 #### 使用说明 1.准备数据 1). PDB文件准备:请事先清除PDB文件中氢原子,非RNA原子。将同一个RNA的不同构象pdb文件这样命名,例如RNA 1a9b:1a9n.pdb, 1a9n_s1.pdb, 1a9n_s2.pdb ...。其中1a9n.pdb是native structure. 同时确保RNA名称为4位数(如1a9nx就不行)。 2). 使用compute_index_files.py 计算这些PDB文件的图索引文件。该程序会提前计算每个PDB文件中图的残基索引,和图的数据标签(即该局部结构与真实结构之间的RMSD差).不用担心诸如原子缺失,残基缺失,或是native pdb文件和decoy pdb文件没对齐等等问题。程序会检查缺失问题,并自动对齐文件。当然,确保PDB数据不缺失更好,例如可以用rnatools工具补全PDB文件。 ###联系方式 若有问题欢迎联系作者 Edelweiss16@163.com dcw