# Hestia **Repository Path**: tyang816/hestia ## Basic Information - **Project Name**: Hestia - **Description**: Hestia:家庭女神,与实际应用相关。Zero-shot protein language model可以用于预测蛋白质的突变性质,这对于药物研发、生物工程等实际应用具有重要意义。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2023-04-02 - **Last Updated**: 2024-09-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Hestia ## Introduction Hestia:家庭女神,与实际应用相关。Zero-shot protein language model可以用于预测蛋白质的突变性质,这对于药物研发、生物工程等实际应用具有重要意义。 ## Baseline ### Non-MSA ESM、Tranception、Progen2、MIF-ST、ProTrans、RITA ### MSA DeepSequence、EVmutation、Tranception ## Example **请不要修改example中的文件并push**,如果要使用这些模板文件,请另行在heatia根目录新建script文件夹 ### example/score 该目录包括了所有baseline的打分样例脚本 如果您需要知道更多的您希望评测的模型信息与参数,**README文件请见各模型目录**,如src/ESM/README.md ### example/metric 包含spearmanr和topx两种打分方法 ## Quick Start 新建data文件夹 `mkdir data`,随后您可以将需要打分的蛋白fasta、pdb、a3m、a2m、DMS文件等放入您评估蛋白的文件夹中 如果您希望快速的评估一个蛋白质,我们建议您创建文件夹`data/protein-level/{your_protein}`,目录参考可以如下: ``` · |—— {your_protein} | |—— {your_protein}.fasta | |—— {your_protein}.csv/tsv | |—— {your_protein}.pdb | |—— ... ``` 如果您希望评估多个蛋白质组成的数据集,我们建议您创建文件夹`data/dataset-level/{your_dataset}`,目录参考可以如下,其中predictions文件夹中为预测结果,会以您评估的模型为后缀: ``` · |—— {your_dataset} | |—— {your_protein1} | | | |—— experiments | | | | |—— {your_protein1}.tsv | | | |—— predictions | | | | |—— {your_protein1}.{model_name}.tsv | | |—— {your_protein}.fasta | | |—— {your_protein}.pdb | | |—— {your_protein}.a3m | | |—— ... | |—— {your_protein2} | | |—— ... | |—— {your_protein3} ```