# Genome_survey **Repository Path**: zhao-huiyao/genome_survey ## Basic Information - **Project Name**: Genome_survey - **Description**: 分别用snakemake和makefile搭建基因组survey的分析流程 - **Primary Language**: Shell - **License**: Not specified - **Default Branch**: master - **Homepage**: https://gitee.com/zhao-huiyao/genome_survey/ - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 1 - **Created**: 2022-07-05 - **Last Updated**: 2024-06-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Genome_survey ### 介绍 分别用snakemake和makefile搭建基因组survey的分析流程 ### 架构 包括两个目录,snakemake和makefile。(两种流程的测试数据testdata一致) ### 准备 #### 1. 了解基因组survey分析流程以及需要执行的操作。这里我主要提供5个模块。 1.1 rawdata到cutadaptdata(软件cutadapt) 1.2 cutadaptdata到cleandata(软件fastp) 1.3 kmer分析(软件jellyfish和一个出图脚本kmerpdf.R) 1.4 依据kmer结果基因组大小和重复评估(软件GenomeScope) 1.5 初步组装和组装contig统计(软件SOAPdenovo2和一个统计脚本genome_statistics.py) #### 2. 以上所有软件都需要提前安装好,并测试可以正常使用。 cutadapt、jellyfish和GenomeScope是基于conda安装的,并生成各自的yaml文件(用于snakemake) ### snakemake #### 1. 安装并熟悉snakemake。 这里可以看[https://blog.csdn.net/weixin_44616693/article/details/125374148?spm=1001.2014.3001.5501](https://blog.csdn.net/weixin_44616693/article/details/125374148?spm=1001.2014.3001.5501) 和[https://blog.csdn.net/weixin_44616693/article/details/125462010?spm=1001.2014.3001.5501](https://blog.csdn.net/weixin_44616693/article/details/125462010?spm=1001.2014.3001.5501) #### 2. 下载snakemake目录下的所有目录及文件在自己的服务器目录下。 标准的目录格式 ``` —————————————————————— |——conda_yaml_files #保存需要的三个conda环境yaml文件 |——cutadapt.yaml #软件cutadapt |——GenomeScope.yaml #软件GenomeScope |——kmer.yaml #软件jellyfish |——scripts #保存脚本 |——genome_statistics.py #统计组装的基因组 |——kmerpdf.R #对kmer绘图 |——testdata |——test_L1_1.fq |——test_L1_2.fq |——test_L2_1.fq |——test_L2_2.fq |——testresults #保存结果文件(手动创建) |——config.yaml #snakemake的配置文件 |——snakemake.py #snakemake文件 |——soap_config.file #软件SOAPdenovo2需要的配置文件,仅针对测试数据,若其他数据则需要修改 —————————————————————— ``` 每一个文件都很简单,这里你需要对config.yaml进行修改。(包括软件fastp和soapdenovo2的目录) #### 3. 运行(保证上述所有要求已完成) ``` cd ~/snakemake/Genome_survey/ conda activate snakemake #首先你可以先出一个拓扑图和dry run snakemake -s snakemake.py --dag | dot -Tpdf > snakemake_dag.pdf snakemake -s snakemake.py -p -n #运行,~5min nohup snakemake -s snakemake.py -p -c 8 --use-conda 2>&1 & #结果可以在testresults目录下查看 —————————————————————— |——01cleandata #cleandata |——02kmer #kmer分析结果 |——Genomescope_21kmer_shuxi #依据kmer结果,软件Genomescope对基因组的评估结果 |——03assemble #基因组初步组装结果和统计结果,统计结果是length.txt和statistics.txt |——soap_config_file #修改后的软件SOAPdenovo2配置文件 ``` ### makefile #### 1. 安装并熟悉makefile。