# biobee-analysis **Repository Path**: bee19940901/analysis ## Basic Information - **Project Name**: biobee-analysis - **Description**: BioBee生信云分析工具 - **Primary Language**: R - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-03 - **Last Updated**: 2026-04-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # BioBee Analysis 生物信息学分析模块,包含各类生信分析工具的 R 脚本和示例数据。 ## 目录结构 ``` analysis/ ├── MedTool/ │ └── PanCancer/ │ ├── PanCancer.R # 泛癌分析主脚本 │ ├── example.json # 示例配置文件 │ └── example.zip # 示例结果图片 ├── README.md # 本文档 ├── README.en.md # 英文文档 └── .gitignore # Git 忽略规则 ``` ## MedTool 模块 ### PanCancer(泛癌分析) 泛癌分析工具,用于分析基因在多个癌症数据集中的表达情况。 #### 功能 - 支持多个数据源:GTEx、TCGA、TCGA+GTEx、CCLE - 数据预处理:Log 转换、加 1 处理等 - 统计分析:t-test、wilcox.test、anova - P 值校正:holm、bonferroni、BH、fdr - 多种图表类型:箱线图、小提琴图、散点箱线图等 - 显著性标记:自动添加统计显著性标记 #### 使用方法 ```bash # 运行分析 Rscript PanCancer.R -c config.json # 配置文件字段说明 { "projectId": "", # 项目 ID "taskName": "泛癌分析任务", # 任务名称 "dataSource": ["GTEx", "TCGA"], # 数据源 "geneList": "TP53,BRCA1", # 基因列表(逗号分隔) "pAdjust": "fdr", # P 值校正方法 "useLog": true, # 是否使用 Log 转换 "logBase": true, # 是否使用自定义对数底数 "showSig": true, # 是否显示显著性标记 "sigPos": 11.0, # 显著性标记 Y 轴位置 "statMethod": "t.test", # 统计方法 "pWidth": 8, # 图片宽度 "pHeight": 6, # 图片高度 "pDpi": 300, # 图片 DPI "pTheme": "bw" # 主题 } ``` #### 输入文件 在 `inputDir` 目录下准备以下数据文件: - `gtex_data.RData` - GTEx 数据(包含 `gtex_mrna_pheno`) - `tcga_data.RData` - TCGA 数据(包含 `tcga_mrna_clin`) - `tcga_gtex_data.RData` - TCGA+GTEx 数据(包含 `tcga_gtex_mrna_pheno`) - `ccle_exp.tsv` - CCLE 表达矩阵 - `ccle_clin.tsv` - CCLE 临床信息 #### 输出文件 生成的图片保存在 `outputDir` 目录: - `{基因名}_GTEx.pdf/png` - GTEx 分析图 - `{基因名}_TCGA.pdf/png` - TCGA 分析图 - `{基因名}_TCGA_GTEx.pdf/png` - TCGA+GTEx 分析图 - `{基因名}_CCLE.pdf/png` - CCLE 分析图 ## 开发指南 ### 添加新分析模块 1. 在 `MedTool/` 下创建新目录 2. 编写 R 分析脚本 3. 提供 `example.json` 配置示例 4. 添加 `example.zip` 示例结果 5. 更新本 README ### R 脚本规范 - 使用 `optparse` 包处理命令行参数 - 配置文件使用 `jsonlite` 包读取 - 输出目录不存在时自动创建 - 错误处理和日志记录 - 支持严格字段验证 ## 许可证 MIT License