一个可扩展的,为生物信息学分析提供支持的命令行工具集合(当前仅支持 uniprotkb 网络药理学蛋白质转换基因名)。
软件架构说明
请确保你的计算机已经正确安装了 python
pip install biotools-cli
安装 python-Levenshtein 可以加速查找过程(可选)
pip install python-Levenshtein
根据你的需求下载 uniprotkb 数据库文件,一般我们选择 Swiss-Prot 和 Human,格式请选择 xml,如果你下载的是压缩文件,请将它解压。假设最终得到的文件为 uniprot_sprot_human.xml,并把它放置在 example 目录下。
从 uniprot_sprot_human.xml 中提取蛋白质名称以及对应的基因名称并保存到 tsv 格式的文本文件中。
biotools uniprotkb extract .\example\uniprot_sprot_human.xml .\example\uniprot_sprot_human.xml.tsv
如果 xml 文件不变化,extract 命令则仅需要执行一次。
准备蛋白质列表,protein.list,参考 .\example\protein.list
查找对应的基因名称并保存结果到 .\example\gene.list
biotools uniprotkb lookup .\example\uniprot_sprot_human.xml.tsv .\example\protein.list .\example\gene.list
使用 biotools 查找蛋白质在 UniprotKB 中对应的基因
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。