diff --git a/MindSPONGE/docs/20210903-150528.png b/MindSPONGE/docs/20210903-150528.png new file mode 100644 index 0000000000000000000000000000000000000000..ec9a87053b1acf4c4a2f90afbab2ab82d7eddf73 Binary files /dev/null and b/MindSPONGE/docs/20210903-150528.png differ diff --git a/MindSPONGE/docs/20210903-150536.png b/MindSPONGE/docs/20210903-150536.png new file mode 100644 index 0000000000000000000000000000000000000000..3a8b4075397f1b9d5f62adf3f927dcd405eb567a Binary files /dev/null and b/MindSPONGE/docs/20210903-150536.png differ diff --git a/MindSPONGE/docs/20210903-150541.png b/MindSPONGE/docs/20210903-150541.png new file mode 100644 index 0000000000000000000000000000000000000000..e5546087b528e257344076ac268b60d3e8f34979 Binary files /dev/null and b/MindSPONGE/docs/20210903-150541.png differ diff --git a/MindSPONGE/docs/20210903-150546.png b/MindSPONGE/docs/20210903-150546.png new file mode 100644 index 0000000000000000000000000000000000000000..3bd7c8b3f3c15ce3c0014dfe2a40a280f7e62e8b Binary files /dev/null and b/MindSPONGE/docs/20210903-150546.png differ diff --git a/MindSPONGE/docs/20210903-150552.png b/MindSPONGE/docs/20210903-150552.png new file mode 100644 index 0000000000000000000000000000000000000000..4afee081f697d5bc71612babeba5b271eac662ec Binary files /dev/null and b/MindSPONGE/docs/20210903-150552.png differ diff --git a/MindSPONGE/docs/20210903-150615.png b/MindSPONGE/docs/20210903-150615.png new file mode 100644 index 0000000000000000000000000000000000000000..e87749a480edfcb683c69a031e3626c26a028a31 Binary files /dev/null and b/MindSPONGE/docs/20210903-150615.png differ diff --git a/MindSPONGE/docs/20210903-150619.png b/MindSPONGE/docs/20210903-150619.png new file mode 100644 index 0000000000000000000000000000000000000000..3d40bb87c393518f792904a2029d5c5e20c8ce45 Binary files /dev/null and b/MindSPONGE/docs/20210903-150619.png differ diff --git a/MindSPONGE/docs/20210903-150623.png b/MindSPONGE/docs/20210903-150623.png new file mode 100644 index 0000000000000000000000000000000000000000..11bbe140caa068af120721581ae275bc84222759 Binary files /dev/null and b/MindSPONGE/docs/20210903-150623.png differ diff --git a/MindSPONGE/docs/20210903-150630.gif b/MindSPONGE/docs/20210903-150630.gif new file mode 100644 index 0000000000000000000000000000000000000000..fc1c7807133e7aab7570454708f07634146d7936 Binary files /dev/null and b/MindSPONGE/docs/20210903-150630.gif differ diff --git a/MindSPONGE/protein_msa/README_CN.md b/MindSPONGE/protein_msa/README_CN.md index 60b63f0f92e84fe699e44b6cb2247ec3236d0e53..a6878b7ce845c61f210a7ba993f1fb86e5deba34 100644 --- a/MindSPONGE/protein_msa/README_CN.md +++ b/MindSPONGE/protein_msa/README_CN.md @@ -20,9 +20,47 @@ 从科学应用的角度看,MSA的数量和质量很大程度上影响了目前最先进的结构模型的预测速度和精度,而且产生MSA的非参数化算法仍是诸多蛋白预测方法中主要决速步之一。因此,Protein MSA数据库本身可以作为这些结构模型的预训练材料,用来挖掘序列信息甚至快速生成新的序列特征,这对解决研究、设计蛋白质中所面临的高变异序列和孤儿序列等问题具有巨大的潜在价值。为了便于AI领域的研究人员直接使用,Protein MSA原始数据还会被转化为浮点数类型压缩存储,并对已有的AI框架如MindSpore上提供数据接口的支持。我们鼓励并期待来自生物信息学、数据科学和自然语言处理等AI研究领域的专家和人才充分碰撞与合作,引入、改进或设计全新的AI模型,来充分地挖掘Protein MSA数据集中所隐藏的“大自然的秘密”。 -## 使用与下载方法 +## 数据集下载方法 - ToDo: +### 准备华为云账号并登录 + +- 注册华为云中国站账号后,登录华为云控制台(https://auth.huaweicloud.com),如下图所示,进入“我的凭证” +- 如果你已经有华为云账号, 可直接访问 (https://console.huaweicloud.com)登录华为云控制台 + +![1614828766362](../docs/20210903-150528.png) + +### 使用客户端软件下载数据集 + +#### 安装数据上传客户端软件 + +当前华为云OBS对象存储服务,提供了2款客户端软件:含视窗操作界面的[OBS Browser+](https://support.huaweicloud.com/browsertg-obs/obs_03_1003.html), 命令行工具客户端 [obsutil](https://support.huaweicloud.com/utiltg-obs/obs_11_0001.html) 。请查看两款软件支撑的操作系统场景,自行选择。 + +#### 准备工作,获取账号ak/sk + +在“我的凭证”页面,如下图所示,进入访问密钥的页签,可以创建生成ak/sk访问密钥,创建成功后,保存到本地(CSV文件),后续需要用到。 + +![1630458105506](../docs/20210903-150546.png) + +#### 使用OBS Browser+客户端软件进行数据集的下载 + +##### 登录 + +打开OBS Browser+, 将事先准备好的 ak(即Access Key ID)、sk(Secret Access Key)(保存的CSV文件中) , 按照下图填写,账号名仅用于区分您在本地登录OBS +Browser+的不同账号,与注册的云服务账号无关,也无需一致。 + +![1630458616553](../docs/20210903-150541.png) + +##### 挂载外部桶 + +如下图所示,输入桶名: cnnorth4-modelhub-datasets-obsfs-d1opw 进行挂载 + +![1630458721218](../docs/20210903-150552.png) + +##### 下载数据集 + +如下图所示,进入到MSA_Uniref50文件夹,并选中需要下载的数据集文件夹,进行下载 + +![1630459406400](../docs/20210903-150630.gif) ## 许可与引用 @@ -30,4 +68,52 @@ ## 维护、更新与社区贡献方式 - ToDo: +### 如何贡献数据集 + +#### 使用客户端进行数据集上传 + +按照下载数据集的方法进行客户端的安装获取,进入登录页面后可以直接选择本地数据集进行上传操作 +注意点: + +- 对象权限: 需要选择 “桶拥有者完全控制” +- 存储类别: 选择“标准存储” + +![1630459406400](../docs/20210903-150623.png) + +#### 使用obsutil命令行工具进行数据集的上传 + +安装详情可参考:https://support.huaweicloud.com/utiltg-obs/obs_11_0003.html + +下面以linux操作系统为例,进行配置: + +##### 安装 + +打开命令行工具,cd 到你的安装目录,依次执行如下四个命令: + +```shell +wget https://obs-community.obs.cn-north-1.myhuaweicloud.com/obsutil/current/obsutil_linux_amd64.tar.gz + +tar -xzvf obsutil_linux_amd64.tar.gz + +cd obsutil_linux_amd64_* + +chmod 755 obsutil +``` + +执行成功后,如下图所示: + +![1630473600777](../docs/20210903-150615.png) + +##### 初始化配置 + +执行如下命令, 其中ak, sk是你在之前步骤中已经准备好的账号鉴权信息。 endpoint固定为:https://obs.cn-north-4.myhuaweicloud.com + +```shell +./obsutil config -i=ak -k=sk -e=endpoint +``` + +执行成功后,如下图所示: + +![1630473997617](../docs/20210903-150619.png) + + ToDo: \ No newline at end of file