# SIP-Project **Repository Path**: itwennet/sip-project ## Basic Information - **Project Name**: SIP-Project - **Description**: 南开大学计算机学院《语音信息处理技术》Final Project仓库 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2023-07-09 - **Last Updated**: 2023-07-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # SIP-Project #### 介绍 南开大学计算机学院《语音信息处理技术》Final Project仓库 #### 环境要求 - pytorch1.8.0,最好是GPU版本 - torchtext0.9.0 - 使用Spacy来分词,这里使用了三个模型: ```shell python -m spacy download en_core_web_sm python -m spacy download de_core_news_sm python -m spacy download zh_core_web_sm ``` #### 数据集 使用了Multi30k和WMT数据集来进行实验,WMT数据集中主要用到中文部分,我们手动对数据集进行了处理,将训练集大小裁剪,并且抽取出一部分测试集和验证集。 数据集下载地址:链接:https://pan.baidu.com/s/1DCeqgeOJyN4COv0QtyqKAw 提取码:e3u3 #### 环境配置 ```shell pip install torch==1.8.0 pip install torchtext==0.9 pip install spacy==3.0 pip install matplotlib pip install de_core_news_sm-3.0.0.tar.gz pip install en_core_web_sm-3.0.0.tar.gz ``` #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)