# translate_EnZh_paddle **Repository Path**: zc2020/translate_EnZh_paddle ## Basic Information - **Project Name**: translate_EnZh_paddle - **Description**: paddlepaddle中英文机器翻译 调用函数已经变了,过时了 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 3 - **Created**: 2023-10-13 - **Last Updated**: 2023-10-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### paddlepaddle中英文机器翻译 (每句注释实现) BiGRU+Bahdanau attention+beam search的中英文机器翻译 > 意义:通过这个比官网更详细的机器翻译案例,能完整的窥视机器翻译的所有细节(官网 > 直接加载了数据(英德翻译数据),隐藏了数据细节,初学者很难真正通过官网案例学会并应用到英/汉翻译、文本摘要等应用) - 1.cmn.csv:简单的中英翻译数据,相当于从官网的英德翻译数据中脱离出来,用自己需求的数据进行训练 > 比如:换成中文-火星文就是火星文翻译器啦、换成文章-文章摘要就是文章摘要器啦、换成 > 换成文章-关键词就是关键词提取器啦、 - 2.实现把cmn.csv提取两个词汇-索引表,写入文件:en_vocabe.txt、zh_vocabe.txt - 3.data_generate.py:输入cmn.csv、en_vocabe.txt、zh_vocabe.txt,输出训练数据`data.csv`,中文分词部分仅用jieba实现 >data.csv: > > 英文单词ID序列;中文单词ID序列;中文单词一一对应的下一个单词ID序列 > > ` I love you `;` 我 爱 你`;`我 爱 你 ` > > `0 6694 8 4 1`;`0 10882 2750 93`;`10882 2750 93 1` - train_model.py模型训练、保存 - test_model.py模型加载、准备预测数据、进行预测、打印预测结果 --- 效果: ``` I'm so happy 中文: 我 很 高兴 。 我 很 抱歉 。 我 很 高興 。 我 很 高兴 , 但 我 感到 很 惊讶 。 ```