# MCXiaoChuo
**Repository Path**: chuochuo/MCXiaoChuo
## Basic Information
- **Project Name**: MCXiaoChuo
- **Description**: 自动写诗机器人!
- **Primary Language**: Python
- **License**: GPL-3.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 4
- **Forks**: 1
- **Created**: 2019-09-04
- **Last Updated**: 2021-07-26
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# Chinese_poem_generator
[](https://travis-ci.org/hjptriplebee/Chinese_poem_generator)
[](https://codecov.io/gh/hjptriplebee/Chinese_poem_generator)
[](https://github.com/hjptriplebee/Chinese_poem_generator/blob/master/LICENSE)
唐诗宋词生成器,MC胖虎,使用LSTM完成,先看几个demo:
一首藏头诗刀山火海送给大家!
胖虎学诗,会对偶,用典故,能作出边塞、田园、离别等多种风格的诗!
## 依赖
- Python3
- tensorflow1.2+
## 用法
- "python3 main.py -m {train, test, head}" train训练, test随机写诗, head藏头诗.
- 在对深度学习有一定了解的基础上,可尝试使用evalute.py评估自己训练的模型。
## 最近一次更新(2018-06-11)
- add coverage
## 常见问题
**Q: 默认写唐诗,如何使胖虎写宋词,歌曲等其他东西?**
A: 因为仓库不宜过大,所以只放了词的训练数据而没有放训练好的模型。config.py中默认的type是poetrySong,因而训练数据用的是“./dataset/poetrySong/poetrySong.txt",加载的checkpoint是”./checkpoints/poetrySong/checkpoint“,如想使用其他训练数据,修改config.py,比如:type = songci,然后训练至少10个epoch。
**Q: 如何训练自己的数据?**
A: 目前的训练数据来源于[https://github.com/chinese-poetry/chinese-poetry](https://github.com/chinese-poetry/chinese-poetry),我已经将json转换成txt,训练数据格式如下,可以将自己的数据做成这种形式训练模型。将数据按照同样的形式放入dataset下自己新建的目录,修改config.py中的type即可训练。
```json
标题::作者::内容
静夜思::李白::床前看月光,疑是地上霜。举头望山月,低头思故乡。
```
## 接下来要做
- 尝试采用双向lstm模型
- 数据预处理步骤需要加强,比如:特殊符号。
- 看图写诗,苦于没有数据集。
- 引入平仄等信息,使网络更容易拟合宋不规整的数据。
- tensorboard
- 写一篇关于整个项目的博文
有时候效果不好,多生成几次一定有比较好的结果。现在看起来有点像人工智障,但是相信胖虎会越来越厉害!
**方法比较粗暴,欢迎各位大佬提出建设性意见!**
**详细的项目实现和代码说明请看[这里](http://blog.csdn.net/accepthjp/article/details/73875108)**
