# 机器学习-朝花夕拾-写文章-字符预测

**Repository Path**: feifei_dream/write_article

## Basic Information

- **Project Name**: 机器学习-朝花夕拾-写文章-字符预测
- **Description**: 本篇将会以鲁迅的《朝花夕拾》的十篇散文
1.《从百草园到三味书屋》
2.《阿长与山海经》
3.《藤野先生》
4.《狗*猫*鼠》
5.《二十四孝图》
6.《五猖会》
7.《范爱农》
8.《琐记》
9.《无常》
10.《二十四孝图》
作为模型学习的内容，全文字符数量为33431，并将如上所示的十篇散文整理为十行保存进同一个文件之中，文件名定为wordstext。之后构建3隐层的LSTM的循环神经网络模型，通过将整段文字都看成一个个的序列。在模型的预设值中只关注连续的10个序列，这样在整段文字中，每次随意拿出10个连续的文字放入模型里进行训练，然后把第11个连续的值当成标签，与输出的预测值进行损失函数的计算，形成一个可训练的模型，然后通过优化器进行训练。训练之后的模型可以根据我们的输入再自动预测后面的文字。同时将预测出来的文字当成输入，再放入模型里，模型就会预测出下一个文字，这样循环下去，可以看到完成的一篇文章的输出。
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 3
- **Forks**: 0
- **Created**: 2018-08-22
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 机器学习-朝花夕拾-写文章-字符预测

#### 项目介绍
本篇将会以鲁迅的《朝花夕拾》的十篇散文
1.《从百草园到三味书屋》
2.《阿长与山海经》
3.《藤野先生》
4.《狗*猫*鼠》
5.《二十四孝图》
6.《五猖会》
7.《范爱农》
8.《琐记》
9.《无常》
10.《二十四孝图》
作为模型学习的内容，全文字符数量为33431，并将如上所示的十篇散文整理为十行保存进同一个文件之中，文件名定为wordstext。之后构建3隐层的LSTM的循环神经网络模型，通过将整段文字都看成一个个的序列。在模型的预设值中只关注连续的10个序列，这样在整段文字中，每次随意拿出10个连续的文字放入模型里进行训练，然后把第11个连续的值当成标签，与输出的预测值进行损失函数的计算，形成一个可训练的模型，然后通过优化器进行训练。训练之后的模型可以根据我们的输入再自动预测后面的文字。同时将预测出来的文字当成输入，再放入模型里，模型就会预测出下一个文字，这样循环下去，可以看到完成的一篇文章的输出。

可见博客：https://blog.csdn.net/qq_37972530/article/details/81944507