# 机器学习-朝花夕拾-写文章-字符预测 **Repository Path**: feifei_dream/write_article ## Basic Information - **Project Name**: 机器学习-朝花夕拾-写文章-字符预测 - **Description**: 本篇将会以鲁迅的《朝花夕拾》的十篇散文 1.《从百草园到三味书屋》 2.《阿长与山海经》 3.《藤野先生》 4.《狗*猫*鼠》 5.《二十四孝图》 6.《五猖会》 7.《范爱农》 8.《琐记》 9.《无常》 10.《二十四孝图》 作为模型学习的内容,全文字符数量为33431,并将如上所示的十篇散文整理为十行保存进同一个文件之中,文件名定为wordstext。之后构建3隐层的LSTM的循环神经网络模型,通过将整段文字都看成一个个的序列。在模型的预设值中只关注连续的10个序列,这样在整段文字中,每次随意拿出10个连续的文字放入模型里进行训练,然后把第11个连续的值当成标签,与输出的预测值进行损失函数的计算,形成一个可训练的模型,然后通过优化器进行训练。训练之后的模型可以根据我们的输入再自动预测后面的文字。同时将预测出来的文字当成输入,再放入模型里,模型就会预测出下一个文字,这样循环下去,可以看到完成的一篇文章的输出。 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 0 - **Created**: 2018-08-22 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 机器学习-朝花夕拾-写文章-字符预测 #### 项目介绍 本篇将会以鲁迅的《朝花夕拾》的十篇散文 1.《从百草园到三味书屋》 2.《阿长与山海经》 3.《藤野先生》 4.《狗*猫*鼠》 5.《二十四孝图》 6.《五猖会》 7.《范爱农》 8.《琐记》 9.《无常》 10.《二十四孝图》 作为模型学习的内容,全文字符数量为33431,并将如上所示的十篇散文整理为十行保存进同一个文件之中,文件名定为wordstext。之后构建3隐层的LSTM的循环神经网络模型,通过将整段文字都看成一个个的序列。在模型的预设值中只关注连续的10个序列,这样在整段文字中,每次随意拿出10个连续的文字放入模型里进行训练,然后把第11个连续的值当成标签,与输出的预测值进行损失函数的计算,形成一个可训练的模型,然后通过优化器进行训练。训练之后的模型可以根据我们的输入再自动预测后面的文字。同时将预测出来的文字当成输入,再放入模型里,模型就会预测出下一个文字,这样循环下去,可以看到完成的一篇文章的输出。 可见博客:https://blog.csdn.net/qq_37972530/article/details/81944507