4为lstm网络生成句子的问题

问题描述投票：-2回答：1

警告：我是一名深度学习菜鸟

我在笑话数据集（231657个笑话）上训练我的两层Lstm模型并想知道4件事：

如果我希望它能产生新的笑话我现在需要先输入50个字符，或者我可以随机拍摄一个字符来开始句子/笑话吗？
只用50个字符训练1.8 mio是没用的。总计（向量是[10800001,50,1]）还是那么好？
我使用了一个类，我启动了我的模型，所以我可以调用它，不幸的是如果我想创建一个长句/多个句子我不得不多次调用我的预测语句，问题是我的预测语句首先启动模型，然后预测值，所以我必须使用tf.reset_default_graph()，但过了一段时间，它需要更长的时间。那么我应该怎么做才能防止这个问题呢？我是否应该在主脚本或类似的东西中初始化模型？
如何解决增长文本的问题？我目前采用输入的形状并将其用于我班级的模型初始化，但这是一个好主意吗？

python-3.x

neural-network

lstm

tflearn

1个回答

0
投票

您需要从输入50个字符的种子序列开始。
我建议你增加序列长度。
我不太了解你，但我建议你正确地构建你的模型。阅读本文了解更多信息：https://danijar.com/structuring-your-tensorflow-models/
我再次建议你阅读上面的链接。

并不总是需要将您的模型作为一个类。您可以以程序方式创建模型一次，训练它然后使用tf.Saver（）保存它