4为lstm网络生成句子的问题

问题描述 投票:-2回答:1

警告:我是一名深度学习菜鸟

我在笑话数据集(231657个笑话)上训练我的两层Lstm模型并想知道4件事:

  1. 如果我希望它能产生新的笑话我现在需要先输入50个字符,或者我可以随机拍摄一个字符来开始句子/笑话吗?
  2. 只用50个字符训练1.8 mio是没用的。总计(向量是[10800001,50,1])还是那么好?
  3. 我使用了一个类,我启动了我的模型,所以我可以调用它,不幸的是如果我想创建一个长句/多个句子我不得不多次调用我的预测语句,问题是我的预测语句首先启动模型,然后预测值,所以我必须使用tf.reset_default_graph(),但过了一段时间,它需要更长的时间。那么我应该怎么做才能防止这个问题呢?我是否应该在主脚本或类似的东西中初始化模型?
  4. 如何解决增长文本的问题?我目前采用输入的形状并将其用于我班级的模型初始化,但这是一个好主意吗?
python-3.x neural-network lstm tflearn
1个回答
0
投票
  1. 您需要从输入50个字符的种子序列开始。
  2. 我建议你增加序列长度。
  3. 我不太了解你,但我建议你正确地构建你的模型。阅读本文了解更多信息:https://danijar.com/structuring-your-tensorflow-models/
  4. 我再次建议你阅读上面的链接。

并不总是需要将您的模型作为一个类。您可以以程序方式创建模型一次,训练它然后使用tf.Saver()保存它

© www.soinside.com 2019 - 2024. All rights reserved.