我可以在tensorflow中导出单词的嵌入矩阵吗?

问题描述 投票:1回答:1
def word_embedding(shape, dtype=tf.float32, name='word_embedding'):
  with tf.device('/cpu:0'), tf.variable_scope(name):
    return tf.get_variable('embedding', shape, dtype=dtype, initializer=tf.random_normal_initializer(stddev=0.1), trainable=True,partitioner=tf.fixed_size_partitioner(20))
embedding = word_embedding([vocab_size, embed_size])
inputs_embedding = tf.contrib.layers.embedding_lookup_unique(embedding, inputs)

这是我的代码,embedding是单词的变量,用于查找自己的嵌入向量。

我已经训练了嵌入矩阵,我想从保存的模型中提取它。该模型还包含其他参数,例如嵌入上面的神经网络。我可以实现它吗?

tensorflow neural-network nlp deep-learning word-embedding
1个回答
1
投票

请参阅my answer一个类似的问题。

最简单的方法是将嵌入矩阵计算为numpy数组,并将其与解析后的单词一起写入文件。

with tf.Session() as sess:
  embedding_val = sess.run(embedding)
  with open('embedding.txt', 'w') as file_:
    for i in range(vocabulary_size):
      embed = embedding_val[i, :]
      word = word_to_idx[i]
      file_.write('%s %s\n' % (word, ' '.join(map(str, embed))))

如果要仅为此图保存嵌入,可以创建tf.train.Saver并传递变量列表以进行保存:

saver = tf.train.Saver([embedding])
with tf.Session() as sess:
  saver.save(sess, 'path/to/checkpoint')
© www.soinside.com 2019 - 2024. All rights reserved.