如何从skorch.NeuralNetClassifier.fit()传递参数以转发我的火炬nn.module的功能

问题描述 投票:1回答:1

我已经扩展了nn.Module来实现我的网络,其前向功能就像这样......

def forward(self, X, **kwargs):

    batch_size, seq_len = X.size()

    length = kwargs['length']
    embedded = self.embedding(X) # [batch_size, seq_len, embedding_dim]
    if self.use_padding:
        if length is None:
            raise AttributeError("Length must be a tensor when using padding")
        embedded = nn.utils.rnn.pack_padded_sequence(embedded, length, batch_first=True)
        #print("Size of Embedded packed", embedded[0].size())


    hidden, cell = self.init_hidden(batch_size)
    if self.rnn_unit == 'rnn':
        out, _ = self.rnn(embedded, hidden)
    elif self.rnn_unit == 'lstm':
        out, (hidden, cell) = self.rnn(embedded, (hidden, cell))


    # unpack if padding was used
    if self.use_padding:
        out, _ = nn.utils.rnn.pad_packed_sequence(out, batch_first = True)

我初次化了像这样的skorch NeuralNetClassifier

net = NeuralNetClassifier(
    model,
    criterion=nn.CrossEntropyLoss,
    optimizer=Adam, 
    max_epochs=8, 
    lr=0.01, 
    batch_size=32
)

现在如果我打电话给net.fit(X, y, length=X_len)它会抛出一个错误

TypeError: __call__() got an unexpected keyword argument 'length'

根据文档拟合函数期望一个fit_params字典,

**fit_params : dict
   Additional parameters passed to the ``forward`` method of
   the module and to the ``self.train_split`` call.

并且源代码总是将我的参数发送到train_split,显然我的关键字参数不会被识别。

有没有办法将参数传递给我的前向函数?

python scikit-learn neural-network pytorch skorch
1个回答
0
投票

fit_params参数用于传递与数据拆分和模型相关的信息,例如拆分组。

在您的情况下,您通过fit_params将其他数据传递给模块,这不是它的目的。事实上,如果您在列车数据加载器上启用批量洗牌,那么您可能很容易遇到麻烦,因为那时您的长度和数据未对齐。

最好的方法是在answer to your question on the issue tracker中描述的:

X_dict = {'X': X, 'length': X_len}
net.fit(X_dict, y)

由于skorch支持dicts,你可以简单地将长度添加到输入字典中,并将它传递给模块,很好地批处理并通过相同的数据加载器。在您的模块中,您可以通过forward中的参数访问它:

def forward(self, X, length):
     return ...

有关此行为的进一步文档可以在in the docs找到。

© www.soinside.com 2019 - 2024. All rights reserved.