pytorch 相关问题

PyTorch是一个深度学习框架,它实现了一个动态计算图,它允许您改变神经网络在运行中的行为方式,并能够执行向后自动区分。

使用 self_attn.in_proj_weight 从 PyTorch 获取查询、键和值矩阵

我们已经根据这里的教程实现了一个变压器。 我们需要访问查询、键和值矩阵的权重,并计划使用 model.state_dict() 来完成此操作。然而...

回答 2 投票 0

收到警告:您可能应该在下游任务上训练此模型,以便能够将其用于预测和推理。加载微调模型时

在从检查点目录的最后一层加载带有前向神经网络的 Bert 微调模型时,我收到此消息。 如果您正在初始化,这是预期的

回答 1 投票 0

如何使用 PyTorch 变换对输入/输出图像对应用相同的变换?

我想通过 PyTorch 构建一个深度学习模型来进行一些图像增强。模型的输入和输出是相同大小的图像。 我想使用 PyTorch 的 torchvision.transforms 库

回答 1 投票 0

为什么 next(iter(train_dataloader)) 在 PyTorch 中执行时间较长

我正在尝试使用以下代码加载包含图像的本地数据集(总共约 225 张图像): # 设置批量大小 批次大小 = 32 # 创建数据加载器 训练数据加载器,测试数据加载器,

回答 1 投票 0

Python `__getattr__` + `torch.nn.Module` 产生无限递归

我编写了一个简单的包装器来向给定的 PyTorch 神经网络添加特殊方法。 虽然下面的实现对于字符串、列表等一般对象效果很好。当

回答 1 投票 0

从多个维度的张量中收集不同的元素索引

假设我得到以下张量: arr = torch.randint(0, 9, (100, 50, 3)) 我想要实现的是收集,例如,该张量的 2 个元素,让我们从收集第 6 个和第 56t 个元素开始......

回答 1 投票 0

我正在 Atari 上实施 DQN。我有一些与形状相关的问题

如果您可以从头开始制作 atari 基本 dqn(包装器除外),请分享该文件。 我随机收到 2 个错误 ValueError:使用序列设置数组元素。所要求的...

回答 1 投票 0

运行时错误:视图大小与输入张量的大小和步幅不兼容(至少一维跨越两个连续的子空间)

我正在使用 Pytorch。我在评估模型时遇到了这个运行时错误。知道如何解决这个问题吗?

回答 3 投票 0

pytorch 用另一个多维张量索引多维张量

在pytorch中,我有一个形状为[b, m, n]的张量A和另一个形状为[b, k]的张量B。我想用 B 索引 A。所以结果张量应该具有形状 [b, k, n]。 我尝试做一些搜索...

回答 1 投票 0

有没有办法可以在 Azure 部署上安装 pip 库中没有的 pytorch 版本?

我有一个一度使用 pytorch 的 Flask 应用程序。 但是,由于 pytorch 版本只能从 URL 进行 pip 安装,因此我似乎无法成功部署此版本

回答 1 投票 0

实现黎曼梯度的正确方法是什么?

所以这是本文中的一个玩具示例,低秩矩阵和张量训练流形上黎曼优化的自动微分: 进口火炬 将 torch.nn 导入为 nn 定义 f(X): 返回...

回答 1 投票 0

我应该如何提高它的速度?强化学习 DQN

我是Python新手,这是我的第一个DQN NN网络。我使用健身房环境,代理学习采取最佳行动,从而在交易时获得最大利润。 我的代码使用 cpu 和大约

回答 1 投票 0

在 Pytorch 中单独计算每个类的梯度的有效方法

我正在尝试分别计算 Pytorch 图像分类器模型相对于每个类的梯度,例如 输出 = net(输入)[0] # 假设我们只考虑...的第一个样本

回答 1 投票 0

dtype uint8 的张量可以用于损失函数吗?稍后将调用 '.backward()'?

我尝试计算 dtype float32 的张量和另一个 dtype uint8 的张量之间的损失。 由于损失函数执行自动类型提升,因此我没有明确进行类型转换...

回答 1 投票 0

第一个纪元完成后模型精度跃升至 1.0000

正如我在开始训练模型时在标题中所说的那样。在第一个 epoch 完成后,它的准确率直接跃升至 1,并且模型损失停留在 2 点左右。 我正在使用文本检索模型,但是......

回答 1 投票 0

如何在 PyTorch 中打印模型摘要?

如何在 PyTorch 中打印模型的摘要,就像 model.summary() 在 Keras 中所做的那样: 型号概要:

回答 11 投票 0

model.train() 在 PyTorch 中做什么?

它会调用nn.Module中的forward()吗?我认为当我们调用模型时,正在使用前向方法。 为什么我们需要指定train()?

回答 6 投票 0

PyTorch 中的 .flatten() 和 .view(-1) 有什么区别?

.flatten() 和 .view(-1) 都可以在 PyTorch 中压平张量。有什么不同? .flatten() 是否复制张量的数据? .view(-1) 更快吗? 有没有什么情况 .flatten() 不...

回答 3 投票 0

Pytorch 中的“unsqueeze”有什么作用?

PyTorch 文档说: 返回一个新的张量,其尺寸为 1 插入到指定位置。 [...] >>> x = torch.tensor([1, 2, 3, 4]) >>> 火炬.松开...

回答 5 投票 0

如何在linux下安装pip install torch==2.1.2+cu118?

我看到有些人可以安装 pip install torch==2.1.2+cu118 例如: https://github.com/stanfordnlp/dspy/discussions/818 aiohttp==3.9.3 aioprometheus==23.12.0 aiosignal==1.3.1 蒸馏器==1.13.1 注释...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.