deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

为什么加载 AutoTokenizer 需要这么多 RAM?

我正在测量我的脚本使用的 RAM,令我惊讶的是它需要大约 300Mb 的 RAM,而分词器文件本身大约为 9MB。这是为什么? 我试过: 从变压器导入

回答 1 投票 0

微调 segformer mit-b0 时 CUDA 内存不足

我正在尝试在卫星图像上微调 mit-b0 分割模型,以在具有 8 GB VRAM 的 RTX 2070 上分割稻田,但在第一个纪元开始时我发现 CUDA 内存不足。我相信我

回答 1 投票 0

如何提高CNN模型字符识别的准确率? (EMNIST 数据)

这是我的第一个 CNN 模型,旨在识别英语字母,并在 EMNIST 数据集上进行训练。 有人可以向我解释如何实现数据增强和正则化吗?或者

回答 1 投票 0

关于使用1*1卷积的技巧

阅读了以下关于使用1*1卷积的说明,它可以帮助连接不同维度的输入和输出: 例如,将激活维度 (HxW) 减少一个因子...

回答 2 投票 0

我们可以在多个时间序列数据上创建一个单一模型来捕获传感器的开/关状态吗?

我有 5 个输入列和 1 个输出列 输入列:时间、状态、功率、转速、温度 输出栏:输出 时间以秒为单位。 state 可以是 0 或 1,表示开/关。 功率、转速、温度值...

回答 1 投票 0

用于多标签分类的CLIP

我正在使用 CLIP 来确定单词和图像之间的相似度。 现在我正在使用这个存储库和以下代码,对于分类它给出了很好的结果。我需要它来进行多...

回答 2 投票 0

OpenLLAMA 3B V2 模型上的 DPO 训练问题:推理期间响应“抱歉,我无法回答该问题”

说明: 我目前正在开展一个项目,涉及使用 Hugging Face 的 TRL 库进行直接偏好优化 (DPO) 训练。目标是协调 OpenLLAMA 3B 的响应...

回答 1 投票 0

尝试找出为什么对于具有 i/p 和 o/p 相同 ECG 数据的 DL 模型,准确性几乎稳定,并且损失减少

我试图实现一个正常的全连接深度学习模型,它接收 ECG 传感器值并输出相同的值,但这种情况只有在正常数据下才能正确发生。当心电图值异常时

回答 1 投票 0

TensorFlow Keras 模型中的自定义 train_step() 不按顺序打印值

类 model_sub(tf.keras.Model): def __init__(self,modell): 超级().__init__() self.model=modell 自我.i = 1 def 编译(自我,opt,lloss,**kwargs): super().compile(**kwargs) 自我。

回答 1 投票 0

在pytorch中,如何使用F.cross_entropy()中的权重参数?

我正在尝试编写如下代码: x = 变量(torch.Tensor([[1.0,2.0,3.0]])) y = 变量(torch.LongTensor([1])) w = torch.Tensor([1.0,1.0,1.0]) F.cross_entropy(x,y,w) w = torch.Tensor([1...

回答 3 投票 0

预测准确度较低,即 52%,而训练期间的训练和验证准确度约为 92%

我正在使用预训练的 VGG19 来训练模型。在训练时,我的准确率约为 92%(训练和验证)。 vgg19 = VGG19(input_shape=IMAGE_SIZE, 权重='imagenet', 包括...

回答 3 投票 0

在keras、tensorflow中连接两层

我想构建以下神经网络层架构 我有一个 cnn 层: cnn1 = keras.Sequential([ 层.输入((32,32,3)), 层.Conv2D(32, (5, 5), 激活='relu') ] ...

回答 1 投票 0

从头开始实现dropout

此代码尝试利用 dropout 的自定义实现: %重置-f 进口火炬 将 torch.nn 导入为 nn # 导入火炬视觉 # 导入 torchvision.transforms 作为变换 进口火炬 我...

回答 2 投票 0

在与我之前训练的数据集不同的数据集上训练 yolov8 变得非常慢

我正在尝试在与我之前训练过的数据集不同的数据集上训练yolov8。尽管这是一个较小的数据集,但即使 1 个 epoch 也需要极长的时间才能完成。还有人吗

回答 1 投票 0

使用bert模型的google colab内存问题

问题: 我尝试在一篇论文中使用 bert 模型,用 NPL 模型对我的序列进行编码,但这需要花费很多时间,并且在终止他的 1 epoch 之前,他摆脱了连接问题,当我在...

回答 1 投票 0

如何在多个图像上运行 cv::dnn::blobFromImages 并解释它

我需要在 C++ 中的多个图像上运行 cv::dnn::blobFromImages 来检测对象,比 cv::dnn::blobFromImage 的一张图像更快。但正如你所知,blob 是一个 Mat 文件,所以我怎么能改变...

回答 1 投票 0

UNET预测

我使用unet进行图像分割我的问题是下面的代码是什么意思 test_img_norm=test_img[:,:,0][:,:,无] 和 Prediction_other = (model.predict(test_img_other_input)[0,:,:,0] > 0.2).a...

回答 2 投票 0

如何在暗网中预测多图像txt?

在 Yolov7 中,我使用以下代码来测试整个文件夹图像: python test.py --save-txt --data data/coco.yaml --save-conf --conf 0.1 --weights yolov7_20240316best.pt --task test --name 0316conf01 现在我...

回答 1 投票 0

使用 PyTorch 高级库执行 MAML 时何时应该调用 .eval() 和 .train()?

我正在查看omniglot maml示例,发现他们的测试代码顶部有net.train()。这似乎是一个错误,因为这意味着元测试中每个任务的统计数据......

回答 1 投票 0

如何使用权重和偏差 wandb 扫描实现多处理以实现最大并行化,特别是计数变量在此设置中如何工作?

我正在尝试使用权重和偏差(W&B)运行超参数扫描,并希望利用多处理来尽可能并行化我的实验。我想确保每个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.