SO中文参考
首页
(current)
程序语言
c
java
python
c++
go
javascript
swift
c#
操作系统
linux
ubuntu
centos
unix
数据库
oracle
mysql
mongodb
postgresql
框架
node.js
angular
react-native
avalon
django
twisted
hadoop
.net
移动开发
android
ios
搜索
Seq到Seq模型训练
问题描述
投票:0
回答:1
我有几个问题:
在具有不同输入长度的seq到seq模型中,如果不使用注意蒙版,RNN可能最终会计算填充元素的隐藏状态值?因此,这意味着必须使用注意蒙版,否则我的输出将是错误的?
然后,如何处理不同长度的标签,比方说,我已经批量填充了它。现在我不希望填充元素对我的损失造成影响,那么我该如何忽略呢?
tensorflow
nlp
pytorch
sequence-to-sequence
1个回答
0
投票
不,不一定。 RNN采用时间序列并每次都计算“隐藏”状态。您可以强制RNN停止并且不计算填充元素的隐藏状态值。
您可以使用
Dynamic RNN
。在这里阅读:
What is a dynamic RNN in TensorFlow?
最新问题
在TypeORM中创建映射表,其中1列可以引用多个表
如何在 JavaScript 中重新加载页面后显示警报?
SwiftUI 视图模型处理状态更改
Typo3 12 Context API - 用户方面获取自定义 fe_user 属性
Avro:C++ 库支持 local-timestamp-millis 吗?
TypeScript 中 C# 类虚拟成员的等效项
Tibco rendezvous Docker 多播
使用 eventbridge 管道将动态数据插入到 redshift
localhost 3001 拒绝连接
如何在windows wsl2 Ubuntu中使用v2rayN
如何将我的聊天机器人组件转换为 <script> 标签,以便任何人都可以在其网站中使用该 <script>,在 React.js 中?
如何全局添加包含路径到 clang
如何在Python中的Altair分组条形图中添加不同的颜色?
列表中值总和最多为 K 的元素的最大数量
使用 webpack 5 升级到 Storybook 7 后页面刷新多次
如何避免在移动设备中收到虚假的调整大小事件?
日志传送未在 s3 存储桶中创建数据[已关闭]
用于计算一段时间内漏洞数量的 KQL 脚本
如何在 R 中的径向图中正确对齐文本
Materialize - activeIndex 返回 -1
© www.soinside.com 2019 - 2024. All rights reserved.