SO中文参考
首页
(current)
程序语言
c
java
python
c++
go
javascript
swift
c#
操作系统
linux
ubuntu
centos
unix
数据库
oracle
mysql
mongodb
postgresql
框架
node.js
angular
react-native
avalon
django
twisted
hadoop
.net
移动开发
android
ios
搜索
深度强化学习中的状态值
问题描述
投票:0
回答:1
我正在学习深度强化学习。我在状态值方面有点困惑。是否可以在状态中使用动态值,还是我们必须使用离散值,并为每个值创建一个状态?
python
deep-learning
reinforcement-learning
unsupervised-learning
1个回答
最新问题
如何在 MySQL 中插入一行,动态使用表中与 SELECT 查询匹配的其他值?
调用 `FIRApp.configure()` 时应用程序首次运行时崩溃
将提供程序传递到序列中的下一个小部件
我的“从无序链表中删除重复项”的代码超出了大量节点链表的时间
Firebase Realtime 中的嵌套节点规则
如何在 Swiftui 中为我的 TabBar 提供相同的背景?
打开多个 Word 文档时触发进程退出事件
模拟 LFU 缓存
没有struct 1和struct 2数组,struct 2内部有一个int数组
EVAL:未定义的函数。在 Common LISP 中用作参数
如何使用完整日期的采样值转换不完整日期?
React 服务端渲染前如何加载数据?
python 错误消息中的“最近一次调用最后一次”是什么意思?
使用 std::ranges::to 将 std::ranges::lazy_split_view 收集到 std::vector
在 Django 中显示静态文件夹中的图像
Sagemaker 不认可训练作业来启动推理
由于 rustc 版本问题,无法使用 `anchor build` 命令构建 Solana NFT 程序
create-react-app:根据目录中的文件自动路由
Docker 容器在 Google Cloud 虚拟机上启动并运行,但无法访问网站
如何使用 Json.Net 反序列化只读列表
© www.soinside.com 2019 - 2024. All rights reserved.