Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >什么是效用?

什么是效用?
EN

Stack Overflow用户
提问于 2017-11-29 10:19:24
回答 2查看 2.3K关注 0票数 1

作为Q学习的一部分,目标是最大化预期的效用。我知道呀

阅读维基百科:https://en.wikipedia.org/wiki/Q-learning描述了在以下上下文中的预期效用:

它的工作方式是学习一个动作值函数,该函数最终给出在给定状态下采取给定行动并随后遵循最优策略的预期效用。 Q学习的优点之一是它能够比较可用操作的预期效用,而不需要环境模型。

但是没有定义什么是效用,什么是效用?

当最大化utility时,究竟是什么在最大化?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-11-29 10:27:20

在这种情况下,“实用程序”是指功能或有用性。因此,“最大的功能”或“最大的用途”。

将这个词插入Google会给你:

有益的状态有用的、有利可图的或有益的

票数 1
EN

Stack Overflow用户

发布于 2017-11-29 23:59:34

一般来说,公用事业意味着有利可图或有益(如@Rob在他的答复中所示)。

在Q-学习环境中,实用程序与动作值函数是紧密相关的(它们可以被视为同义词),正如您在维基百科的解释中所读到的那样。这里,策略π的动作值函数是对代理在给定状态s中执行动作a并遵循策略π时所获得的返回(长期报酬)的估计。所以,当你最大限度地发挥效用时,实际上你是在最大化你的代理人会得到的回报。当奖励被定义为实现一个目标时,你正在最大化所达到的目标的“数量”。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47559290

复制
相关文章
工业相机 效用几何
企鹅号小编
2017/12/28
8910
工业相机 效用几何
中微笔记 | 04_效用
效用函数:是为偏好排序的一种简便方法。为每个可能的消费束指定一个数字,使具有较多偏好的消费束大于具有具有较少偏好的消费束。
PyStaData
2020/10/10
2.2K0
中微笔记 | 04_效用
什么是权限?什么是角色?什么是用户?
什么是用户? 比如我陈业贵 什么是角色?比如系统管理员这个身份。 什么是权限? 删除日志就是一个日志管理权限,添加用户就是一个用户管理权限 比如可以 他们之间的关系是: 系统管理员有删除
贵哥的编程之路
2022/07/04
3.2K0
什么是uid?什么是Auth?什么是验证器?
什么是uid? UID,用户身份证明(User Identification)的缩写,网络平台注册时系统自动生成的数值。 什么是Auth? 它的身份,比较老板 员工 经理。。。。。 作用用于区
贵哥的编程之路
2022/07/04
3.5K0
什么是同步?什么是异步?
同步就是比如你上学没钱了。想让父母转钱给你。期间你一直打电话。但是电话都是打不通。打了一天电话都打不通。就是说你这一天除了打电话之外,没有做其他事情这就是同步。 异步就是比如你上学没钱了。想让父母转钱给你。但是你打电话过去。发现打不通,猜想:对方可能在忙,暂时无法接听电话,所以你发了一条短信(或者语音留言,亦或是其他的方式)通知对方后便忙其他要紧的事了;这时你就不需要持续不断的拨打电话,还可以做其他事情;待一定时间后,对方看到你的留言便回复响应你,当然对方可能转钱也可能不转钱。但是整个一天下来,你还做了很多事情。 或者说你找室友临时借了一笔钱,又开始happy的上学时光了。
贵哥的编程之路
2022/08/15
3K0
什么是强电?什么是弱电?
经常做施工的朋友会问到强弱电怎么区别,强电指的是什么,弱电指的是什么,今天一起了解下强弱电是如何区分的?
网络技术联盟站
2023/03/13
5.5K0
什么是强电?什么是弱电?
什么是成熟?什么是世故?
生活或者职场中,都希望自己越来越成熟,但什么才是成熟,有没有一套方法论,来时刻提醒自己,约束自己的行为和思想。
刘盼
2021/04/13
2.6K0
什么是模型,什么是模式
模型(model)与模式(Pattern),英文显然是两个词,但是,在实际使用过程中,却是比较混乱。
全栈程序员站长
2022/07/22
3.3K0
什么是 CGI,什么是 IIS,什么是VPS「建议收藏」
该公司来到天。我们所从事的事情在网站上。这对我来说确实是一个很大的挑战。个人一直从事Android,对于web而一个开发网站server知识的几乎为零。在这里应该说,现在我只是有一个技术人员,昨天相遇CGI ERROR错误(The specified CGI application misbehaved by not returning a complete set of HTTP headers.)把我搞了好久好久。经过今天的早上爬帖。最终找到问题所在。以下还是把新学到的知识梳理一下吧:
全栈程序员站长
2022/07/06
2.9K0
什么是Hadoop?什么是HDFS?
什么是Hadoop?什么是HDFS?马 克-to-win @ 马克java社区:Hadoop是Apache基金会开发的一个分布式系统基础架构。比如前面我们接触的Spring就是一个开发应用框架。Hadoop 实现了一个分布式文件系统( Distributed File System),加上Hadoop,即HDFS。Hadoop最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而 MapReduce则为海量的数据提供了计算。从以下的包名就可以看出。 import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper;
马克java社区
2021/06/24
2.3K0
你真知道如何高效用mapPartitions吗?
做过一段时间spark的应用开发的小伙伴都会渐渐发现,很没趣,因为都是调API。那么,真的是没趣吗,还是说你本身没有去深入研究呢?通过本文你就会发现自己没成长是哪的问题了。
Spark学习技巧
2018/08/20
1.7K0
Linux ps命令的几个高效用法
(1)显示所有进程 $ ps -ax | less (2)只显示某用户的进程 $ ps -u root (3)通过cpu和内存使用来过滤进程 $ ps -aux | less (4)根据 CPU
dys
2018/04/03
1.4K0
Linux ps命令的几个高效用法
什么是DNS?什么是DNS传播?
DNS一词在互联网中常常出现,但是很少人可以明确说出它的涵义。亚洲云在本文中梳理了什么是DNS、DNS传播的定义、域名系统工作原理。
会长君
2023/04/26
4.1K0
什么是lamp架构_什么是LAMP
当客户端请求的是静态资源时,web服务(httpd程序)会直接返回静态资源给客户端
全栈程序员站长
2022/11/19
2.8K0
什么是lamp架构_什么是LAMP
什么是业务,什么是业务架构?
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
芋道源码
2022/03/04
2.1K0
什么是主表?什么是从表?
关联关系的话,比如user表(用户)id name把id设为主键与文章表article id name user_id把user_id设为索引外键,关联关系的话,是用户表的id与文章表的user_id作为关联关系。为什么呢? 因为用户表的id是主表的主键id。从表的user_id是外键啊.而关联关系是主表的主键id与从表的外键id相关联的啊
贵哥的编程之路
2022/06/19
2.6K0
什么是主表?什么是从表?
什么是业务,什么是业务架构?
一直以来,业务架构始终是架构设计领域一块“难啃的骨头”,架构的核心理念是抽象,而所谓业务,强调的则是落地。如何让抽象的架构设计模式,赋能实际业务产生价值,是业务架构需要解决的问题。
玄姐谈AGI
2021/07/06
8.7K0
什么是业务,什么是业务架构?
什么是XSS攻击?什么是SQL注入攻击?什么是CSRF攻击?
XSS(Cross Site Script,跨站脚本攻击)是向网页中注入恶意脚本在用户浏览网页时在用户浏览器中执行恶意脚本的攻击方式。跨站脚本攻击分有两种形式:反射型攻击(诱使用户点击一个嵌入恶意脚本的链接以达到攻击的目标,目前有很多攻击者利用论坛、微博发布含有恶意脚本的URL就属于这种方式)和持久型攻击(将恶意脚本提交到被攻击网站的数据库中,用户浏览网页时,恶意脚本从数据库中被加载到页面执行,QQ邮箱的早期版本就曾经被利用作为持久型跨站脚本攻击的平台)。XSS虽然不是什么新鲜玩意,但是攻击的手法却不断翻新
唐怀瑟
2018/08/30
2K0
什么是EMC?什么是EMI?什么是EMS?电磁兼容详解(一)
EMC(Electro Magnetic Compatibility,电磁兼容)是指电子、电气设备或系统在预期的电磁环境中,按设计要求正常工作的能力。它是电子、电气设备或系统的一种重要的技术性能,其包括三方面的含义:
武汉利又德
2023/04/11
11.4K0
什么是EMC?什么是EMI?什么是EMS?电磁兼容详解(一)
什么是多线程,什么是高并发?[通俗易懂]
  多线程是完成任务的一种方法,高并发是系统运行的一种状态,通过多线程有助于系统承受高并发状态的实现。
全栈程序员站长
2022/09/20
1.5K0

相似问题

什么是人工智能中的效用理论?

13

什么是媒体属性在链接标签中的效用?

411

bss分段的效用是什么?

15

即使是无效用户也可以成功登录

111

检查用户在域-上是否是有效用户

24
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文