首页
学习
活动
专区
工具
TVP
发布

卡尼慕

专栏成员
135
文章
101714
阅读量
27
订阅数
MARL 算法汇总
所以这里 Minimax-Q 的 Minimax 指的是 Minimax 算法,而 Q 指的是借用 Q-learning 中的 TD 来迭代学习状态值函数或动作-状态值函数。
可爱见见
2022-08-30
8530
2021 牛津大学:Recent Advances in Reinforcement Learning in Finance
本文是牛津大学2021年对 深度强化学习在金融领域内各种决策的应用 的综述文章。文章分为四个部分,第一部分是整体介绍;第二部分详细介绍了强化学习的基础知识,包括马尔科夫决策过程的定义、基于值的方法、基于策略的方法;第三部分介绍了深度强化学习的相关算法;最后一部分介绍了目前深度强化学习在金融领域里的最新应用。
可爱见见
2022-04-19
9170
1462: [蓝桥杯2019初赛]组队
作为篮球队教练,你需要从以下名单中选出1 号位至5 号位各一名球员,组成球队的首发阵容。
可爱见见
2020-02-26
9160
1463:[蓝桥杯2019初赛]年号字串
小明用字母A 对应数字1,B 对应2,以此类推,用Z 对应26。对于27以上的数字,小明用两位或更长位的字符串来对应,例如AA 对应27,AB 对应28,AZ 对应52,LQ 对应329。请问2019 对应的字符串是什么?
可爱见见
2020-02-26
2.1K0
1455: [蓝桥杯2019初赛]迷宫
题目 下图给出了一个迷宫的平面图,其中标记为1 的为障碍,标记为0 的为可 以通行的地方。 010000 000100 001001 110000 迷宫的入口为左上角,出口为右下角,在迷宫中,只能从一个位置走到这 个它的上、下、左、右四个方向之一。 对于上面的迷宫,从入口开始,可以按DRRURRDDDR 的顺序通过迷宫, 一共10 步。其中D、U、L、R 分别表示向下、向上、向左、向右走。 对于下面这个更复杂的迷宫(30 行50 列),请找出一种通过迷宫的方式, 其使用的步数最少,在步数最少的前提下,请找
可爱见见
2020-02-26
1.4K0
1452: [蓝桥杯2019初赛]平方和
小明对数位中含有2、0、1、9 的数字很感兴趣,在1 到40 中这样的数包括1、2、9、10 至32、39 和40,共28 个,他们的和是574,平方和是14362。注意,平方和是指将每个数分别平方后求和。请问,在1 到2019 中,所有这样的数的平方和是多少?
可爱见见
2020-02-26
9070
1465: [蓝桥杯2019初赛]特别数的和
小明对数位中含有2、0、1、9 的数字很感兴趣(不包括前导0)。在1到40中这样的数包括1、2、9、10 至32、39 和40,共28 个,他们的和是574。请问,在1到n 中,所有这样的数的和是多少?
可爱见见
2020-02-26
1.4K0
1453: [蓝桥杯2019初赛]数列求值
给定数列1, 1, 1, 3, 5, 9, 17, …,从第4 项开始,每项都是前3 项的和。求第20190324 项的最后4 位数字。
可爱见见
2020-02-25
8250
深度优先搜索
以上递归实现斐波那契实际上就是按照深度优先的方式进行搜索。也就是 “一条路走到黑” 。注意:这里的搜索指的是一种穷举方式,把可行的方案都列举出来,不断尝试,直到找到问题的解。
可爱见见
2020-02-25
8970
PAT乙级题目总结
cin 和 cout 比 printf 和 scanf 更加耗时,且不要再同一个程序中同时使用 cout 和 printf。
可爱见见
2019-12-05
5630
1029 旧键盘 (20 分)
旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及实际被输入的文字,请你列出肯定坏掉的那些键。
可爱见见
2019-11-22
5440
1086 就不告诉你 (15 分)
做作业的时候,邻座的小盆友问你:“五乘以七等于多少?”你应该不失礼貌地围笑着告诉他:“五十三。”本题就要求你,对任何一对给定的正整数,倒着输出它们的乘积。
可爱见见
2019-11-18
7980
1093 字符串A+B (20 分)
给定两个字符串 A 和 B,本题要求你输出 A+B,即两个字符串的并集。要求先输出 A,再输出 B,但重复的字符必须被剔除。
可爱见见
2019-11-18
4410
1090 危险品装箱 (25 分)
集装箱运输货物时,我们必须特别小心,不能把不相容的货物装在一只箱子里。比如氧化剂绝对不能跟易燃液体同箱,否则很容易造成爆炸。
可爱见见
2019-11-18
1K0
1094 谷歌的招聘 (20 分)
1094 谷歌的招聘 (20 分) 【我的代码】 1//1094 谷歌的招聘 (20 分) 2#include <iostream> 3#include <string> 4#include
可爱见见
2019-11-18
3600
1075 链表元素分类 (25 分)
给定一个单链表,请编写程序将链表元素进行分类排列,使得所有负值元素都排在非负值元素的前面,而 [0, K] 区间内的元素都排在大于 K 的元素前面。但每一类内部元素的顺序是不能改变的。例如:给定链表为 18→7→-4→0→5→-6→10→11→-2,K 为 10,则输出应该为 -4→-6→-2→7→0→5→10→18→11。
可爱见见
2019-11-05
3220
1067 试密码 (20 分)
你试图登录某个系统却忘了密码时,系统一般只会允许你尝试有限多次,当超出允许次数时,账号就会被锁死。本题就请你实现这个小功能。
可爱见见
2019-10-30
3940
1057 数零壹 (20 分)
给定一串长度不超过 105 的字符串,本题要求你将其中所有英文字母的序号(字母 a-z 对应序号 1-26,不分大小写)相加,得到整数 N,然后再分析一下 N 的二进制表示中有多少 0、多少 1。例如给定字符串 PAT (Basic),其字母序号之和为:16+1+20+2+1+19+9+3=71,而 71 的二进制是 1000111,即有 3 个 0、4 个 1。
可爱见见
2019-10-18
3680
1052 卖个萌 (20 分)
萌萌哒表情符号通常由“手”、“眼”、“口”三个主要部分组成。简单起见,我们假设一个表情符号是按下列格式输出的:
可爱见见
2019-10-15
5280
1047 编程团体赛 (20 分)
编程团体赛的规则为:每个参赛队由若干队员组成;所有队员独立比赛;参赛队的成绩为所有队员的成绩和;成绩最高的队获胜。
可爱见见
2019-10-09
4470
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档