用户1908973

LV0
发表了文章

SPG定理与算法介绍

在传统的policy optimization强化学习中,通常会手加一个动作熵作为探索项,然后对该项的权重因子调参以达到增加探索的目的。然而“In practi...

用户1908973
发表了文章

NVAE介绍

In this paper, we aim to make VAEs great again by architecture design. We propos...

用户1908973
发表了文章

GTrXL架构介绍 (Transformer在RL中的应用)

论文链接:https://arxiv.org/pdf/1910.06764.pdf

用户1908973
发表了文章

Meet CreateAMind Cuju ( 谷歌足球 SOTA )

谷歌足球(Google Research Football)是Google Brain 开发的一个足球仿真策略游戏。

用户1908973
发表了文章

SQN算法介绍

SQN是Soft Q Network的缩写,是基于Q-value的强化学习算法,"Soft"指代的是熵正规化( entropy regularization )...

用户1908973
发表了文章

脑图整理管理笔记1+

原脑图文件 链接: https://pan.baidu.com/s/13KsqtDLJTsXDS7VOUEweWw 提取码: h3as

用户1908973
发表了文章

脑图整理管理笔记1

原脑图文件链接: https://pan.baidu.com/s/1AkU2ktwogrCAup6vwlKPvQ 提取码: jzib

用户1908973
发表了文章

强化学习框架 IMPALA 介绍

In this work we aim to solve a large collection of tasks using a single reinforc...

用户1908973
发表了文章

Quantum Annealing of VRP with Time, State and Capacity

We propose a brand-new formulation of capacitated vehicle routing problem (CVRP)...

用户1908973
发表了文章

开源ALNS 自适应大邻域搜索(Adaptive Large Neighborhood Search)

This package offers a general, well-documented and tested implementation of the ...

用户1908973
面向对象编程编程算法
发表了文章

Convolutional Tsetlin Machine tutorial

https://github.com/cair/convolutional-tsetlin-machine

用户1908973
httpsGitHub网络安全Git开源
发表了文章

可解释的AI

https://github.com/cair/pyTsetlinMachineParallel#interpretability-demo

用户1908973
httpsGitHub网络安全Git开源
发表了文章

使用Ray并行化你的强化学习算法(三)

我们先看算法的核心部分:model,包含了TensorFlow建图,计算loss,训练和测试。

用户1908973
发表了文章

使用Ray并行化你的强化学习算法(二)

spinningup给新手提供了几个重要算法的实现,具有很好的参考价值。除了SAC外,其他on policy算法都使用MPI进行并行化,唯独SAC没有并行实现。...

用户1908973
编程算法
发表了文章

使用Ray并行化你的强化学习算法(一)

强化学习算法的并行化可以有效提高算法的效率。并行化可以使单机多cpu的资源得到充分利用,并行化也可以将算法中各个部分独立运行,从而提高运行效率,如将环境交互部分...

用户1908973
编程算法
发表了文章

从更统一的视角分析VAE

With an overall view of VAE, we can extend standard VAE loss in the reconstructi...

用户1908973
发表了文章

一起测智商——解耦真的对下游任务有帮助吗

先来一道经典的智商测试题,根据左边八个小方块的规律从右边的六个小方块中选出一个填补空缺。

用户1908973
编程算法https网络安全
订阅了专栏

腾讯云自媒体分享计划

3 文章3.2K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.2K 关注者
发表了文章

MPI入门 (Part 3/3)

Message Passing Interface (MPI) is a standardized and portable message-passing s...

用户1908973

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券