AlgorithmDog的专栏

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

深度强化学习是学术界研制游戏 AI 的主流算法。这篇文章我们将用深度强化学习早期代表算法 DQN 算法探索棋牌 AI。

动手写一个 DQN 的棋牌 AI

本文介绍了 Metropolis-Hastings 和 Gibbs sampling 这两种常用的 MCMC（马尔科夫链蒙特卡洛）算法，以及如何在技术社区中帮助用户解决高维空间的采样问题。

Metropolis-Hastings 和 Gibbs sampling

游戏智能系列之二:再次进行准备

本文介绍了遗传算法的基本概念、工作原理和应用，并分析了遗传算法中的模式定理和马尔科夫链分析方法。作者通过实例讲解了遗传算法在解决实际问题中的应用，并探讨了遗传算法的发展趋势和未来研究方向。

遗传算法系列之三:数学摆摆手，“很惭愧，只做了一点微小的工作”

本文介绍了模型无关的策略学习。模型无关的策略学习主要有三种算法: Monte Carlo Control, Sarsa 和 Q learning。这三种算法都能从环境中学习最优策略，其中 Q-learning 算法是一种离策略的算法，而 Monte Carlo Control 和 Sarsa 算法则属于在策略的算法。在实验部分，本文对这三种算法进行了比较，发现 Q-learning 算法在机器人找金币的实验中表现最好，而 Sarsa 算法在跳跃机器人实验中表现最好，而 Monte Carlo Control 算法则表现最差。总的来说，模型无关的策略学习算法在解决强化学习问题时具有重要的作用，并且这些算法在实际应用中可能会面临一些挑战，比如算法的选择、计算资源的限制等等。

强化学习系列之四:模型无关的策略学习

本文介绍了遗传算法在解决复杂问题中的应用，包括在机器人路径规划、神经网络参数优化、机器人视觉系统中的运动物体检测和识别、以及自动化作曲等领域。遗传算法在这些领域的应用中，表现出极大的潜力和广泛的应用前景，同时也存在一些挑战和需要解决的问题。

遗传算法系列之二:“欺骗”深度学习的遗传算法

本文介绍了遗传算法的发展历程、应用案例、变种以及未来展望。

遗传算法系列之四:遗传算法的变种

AlphaGo 是如何把 CNN 接到搜索的？

本文介绍了梯度策略的相关知识，包括策略梯度的定义、策略梯度与价值函数的关系、策略梯度的算法以及策略梯度的应用场景。文章还介绍了蒙特卡罗策略梯度和Actor-Critic算法，并解释了策略梯度在强化学习中的重要性。

强化学习系列之六:策略梯度

本文介绍了XGBoost+LR算法在工业界的一些应用，以及在CTR预估领域的成绩。作者通过在Criteo数据集上的实验表明，XGBoost+LR可以有效地提高CTR预测的准确度，同时也能够降低算法的计算复杂度。虽然XGBoost+LR在预测效果上并没有达到深度学习的效果，但是它的优势在于算法复杂度更低，更适合于工业界的应用。同时，作者也指出了XGBoost+LR的局限性，例如无法处理非线性和复杂关系，需要更多的特征工程等等。因此，对于工业界来说，需要根据具体的应用场景和需求来选择合适的算法和模型，同时也需要更多的实验和研究来探索更优的解决方案。

XGBoost + LR 就是加特征而已

拖拽式机器学习是一种通过图形界面拖拽组件完成机器学习任务的方法，具有易学易用等特点，适合非技术背景人员使用。但拖拽式机器学习也存在一些缺点，如不能完全实现自动化、需要人工选择特征和参数等。

拖拽式机器学习的爱与恨

本文介绍了 fastText，一种用于文本分类的机器学习模型，以及它的原理、优缺点和应用场景。fastText 能够处理多标签分类任务，具有训练速度快、分类效果好的特点。与传统的 word2vec 相比，fastText 考虑了词之间的组成关系，能够更好地捕捉词的语义信息。fastText 的应用场景包括文本分类、情感分析、文本相似性等。

超快的 fastText

在 Spark 中实现单例模式的技巧，通过使用对象作为单例实例，解决了在集群模式下使用单例模式的问题。

在 Spark 中实现单例模式的技巧

一直想开游戏人工智能的专题。只是最近刚刚用 Spark, 踩了一些坑，没有时间看东西，就延误了。虽然现在还没有看什么东西，但拖不了了，下定决心这个专题。
      因为我对游戏中的人工智能也不了解，

游戏智能系列之一:一些准备工作

通过上一篇文章，我们已经大致了解怎么使用 Akka，期待细致用法。这篇文章将介绍如何用 Akka-testkit 对 Akka 程序进行测试。
      并行程序是最难调试的程序类型之一，因此做好测

Akka 使用系列之二: 测试

本文介绍了Akka在Spark中的使用，包括Akka的主要特性和架构。首先介绍了Akka的入门知识，然后详细阐述了Akka在Spark中的使用，包括如何使用Akka进行RPC调用、如何使用Akka异步处理消息和如何使用Akka进行并行计算。最后，本文总结了Akka在Spark中的使用，并介绍了另一种基于Netty的RPC实现。

Akka 使用系列之四: Future

前端和后端分工的三种模式

本文介绍了强化学习中的马尔科夫决策过程、模型相关的强化学习、模型无关的策略评价、模型无关的策略学习和价值函数近似等概念。作者通过举例来说明这些概念在强化学习中的应用，并提出了针对这些概念的相关算法。最后，作者对强化学习未来的研究方向进行了展望，包括深度强化学习和策略搜索算法等。

强化学习系列之九:Deep Q Network (DQN)

本文介绍了基于JavaScript的机器学习类库和框架，包括ConvNetJS、MXNetJS、Deeplearning.js、TensorFlow.js、Brain.js、Node-TensorFlow等，以及基于JavaScript的机器学习应用和性能问题。

Javascript 侵入机器学习？

本文介绍了动态图计算在深度学习框架中的实现和优势，包括TensorFlow Fold、动态图计算和总结。

动态图计算：Tensorflow 第一次清晰地在设计理念上领先

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了AlgorithmDog的专栏专栏，为你提供了AlgorithmDog的专栏的相关文章，致力于帮助开发者快速成长与发展。

AlgorithmDog的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐