首页
学习
活动
专区
工具
TVP
发布

AlgorithmDog的专栏

专栏作者
46
文章
76692
阅读量
41
订阅数
一个特殊场景的 LR 预测优化 Trick
我们的业务碰到了一个很特殊的场景:用户数量巨大,上亿;物品数目比较少,不超过 500 个。针对这个特点,我们设计了一个小程序 Trick。这个程序 Trick 极大地提高了 LR 的预测性能,预测耗时减为原来的 120 分之一。
AlgorithmDog
2018-02-07
1.2K0
动手写一个 DQN 的棋牌 AI
深度强化学习是学术界研制游戏 AI 的主流算法。这篇文章我们将用深度强化学习早期代表算法 DQN 算法探索棋牌 AI。
AlgorithmDog
2018-02-07
4.1K1
遗传算法系列之一:遗传算法简介
该文介绍了遗传算法的基本概念、应用和实现方法,特别强调了遗传算法在解决优化问题方面的优势。同时,文章还探讨了遗传算法的发展历史和现状,以及其在实际应用中可能遇到的问题和挑战。
AlgorithmDog
2018-01-08
1.7K0
强化学习系列之五:价值函数近似
目前,我们已经介绍了一些强化学习的算法,但是我们无法在实际问题中运用这些算法。 为什么呢?因为算法估算价值函数 (v(s)) 或者 (q(s,a)),保存这些价值函数意味着保存所
AlgorithmDog
2018-01-08
1.6K0
Metropolis-Hastings 和 Gibbs sampling
本文介绍了 Metropolis-Hastings 和 Gibbs sampling 这两种常用的 MCMC(马尔科夫链蒙特卡洛)算法,以及如何在技术社区中帮助用户解决高维空间的采样问题。
AlgorithmDog
2018-01-08
1.3K0
游戏智能系列之二:再次进行准备
AlgorithmDog
2018-01-08
7740
朴素贝叶斯分类器本质上是线性分类器
该文介绍了朴素贝叶斯分类器的本质是线性分类器,以及适用于离散和连续特征的场景。
AlgorithmDog
2018-01-08
2.1K0
PCA模型加先验
本文介绍了主成分分析(PCA)在降维、特征提取和推荐系统等方面的应用。首先介绍了 PCA 的基本原理和常用算法,然后详细阐述了基于 PCA 的推荐系统设计和实现。最后,介绍了一个基于 PCA 的海量多标记分类算法,该算法可以有效地利用 PCA 进行特征降维和海量数据的处理,具有较高的实用价值。
AlgorithmDog
2018-01-08
7200
遗传算法系列之五:多目标遗传算法和遗传编程
本文介绍了遗传算法的基本概念、发展历程、应用案例以及未来展望。遗传算法是一种基于自然选择和遗传学原理的优化搜索算法,具有高度的并行性、全局搜索能力和鲁棒性。在计算机科学、人工智能、机器学习和生物信息学等领域具有广泛的应用。随着理论和技术的发展,遗传算法在解决复杂问题、优化模型和降低计算复杂度等方面取得了重要进展。
AlgorithmDog
2018-01-08
5.2K0
EM算法原理和应用
EM算法是带隐变量概率模型的推断算法。今天我们介绍 EM 算法的原理和应用。我们先介绍推导出 EM 算法的一般方法,再介绍另一种 EM 算法推导方法,最后将 EM 算法应用于高斯混合模型。
AlgorithmDog
2018-01-08
1.3K0
遗传算法系列之三:数学摆摆手,“很惭愧,只做了一点微小的工作”
本文介绍了遗传算法的基本概念、工作原理和应用,并分析了遗传算法中的模式定理和马尔科夫链分析方法。作者通过实例讲解了遗传算法在解决实际问题中的应用,并探讨了遗传算法的发展趋势和未来研究方向。
AlgorithmDog
2018-01-08
1.2K0
强化学习系列之四:模型无关的策略学习
本文介绍了模型无关的策略学习。模型无关的策略学习主要有三种算法: Monte Carlo Control, Sarsa 和 Q learning。这三种算法都能从环境中学习最优策略,其中 Q-learning 算法是一种离策略的算法,而 Monte Carlo Control 和 Sarsa 算法则属于在策略的算法。在实验部分,本文对这三种算法进行了比较,发现 Q-learning 算法在机器人找金币的实验中表现最好,而 Sarsa 算法在跳跃机器人实验中表现最好,而 Monte Carlo Control 算法则表现最差。总的来说,模型无关的策略学习算法在解决强化学习问题时具有重要的作用,并且这些算法在实际应用中可能会面临一些挑战,比如算法的选择、计算资源的限制等等。
AlgorithmDog
2018-01-08
1.1K0
遗传算法系列之二:“欺骗”深度学习的遗传算法
本文介绍了遗传算法在解决复杂问题中的应用,包括在机器人路径规划、神经网络参数优化、机器人视觉系统中的运动物体检测和识别、以及自动化作曲等领域。遗传算法在这些领域的应用中,表现出极大的潜力和广泛的应用前景,同时也存在一些挑战和需要解决的问题。
AlgorithmDog
2018-01-08
2.2K0
强化学习系列之三:模型无关的策略评价
本文介绍了模型无关的策略评价,包括蒙特卡罗算法和时差学习算法,适用于不知道马尔科夫决策过程转移概率和奖励函数的场景。代码示例基于机器人找金币问题,可以在Github上找到。
AlgorithmDog
2018-01-08
1K0
遗传算法系列之四:遗传算法的变种
本文介绍了遗传算法的发展历程、应用案例、变种以及未来展望。
AlgorithmDog
2018-01-08
3.4K0
AlphaGo 是如何把 CNN 接到搜索的?
AlgorithmDog
2018-01-08
1.9K0
强化学习系列之一:马尔科夫决策过程
文章目录 [隐藏] 1. 马尔科夫决策过程 2. 策略和价值 3. 最优策略存在性和贝尔曼等式 强化学习系列系列文章 机器学习一共有三个分支,有监督学习、无监督学习和强化学习。强化学习是系
AlgorithmDog
2018-01-08
1.1K0
强化学习系列之六:策略梯度
本文介绍了梯度策略的相关知识,包括策略梯度的定义、策略梯度与价值函数的关系、策略梯度的算法以及策略梯度的应用场景。文章还介绍了蒙特卡罗策略梯度和Actor-Critic算法,并解释了策略梯度在强化学习中的重要性。
AlgorithmDog
2018-01-08
1.6K0
强化学习系列之二:模型相关的强化学习
本文介绍了模型相关的强化学习,包括马尔科夫决策过程、策略迭代、价值迭代等概念。以机器人找金币问题为例子,介绍了如何使用这些算法进行强化学习。最后,介绍了强化学习的总结性结尾,包括策略迭代和价值迭代等算法,以及它们在机器人找金币问题中的应用。
AlgorithmDog
2018-01-08
8970
深度学习框架大战正在进行,谁将夺取“深度学习工业标准”的荣耀?
AlgorithmDog
2017-12-29
1K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档