首页
学习
活动
专区
工具
TVP
发布

AlgorithmDog的专栏

专栏作者
46
文章
77987
阅读量
41
订阅数
遗传算法系列之一:遗传算法简介
该文介绍了遗传算法的基本概念、应用和实现方法,特别强调了遗传算法在解决优化问题方面的优势。同时,文章还探讨了遗传算法的发展历史和现状,以及其在实际应用中可能遇到的问题和挑战。
AlgorithmDog
2018-01-08
1.8K0
强化学习系列之五:价值函数近似
目前,我们已经介绍了一些强化学习的算法,但是我们无法在实际问题中运用这些算法。 为什么呢?因为算法估算价值函数 (v(s)) 或者 (q(s,a)),保存这些价值函数意味着保存所
AlgorithmDog
2018-01-08
1.7K0
游戏智能系列之二:再次进行准备
AlgorithmDog
2018-01-08
7860
遗传算法系列之三:数学摆摆手,“很惭愧,只做了一点微小的工作”
本文介绍了遗传算法的基本概念、工作原理和应用,并分析了遗传算法中的模式定理和马尔科夫链分析方法。作者通过实例讲解了遗传算法在解决实际问题中的应用,并探讨了遗传算法的发展趋势和未来研究方向。
AlgorithmDog
2018-01-08
1.3K0
强化学习系列之四:模型无关的策略学习
本文介绍了模型无关的策略学习。模型无关的策略学习主要有三种算法: Monte Carlo Control, Sarsa 和 Q learning。这三种算法都能从环境中学习最优策略,其中 Q-learning 算法是一种离策略的算法,而 Monte Carlo Control 和 Sarsa 算法则属于在策略的算法。在实验部分,本文对这三种算法进行了比较,发现 Q-learning 算法在机器人找金币的实验中表现最好,而 Sarsa 算法在跳跃机器人实验中表现最好,而 Monte Carlo Control 算法则表现最差。总的来说,模型无关的策略学习算法在解决强化学习问题时具有重要的作用,并且这些算法在实际应用中可能会面临一些挑战,比如算法的选择、计算资源的限制等等。
AlgorithmDog
2018-01-08
1.1K0
遗传算法系列之二:“欺骗”深度学习的遗传算法
本文介绍了遗传算法在解决复杂问题中的应用,包括在机器人路径规划、神经网络参数优化、机器人视觉系统中的运动物体检测和识别、以及自动化作曲等领域。遗传算法在这些领域的应用中,表现出极大的潜力和广泛的应用前景,同时也存在一些挑战和需要解决的问题。
AlgorithmDog
2018-01-08
2.3K0
强化学习系列之三:模型无关的策略评价
本文介绍了模型无关的策略评价,包括蒙特卡罗算法和时差学习算法,适用于不知道马尔科夫决策过程转移概率和奖励函数的场景。代码示例基于机器人找金币问题,可以在Github上找到。
AlgorithmDog
2018-01-08
1K0
遗传算法系列之四:遗传算法的变种
本文介绍了遗传算法的发展历程、应用案例、变种以及未来展望。
AlgorithmDog
2018-01-08
3.5K0
强化学习系列之一:马尔科夫决策过程
文章目录 [隐藏] 1. 马尔科夫决策过程 2. 策略和价值 3. 最优策略存在性和贝尔曼等式 强化学习系列系列文章 机器学习一共有三个分支,有监督学习、无监督学习和强化学习。强化学习是系
AlgorithmDog
2018-01-08
1.2K0
强化学习系列之六:策略梯度
本文介绍了梯度策略的相关知识,包括策略梯度的定义、策略梯度与价值函数的关系、策略梯度的算法以及策略梯度的应用场景。文章还介绍了蒙特卡罗策略梯度和Actor-Critic算法,并解释了策略梯度在强化学习中的重要性。
AlgorithmDog
2018-01-08
1.6K0
强化学习系列之二:模型相关的强化学习
本文介绍了模型相关的强化学习,包括马尔科夫决策过程、策略迭代、价值迭代等概念。以机器人找金币问题为例子,介绍了如何使用这些算法进行强化学习。最后,介绍了强化学习的总结性结尾,包括策略迭代和价值迭代等算法,以及它们在机器人找金币问题中的应用。
AlgorithmDog
2018-01-08
9090
拖拽式机器学习的爱与恨
拖拽式机器学习是一种通过图形界面拖拽组件完成机器学习任务的方法,具有易学易用等特点,适合非技术背景人员使用。但拖拽式机器学习也存在一些缺点,如不能完全实现自动化、需要人工选择特征和参数等。
AlgorithmDog
2017-12-29
1.5K0
工欲善其事必先利其器——游戏 AI 环境对比
本文探讨了游戏 AI 环境的四个主要特点:环境交互、策略、学习和适应。作者详细介绍了这些特点,并通过一个简化版的星际争霸 II 游戏来演示这些特点在实际游戏中的应用。
AlgorithmDog
2017-12-29
9830
超快的 fastText
本文介绍了 fastText,一种用于文本分类的机器学习模型,以及它的原理、优缺点和应用场景。fastText 能够处理多标签分类任务,具有训练速度快、分类效果好的特点。与传统的 word2vec 相比,fastText 考虑了词之间的组成关系,能够更好地捕捉词的语义信息。fastText 的应用场景包括文本分类、情感分析、文本相似性等。
AlgorithmDog
2017-12-29
1.2K0
Javascript 侵入机器学习?
本文介绍了基于JavaScript的机器学习类库和框架,包括ConvNetJS、MXNetJS、Deeplearning.js、TensorFlow.js、Brain.js、Node-TensorFlow等,以及基于JavaScript的机器学习应用和性能问题。
AlgorithmDog
2017-12-29
9220
动态图计算:Tensorflow 第一次清晰地在设计理念上领先
本文介绍了动态图计算在深度学习框架中的实现和优势,包括TensorFlow Fold、动态图计算和总结。
AlgorithmDog
2017-12-29
1.2K0
不平衡数据的数据处理方法
不平衡数据集是指正负样本不均衡的数据集,由于正负样本数量的不一致,导致模型对正负样本的预测能力不同,因此需要采用一些特殊的数据处理技巧来平衡数据集。本文主要介绍了一些常用的处理不平衡数据集的方法,包括欠抽样、过抽样、SMOTE等方法,并分析了这些方法在机器学习中的应用和效果。
AlgorithmDog
2017-12-29
8880
取代人类工作?人工智能也创造工作
本文介绍了人工智能、机器学习、深度学习和大数据等概念及其相关技术,并探讨了这些技术对经济活动和社会生活的影响。文章还介绍了相关技术的工作职位及其对经济活动的影响。
AlgorithmDog
2017-12-29
6860
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档