首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >这个学习算法的名字是什么?

这个学习算法的名字是什么?
EN

Stack Overflow用户
提问于 2013-12-12 01:39:10
回答 3查看 197关注 0票数 0

我为一个AI玩家设计了一个学习算法,它尝试了不同的方法来赢得游戏,然后继续使用具有最高胜率的方法。如果最高胜率的方法开始失败,它将进入第二高胜率的方法,等等。

我需要写一篇关于学习算法的文章,它可以被称为什么?

EN

回答 3

Stack Overflow用户

发布于 2013-12-12 12:01:06

该算法没有名字,因为与针对此类问题的现有算法相比,它并不是特别好(无意冒犯)。

您正在“解决”的是Multi-armed Bandit问题。“不同的获胜方法”是你的老虎机,而你的“胜率”是每台老虎机的赔率。因为你的对手是另一个人,他们可能会改变他们的策略,你必须处理最好的老虎机可能“开始输”的可能性。这是一个对抗性的场景。有许多来自不同角度/场景的关于这个主题的论文和算法。它研究得很好,人们仍然对它感兴趣。

我想这是为某个班级项目报告准备的。我简单地称之为“我的启发式方法”,因为它就是这样的。

票数 5
EN

Stack Overflow用户

发布于 2013-12-12 01:43:23

这是一种经典的试错方法。TryError,TryAndError,TaE,Try&Error-o-马季奇,选择你更喜欢的。

票数 1
EN

Stack Overflow用户

发布于 2013-12-12 01:43:48

这可能取决于您是如何实现它的。这听起来有点像一个多类逻辑回归算法。这将评估每个类的给定结果的概率,然后选择最佳概率,但这也可以使用神经网络或各种其他算法来实现。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20526147

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档