首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >哪种机器学习算法适用于此场景

哪种机器学习算法适用于此场景
EN

Stack Overflow用户
提问于 2013-02-21 22:05:40
回答 7查看 660关注 0票数 2

我有一个PHP/MySQL应用程序,它存储症状和适当的药物。我应该使用什么机器学习算法来预测任何症状的药物。另外,训练集的格式是什么?

EN

回答 7

Stack Overflow用户

发布于 2013-02-21 22:11:36

在ML中,对于这种情况没有“最佳解决方案”,几乎总是有这种方法/数据满足我的需求?因此,尝试使用简单的ML技术(例如决策树),如果它不起作用,可以尝试更复杂的方法。如果不起作用,请尝试更改数据,...

票数 2
EN

Stack Overflow用户

发布于 2013-02-22 04:28:40

那么你的数据最终会是这样的:

代码语言:javascript
运行
复制
row_id  symptom_x symptom_y degree_of_symptom_z ... best_drug

1       false     true      0.8                     drug_x
2       true      null      0.0                     drug_q

您将使用统计分类器根据症状学习最好的药物。然后你会给它新的症状,它会指示最好的药物。

可能会有很多可用的症状,所以算法需要能够处理许多列。

我会从支持向量机开始,然后再尝试Logistic回归。

查看RapidMiner。

票数 2
EN

Stack Overflow用户

发布于 2013-02-21 22:21:34

我认为你最好的选择就是找出一个在你的环境中集成良好的可靠的库。

一般而言:

  • 好的数据几乎总是有帮助的:例如,预处理你的数据,提取你认为对人类也有用的特征(“摘要”)。
  • 避免无用的特征:喜欢几个好的特征,而不是许多可能略有帮助的棘手的特征。
  • 要知道,不太可能有一个神奇的黑盒:你需要调整你的算法。大多数ML算法都有几个所谓的“超参数”,这些参数会影响算法的工作方式;例如,学习率、平滑度、窗口大小等。
  • 由于它不是一个黑盒,因此可以找到一些机器学习的介绍,至少对这些技术是如何以及为什么工作有一个基本的了解。从ML算法中很容易得到完全的胡言乱语,所以至少对这些东西是如何工作的有一些想法是很重要的,这样你就可以首先设置一些非常简单的问题,比如最近邻居( appropriately.
  • Try )(你需要一个距离度量)。这可能已经足够了。

虽然我最近没有用过,但我相信如果NN不够好,SVM仍然可能是你最好的选择。这不是时髦的新东西,但它们通常都很好,不需要太多的调整。但是,使用调优良好的弱算法(即,包含您理解的文档,并且可以尝试大量超参数变化的实现)几乎总是比调优不佳的强算法更好。当然,如果你真的不知道自己在做什么。

换句话说:保持简单,并确保在特征选择阶段使用大量常识。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15004240

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档