我在这里看到了一些机器学习的问题,所以我想我应该发布一个相关的问题:假设我有一个随机生成的食物列表,其中包括主菜、甜点和饮料。例如鸡肉、芝士蛋糕、橙汁。用户会从1-5的范围内对他们个人喜欢这个组合的程度进行排名。在reach分级之后,将出现另一组随机的食物。
我的问题是,我将使用什么机器学习技术/算法来预测用户将根据其所有以前的数据对随机生成的集合进行排名?本质上,使用他们的观点来预测他们对新食品集的评级。有什么网站/书籍可能会有帮助吗?
发布于 2012-11-20 08:01:07
您已经说明了一个回归问题,因为您正在尝试预测一个连续的数值。
对于每个数据实例,您可以提取特征并关联一个值(1-5)。特征可以是在用餐期间存在一个菜(例如has_cheesecake,has_orange_juice),其中每个特征都是一个布尔值。假设有N个可能的菜肴;那么每顿饭都是一个数据实例(也称为特征向量),具有N个特征和一个关联值。下面是一个使用N=12的示例,其中最后(第13)列是值。
0 0 0 1 1 0 0 0 1 0 0 0 5
1 0 0 1 0 1 0 0 0 0 0 0 3
0 0 0 0 0 0 1 1 0 0 0 1 4然后,您可以将其输入到像Weka这样的机器学习程序中,它将为您创建一个回归模型。然后,当您想要预测用户对新餐点的排名时,您可以输入一个新的向量,其中最后一列是未知的,如下所示:
0 0 1 0 0 0 1 0 0 0 0 1 ?软件会给你返回值,比如3.9。
发布于 2012-11-20 19:54:32
你问的基本上是sentiment detection,它已经变得非常流行,用于预测用户对产品的态度。这里有一个seminal paper,这取决于你在学术上的倾向。
你可以把这看作是一个回归问题,但很多时候人们忽略了类之间存在顺序关系的事实。如果你对这顿饭中的食物除了它们的名字之外没有更多的信息,我不确定我不能指望你在这方面做得很好。如果可能的话,你应该寻找课程的特征表示,以提高你预测价值的能力。
发布于 2012-11-20 05:32:45
我会研究运筹学,因为它通常是一个最小化或最大化的问题。
https://stackoverflow.com/questions/13462546
复制相似问题