首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用带有概率的Vowpal wabbit作为标签来预测概率

使用带有概率的Vowpal wabbit作为标签来预测概率
EN

Stack Overflow用户
提问于 2018-02-08 19:54:56
回答 1查看 285关注 0票数 1

我正在尝试使用Vowpal Wabbit来预测给定的统计数据集的概率。我的txt文件如下所示:

代码语言:javascript
运行
复制
0.22 | Features1
0.28 | Features2

现在,给定这个例子,我想预测Features3的标签(概率)。我尝试使用逻辑回归:

代码语言:javascript
运行
复制
vw -d ds.vw.txt -f model.p --loss_function=logistic --link=logistic -p probs.txt

但得到的错误是:

代码语言:javascript
运行
复制
You are using label 0.00110011 not -1 or 1 as loss function expects!
You are using label 0.00559702 not -1 or 1 as loss function expects!

等等。

如何使用这些统计数据作为标签来预测概率?

EN

回答 1

Stack Overflow用户

发布于 2018-02-10 15:03:04

要预测连续标签,您需要使用以下损失函数之一:

代码语言:javascript
运行
复制
--loss_function squared    # optimizes for min loss vs mean
--loss_function quantile   # optimizes for min loss vs median

--loss_function squaredvw的默认值,所以您可以省略它。

您可以使用的另一个技巧是通过使用函数(2* [-1, 1] - 1)将中点0.5映射到0.0,从而将概率范围映射到概率。然后,您可以使用--loss_function logistic,它需要二进制标签(-11),但遵循abs(probability)作为浮点权重的标签:

代码语言:javascript
运行
复制
1 0.22 | features...
-1 0.28 | features...

对于您的特定数据,这可能会更好,也可能不会更好(您必须保留一些数据,并测试不同模型的准确性。)

关于二元结果的背景:vw“起始点”(即null或初始模型)到处都是0.0权重。这就是为什么在进行逻辑回归时,negative, positive标签必须分别为-1, 1 (而不是0, 1)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48684894

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档