Machine Learning at Quora(简要版)

自从我一年前加入Quora,我一直在谈论在这里的所有的非常有趣的关于机器学习的挑战。然而,当我上周参加并在MLConf发言时,我很惊讶,许多和我谈过的人仍然没有听说我们在做什么。 在这篇文章中,我将简要总结一些好的要点,让你了解更多。

在Quora我们在关心什么?

Quora的使命是“分享和增长世界的知识”。 我们相信,有很多知识仍然在人们的头脑,我们想把它带到互联网中,然后提供一种方式,一种不仅有效率,而且有吸引力的方式。我们通过使用问答的方式来做到这一点,但重要的是要知道,这只是我们完成我们使命的选择的载体。使Quora独特的事情之一是我们关心三个正交维度:相关性,需求和质量。

我们关心相关性,因为我们想确保每个人都能获得他们最感兴趣的知识。我们关心需求,因为我们想确保许多人的问题都能得到好答案。 最后,但非常重要的是,我们关心质量,因为我们相信质量是知识的内在属性。 “坏质量知识”是没有知识。这三个维度很重要,因为它们是我们将在我们的产品功能以及机器学习模型中进行优化的。

数据

您可以将Quora视为知识库,有主题的兴趣网络和社交网络之间的混合。这创建了一个非常丰富的数据和数据之间关系的生态系统,我们可以在我们的机器学习方法中使用。 看看下面的图表。

这总结了不同的数据和数据之间的关系。 例如,用户可以关注和认可给定主题上的另一用户。 用户也可以关注主题。用户还可以通过写入或上传/下载等来处理问题和答案,诸如此类。这个复杂的生态系统提供了很多机会去利用数据来改进我们的产品和我们的用户体验。为了做到这一点,我们首先需要了解已经存在的不同效果。 我们的数据科学团队在这些研究中有一些有趣的推送。

机器学习产品解决办法

我们在产品的许多不同的部分使用了机器学习。 这些是在后台使用机器学习的一些产品功能:

• 答案排名

• 反馈排名

• 首页推荐

• 用户推荐

• 邮件识别

• Ask2Answer

• 重复问题

• 相关问题

• Spam/moderation

• Trending now

• ...

这些解决方案中的每一个都需要不同类型的数据用于训练和测试以及特征生成。我们还需要定义不同的目标函数和指标来优化。 当然,我们需要使用不同的机器学习模型。

机器学习模型

如上所述,我们需要不同的模型来实现我们感兴趣的机器学习产品功能。其中一些将需要学习排序方法,而其他将需要一个二元分类器。这里是我们使用的一些机器学习模型列表:

  • Logistic Regression
  • Elastic Nets
  • Gradient Boosted Decision Trees
  • Random Forests
  • (Deep) Neural Networks
  • LambdaMART
  • Matrix Factorization
  • LDA
  • ...

要清楚,我们使用这么多的模型不是吹嘘我们知道多少模型。 我们这样做是因为事实证明他们最终只在某些情况下工作的最好。随机森林和渐变增强的决策树是可以互换的,但如果一个在一种情况下是最好的,为什么不使用它?并且它还不增加系统的复杂性。

原文发布于微信公众号 - 鸿的学习笔记(shujuxuexizhilu)

原文发表时间:2016-11-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人人都是极客

第一课:人工智能在嵌入式中的机会

嵌入式人工智能的机会 深度学习、机器学习、人工智能可以说是当下最火爆的字眼,随着 AlphaGo 的一炮走红,仿佛人人都谈论着人工智能,说话不带 DL、CNN ...

3696
来自专栏量子位

像人一样脑补世界!DeepMind历时一年半搞出GQN,登上Science

1905
来自专栏钱塘大数据

【干货】不容错过的 30 个机器学习视频、教程&课程

导读:下面是 Analytics Vidhya 网站发表的文章,汇集了 2016 年机器学习经典视频、教材和课程,分类整理,初学者、进阶级还是资深研究员,都可以...

85811
来自专栏PPV课数据科学社区

写给大家看的机器学习书(第一篇)

作者:徐晗曦 来源:https://zhuanlan.zhihu.com/p/25328686 ? 1. 前言 这个世界不缺少专家,我只是期待他们中有一位能把...

37211
来自专栏ThoughtWorks

建立属于你的智能客服 | 洞见

背景 很多人问,对话式交互系统就是语音交互么?当然不是。语音交互本身真的算不上新概念,大家可能都给银行打过电话,“普通话服务请按1,英文服务请按2……返回上一层...

3197
来自专栏AI科技大本营的专栏

​产品经理如何学机器学习——一篇以产品为中心的机器学习概论

我现在常常听说产品负责人/经理、技术经理和设计师通过网上课程学习机器学习。我一直鼓励这种做法——实际上,我本人曾学习过那些课程(并且在博客上发表了相关内容)。 ...

3968
来自专栏ATYUN订阅号

【指南】非技术人员的机器学习指南:如何轻松地进入机器学习

世界末日 首先,我们听说机器人正在做蓝领工作。 ? 然后,我们发现白领工作也不安全。 ? 在我们恐慌我们将要失业,我们发现这些机器人正在背后议论我们。 ? 可能...

3666
来自专栏专知

2017年深度学习总结:文本和语音应用

【导读】近日,大数据科学家Volodymyr Fedak发布一篇博客,总结了2017年深度学习的发展:深度学习在文本和语音领域的应用。深度学习从发展伊始就在图像...

3624
来自专栏量子位

VR电影首次实现风格迁移,这要归功于AI

李林 编译整理 量子位 报道 | 公众号 QbitAI ? 制作一部VR沉浸式电影时,AI能发挥怎样的作用? Facebook做出了一些尝试,把基于对抗生成网络...

3598
来自专栏机器人网

最受欢迎开源深度学习框架榜单:这个排名让人想起~~

Keras作者Fran?ois Chollet刚刚在Twitter贴出一张图片,是近三个月来arXiv上提到的深度学习开源框架排行: ? TensorFlow排...

8587

扫码关注云+社区