前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >悬赏17万:美国“知乎”的沙雕问题,需要AI来识别

悬赏17万:美国“知乎”的沙雕问题,需要AI来识别

作者头像
量子位
发布2019-04-24 15:26:54
3630
发布2019-04-24 15:26:54
举报
文章被收录于专栏:量子位量子位
智栗 发自 凹非寺 量子位 出品 | 公众号 QbitAI

知乎上面,时常会出现一些“睿智”的问题。

比如,一颗陨石如何挑选自己的归宿:

又比如,公交车的职业操守如何:

这么可爱的问题,并非知乎独享。

知乎的大前辈Quora上面,也有一些脑回路别具一格的人类:

我的MacBook Air重量是2.3磅。 下载的东西多了之后,它会不会越来越重? 下载的小电影多了之后,它会不会爆炸?

既然,大家都喜欢这样可爱的问题,怎么才从千千万万个问题里面,把它们找出来呢?

重赏之下,必有勇夫。

Quora拿出25,000美元作为奖金,举办了一场Kaggle比赛:

有毒问题在哪里?

比赛内容之一,就是让AI识别出建立在虚假前提上的问题,简称虚假问题 (Insincere Questions) 。

所以,怎样算是虚假前提

还是举起开头的栗子,“陨石坠地前,那陨石坑已经存在”,这是个合格的虚假前提了。

第二,AI要识别的对象还包括,打着提问的旗号,实则在表达观点,这样的问题。

例如,对某一人群表现出歧视、攻击或者侮辱的问题:

第三,若是为给别人带来冲击力 (不为寻求答案) 而使用了性内容,也会成为缉拿对象。净化网络环境,也是保护祖国的花朵。

来自山下智博

以上概括起来,任务就是揪出那些并非真心发问而另有用意的问题。

Quora说,站内已经在用机器学习与人类一同完成这项任务了,不过依然需要大家的帮忙。所以才为选手们提供了不错的回报:

冠军,12,000美元 亚军,8,000美元 季军,5,000美元

如何在一夜之间学会编程?(急,在线等)

比赛用的数据,就是Quora里面的问题。官方提供的数据集,分为训练集合测试集。训练集里有超过130万个问题,测试集里有5.6万个问题。信息包括:问题ID,问题本身,以及问题是否虚假。

在此之外,选手不可以使用其他数据来训练模型。

比赛成绩,是由模型的F1分数决定的:

这里,问题只有两种分类,一是虚假,二是正常。F1分就是衡量二分类模型准确度的指标,兼顾了精确率 (Precision) 和召回率 (Recall) 。

这场为期3个月的比赛,一周前已经启动。现在,已经有超过750支队伍参与其中,排行榜也一直在变化。

窃以为,解锁不可描述的问题,应该是一项愉悦身心的活动。

那么,想要参加比赛的同学注意一下:

报名截止日期为2019年1月29日。 提交截止日期为2019年2月5日。

参赛地址在这里: https://www.kaggle.com/c/quora-insincere-questions-classification

有问,必有答

最后的最后,母交车到底能不能吸引公交车?

有理有据,令人信服。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 有毒问题在哪里?
  • 有问,必有答
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档