学界 | 斯坦福大学新 AI 算法,凭照片辨别出你是不是“Gay”

“有的细节,人无法辨认,不等于机器也不行;比如通过脸部的细微特征来判断这个人的性取向。”

斯坦福研究员 Michal Kosinski 如是说。AI科技评论获得消息,他和同僚 Yilun Wang 一起写了个深度学习算法:仅凭一个人的照片,就能判断他或者她,是否是同性恋。

Michal Kosinski

这个算法的准确度并不低:

AI科技评论获知只有一张正面照的情况下,有 81% 的准确率成功判断“直男”还是“Gay” ;判断是否为“百合”的准确率则是 74%。在有五张对方照片的情况下,准确率被提升到 91%(男)和 83%(女)。

相比之下,人类仅凭相貌猜测一个人性取向的准确率通常为 61%(男),54%(女)。

一张图告诉你美国的 Gay 和百合“长什么样”

两位研究人员根据该约会网站的数据样本,制作出了美国直男、直女、男同、女同四个人群的合成照片,即典型相貌:

左上为“典型美国直男”,左下为“典型美国直女”,右上为“典型的美国 Gay”,右下则是“典型的美国百合”。至于最右边的两张线条图,上图是直男、Gay 的主要面部轮廓区别(红线表示 Gay,绿线为直男);下图则是直女、百合的主要面部轮廓区别(红线为百合,绿线为直女)。

总结起来,两位研究人员在“同性恋 vs 异性恋面部轮廓区别”这个话题上,总结出的结果可概括为:

Gay 倾向于拥有被划分为“非典型男性”的特征、表情和打扮。简单来说,Gay 看起来更女性化,下颌更窄,鼻子更长,额头面积更大。

女百合则相反,一般下颌会更宽,额头更小。

研究目的

两位研究人员表示,开展该研究不是为了分辨同性恋人群。

在对方不知情的情况下获取其性取向信息,在伦理上肯定站不住脚。而在技术上,即便该算法的准确率很高,在不能消除假正例(比如把某直男错误判断为 Gay)的前提下,也不能用于在现实中辨别某个人群(“辨别”特定人群的动机,本身很值得讨论与批判)。

另外,《经济学人》指出,该研究在数据集上有一个非常大的局限性:

其数据集是来自美国某约会网站的 36630 名男用户的 130741 张照片,以及 38593 名女用户的 170360 张照片。同性恋和异性恋群体的样本大小基本一致。

众所周知,一个人在约会平台上发布的照片通常经过精挑细选,往往会化妆打扮以及对照片进行 PS。这些照片和一个人真实的生活状态应该是有区别的。因而,若把该算法应用于普通生活照片,其准确性极有可能会大幅降低。

其实,研究员 Michal Kosinski 表示,这项研究的真正目的是警告大家和政府——每个人的隐私究竟面临着多大的威胁。

更多关于这项研究的信息请访问:https://osf.io/zn79k/

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

单细胞技术—基因测序新方向

1485
来自专栏生信宝典

父爱无言!科学家首次发现来自爸爸的基因,可以通过胎儿来控制妈妈对宝宝的爱

近期,卡迪夫大学研究者发表在PLOS Biology上的一项研究发现,宝宝体内一个名为Phlda2的基因竟然能够影响妈妈是否关爱宝宝[1]!当这个来自鼠爸的印记...

1122
来自专栏大数据文摘

癌症“登月计划”需要大数据作后盾

1453
来自专栏生信小驿站

Potent immunogenicity in BRCA1-mutated patients with high-grade serous ovarian carcinoma摘要介绍

高级别浆液性卵巢癌(HGSOCs)是免疫检查点抑制剂(ICIs)效果不理想的肿瘤之一。因此必须开发可行的生物标志物,用于鉴定响应候选者并指导HGSOC患者的精确...

881
来自专栏生信技能树

2019年2月份第1周文献分享(总第53周)胃癌的类器官研究(附视频)

而且通过形态学,WES和RNA-seq数据说明了其研究团队构建的类器官可以比较好的模拟其对应的肿瘤,包括 regional heterogeneity and ...

1084
来自专栏机器之心

在癌症治疗这件事上,要不要相信人工智能?

机器之心原创 作者:虞喵喵 随深度学习技术的应用与成熟,人工智能也在不断拓展疆界。跨越传统的语音、图像、数据挖掘等强相关领域,人工智能正不断与物流、教育、金融等...

35610
来自专栏ATYUN订阅号

机器学习工具可以发现肿瘤中的突变,比现有模型更准确

癌症肿瘤不断生长和进化,它们的DNA也是如此。究竟DNA如何变化是重要的信息,因为它会影响医生的治疗决策。

1214
来自专栏生信小驿站

使用RNA-seq数据通过网络熵评估肿瘤内异质性摘要介绍

肿瘤内异质性(ITH)出现在肿瘤进展、转移和复发的不同阶段,而这些对于临床应用是重要的。我们使用来自肿瘤样品的RNA测序数据,并根据生物网络状态测量ITH水平。...

631
来自专栏生信技能树

2433个乳腺癌患者的173个基因的突变全景图

乳腺癌具有患者间与同一患者肿瘤内的基因组变异性。以患者间的异源性分类早期乳腺癌生物亚型,现在临床对乳腺癌患者通常是观察 morphological assess...

1142
来自专栏大数据文摘

盘点:幸运儿才有的8项基因突变,你有吗?

2003

扫码关注云+社区