微软How old 侧颜值,今天你测了吗?

话不多说,先上图!

郭德纲赤裸裸被微软鄙视了。\(^o^)/

以下是正文部分,逗个乐先!

微软靠颜值测年龄网站爆红 背后原理大揭秘

近来脸书上疯传「How Old Do I look?」 (我看起来几岁?) ,短短48个小时内,网站how-old.net便就有一百万人上传照片测试,现在平均每秒有700张照片上传而且数字尚在成长中。大部份的人都很满意自 己的测试结果,因为都比实际年龄少了许多,随著它的爆红,以致在网路上引发诸多讨论。使用者多数有以下疑问:   -这到底怎么猜的?怎么这么准?   -这到底怎么猜的?为什么我表情不一样,猜的年龄也不一样?   -这到底怎么猜的?为什么我一直被猜是女生?我明明是男的?   -这到底怎么猜的?我PO上去的照片会不会被微软拿去用?    微软表示,「我看起来几岁」是微软公司开发人员所开发的软体,当初的目的只是为了在开发者大会 (//build) 对开发者进行展示,以示范使用Azure服务建立智慧应用程式非常轻而易举。该网站使用了许多与物联网及大数据相关的技术,包括微软刚发表的脸部侦测 API (Face detection APIs)。以下透过熟知内情人士揭晓「我看起来几岁」的幕后花絮,以飨诸多好奇的网友: 1.样本从哪里来?    起初,网站开发团队只想找50个人作为样本,结果吸引了3万5千人参加 (而且2万9千人还是来自土耳其!)。不过几小时内,用户总共上传了21万张照片,网站再用Microsoft Azure 云端服务上的Face detection APIs 去找出人脸,加以分类,藉以辨识是否为同一人。根据一位微软员工表示,「我觉得很准,因为我拿我们家小猫『阿布』的脸去测,即便他很帅,网站还是测不出他 几岁」。 2.性别跟年龄怎么猜出来?   要在一两天就写出这款讨喜的App,当然不能不从研究演算法开始,也得站在 巨人的肩膀上才看得远。因此,这个开发团队使用微软的机器学习套件- Azure Machine Learning Gallery 中,由一个名为「牛津专案」(Project Oxford) 所做出的云端智能服务,包含脸部 (Face)﹑语音 (Speech)和视觉 (Vision)辨识。另外,开发团队考量使用者除了测自已跟家人的年龄外,也一定会想恶搞一番,找名人或古人的照片来测试。因此,开发团队再使用了 Bing Search API 去搜寻网路上的有趣照片供使用者发挥创意。 3.微软到底会不会把使用者上传的照片存下来?    官网上说:「我们不会储存也不会分享使用者的照片,使用者所上传的照片只供猜测其年龄和性别。只要在网站猜出年龄后,使用者所上传的照片就会从记忆体中去除。即便许多网路服务供应商都在服务条款中表明会蒐集并储存使用者的资讯,但微软选择维护使用者的资讯,除了短暂辨识照片年龄的使用时间外,微软绝不会 储存或分享使用者的照片。」 4.照片一直不断上传至网站,微软若不存起来要怎么分析、怎么学习呢?   微软回答,分 析的关键即是大数据即时分析的神妙之处!资料的汇集跟派送可以用 Azure Event Hubs ,一秒钟可进出几百万份资料,您的照片不会被存下,微软存下的是从照片萃取出来的资料。这又是什么资料呢?据说是名为「颜值」 的资料,或许就是青春的轨迹吧。所以请大家尽管放心,您的照片绝不会被留下来。 5.微软是如何抽取出这些像是性别、年龄资料做即时呈现呢?   微软:这种即时反馈又得靠工具-Azure Stream Analytics 可以让开发者用简单的SQL query 语法捕捉到即时的串流资讯,立马回报!

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2015-05-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

快了10万倍!DNA纳米机器人技术背后的原理?

据外媒报道,慕尼黑工业大学(TUM)的科学家基于分子研发出一种DNA纳米机器人(具体来说,就是一只机械臂),当技术发展成熟后,它就可以被用于完成“即时任务”。 ...

2807
来自专栏ThoughtWorks

也谈“精益”|洞见

精益对大家来说都不陌生了,无论是最开始提取的丰田制造原型,还是后面延伸出来的物流供应链管理,再到近两年颇为流行的精益创业(Lean Startup),都在不停刷...

3417
来自专栏张俊红

拆掉你思维的8堵墙

来源:书籍《拆掉思维的墙》 总第43篇 ▼ ? 所谓思维的墙就是使我们我们思维局限东西,本篇从安全感、有趣与无趣、心智模式等8个方面具体阐述了我们在思维方面的一...

3666
来自专栏玉树芝兰

你到底该信谁?

2016年,微信覆盖人口超过了8个亿,这意味着什么?意味着我们被刷屏的几率越来越高了。

861
来自专栏吉浦迅科技

有哪些主流的科学计算是可以利用GPU加速?这一篇让你看明白!

科学计算是指应用计算机处理科学研究和工程技术中所遇到的数学计算。在现代科学和工程技术中,经常会遇到大量复杂的数学计算问题,这些问题用一般的计算工具来解决非常困难...

5147
来自专栏大数据文摘

为什么编程这么难?!

1423
来自专栏大数据文摘

BBC最新纪录片数据之欢(上):美女数学家讲述数据的前世今生

1412
来自专栏华章科技

购物篮分析:绝不只是“啤酒与尿布”!

之前的两篇实用性文章《网购评论是真是假?文本挖掘告诉你》和《大数据助力东北小吃铺满血复活》发表之后,许多读者表示对其中的“购物篮分析”很感兴趣,希望我们能多做介...

1886
来自专栏Web 开发

最近PC界事件有感

去电脑城,直接入手AMD Athlon64 3000+,主板是技嘉的一块C51(C51也是一款经典芯片,集成显卡的能力较以前有了很大的提升),还有一块双敏的76...

770
来自专栏企鹅号快讯

微软Everyday AI发布会:四大工具把AI带到你身边

昨天,微软在旧金山举办了一场“Everyday AI”发布会,会上主要发布了必应搜索引擎、微软小娜、Office 365和Seeing AI四种工具和服务的更新...

3658

扫码关注云+社区

领取腾讯云代金券