AI 淘金热 | 机器学习创业机会在哪里?

机器学习淘金热正在到来!Libby Kinsey 是 Nesta 资本的投资经理,关注技术创新已经有 12 年。她根据自己的观察,总结出这波淘金热的创业机会,其中包括硬件、算法、数据、行业、情感、安全等各领域分析。

Libby Kinsey:机器学习和人工智能技术正快速进入到数据驱动的业务中,变得无所不在。我选择了一些大公司还没有占领的领域。这些是没有标注主权的领土,如果我认为这是下一个杀手级应用,那么我就会准备去做!

铁镐和铁锹策略

在加利福尼亚州的淘金热中,卖铁锹的人先富起来了,而机器学习的铁镐和铁锹(Pick and Shovel)会是硬件、数据输入以及算法等。

1、显而易见的是,机器学习的算法开发者已经不可避免的选择了开源道路。当然这也有例外。去年,牛津大学申报了一份专利文件,是关于 BP 算法的替代方案,名字叫做 Feedback Alignment Algorithm(p14)。我想知道他们会怎样进行商业化。

高品质的 SaaS 产品,能够让人们更容易使用学习算法,在这方面能够找到有需求的用户,一个典型例子是把前沿的深度学习带入到数据库的 MetaMind。另一个我很喜欢的项目是 The Automatic Statistician,它能够使用贝叶斯推论找到能最好解释数据的模型。另一个公司叫做 The Curious AI Company,它的第一笔风险投资是让它做垃圾分类(虽然很不性感但能赚钱),而它现在宣布要把软件作为一个工具包销售。

2、大公司已经拥有超大型的数据集,而且还会获得更多(例如 IBM 最近用 15 亿美元收购了 The Weather Channel,获得了数据)。数据一直就像低悬的水果(跳一跳就能摘到),例如社会和经济数据,但是在那些很难获得和很难进行标签的数据,依然有很多机会。面部表情的情感数据集就在这个类别中,还有 Pallas Ludens 的端对端注释服务,Opensensors.io 给公开来源的传感数据增加权重。 基因组和医疗图像的数据呢?这让位于棘手的隐私问题。如果能进行,就能提供个性化的治疗和照顾以及更好的诊断。关于这一点,我们可以看看 Genomics England 如何在产业参与中获得利益。

3、在硬件的前端层面,GPUs 使得跨越式发展得以可能(NVIDIA GeForce GTX Titan 能让我拥有从音频中识别蝙蝠声音的能力)。

蝙蝠声音的声谱图(下图)和ConvNet预测(上图)

但这些处理器都是为图像设计的。关于高效的机器学习的下一个巨大变革,会来自于专门给机器学习设计的芯片。Graphcore 把它们叫做智能芯片组。同时,Nervana Systems、Teradeep(Yann LeCun 是它的顾问)和 Thinci 也在制造自己的定制硬件。

那些培训公司(Udacity、Coursera、Kaggle 等)和代码库、项目管理公司(Atlassian)也在这个类别中。

探索情感

这个领域有很多创业公司,但是针对它们的服务却非常不周到。引用 MIT 情感计算组的一段话:

“情感是至关重要的人类经验,影响认知、感知,以及每天的任务诸如学习、交流甚至是理性决定。但是情感在很大程度上被技术忽略了,并且往往创造出让人沮丧的经历。”

这是一些图片,用来训练微表情的测试,感谢JB!

第一个任务是训练模型,用以识别人类的情感。Emotient、RealEyes 和 Affectivaall 使用脸部表情来推断情绪,现在主要还是出于市场的需求。Cogito 和 Beyond Verbalconcentrate 致力于通过声音理解情感,以完成市场研究报告和带来更好的顾客体验。

然后,模拟有情感的行为,和人类通过自然的方式来交互。Jibo 这个友善的机器人就是很好的例子,仅仅使用一双眼睛来表达自己的情绪。肯定会有便宜的玩具,能够自适应和回答问题(像治疗机器人 Paro,但用途是游戏),虽然我现在还没有找到。这样的好处是能够避免像玩具机器人 Toy Talk 和 Mattel 的 Hello Barbie TM 那样,对谈话隐私有很多的担忧,因为语音数据会存储在终端,而不是云端网络。

其他的应用包括个性化治疗、教育、冲突解决、谈判训练和适应性游戏。这些任务非常适合机器学习来完成,因为情感体验是主观和可变的。

进入专业领域

我会留下一个悬念,机器学习是会让我们变成多余的人,还是能够协助人类在完成很多专业的任务(这能给用户带来更多价值)?

这些技术会做什么事情呢?以法律专业为例子吧。Ravn Systems 会自动检查(重复的、无聊的)法律文件;Bitproof’s Peter 是人工智能法律助手,能够请求签名,生成合同和确认文档; Premonition.ai 能够使用数据审查在判决中出现的无意识偏见。

还有相似的工具提供给征兵、保险、金融管理等,这会让专人人士花更多的时间到更有满足感的工作中,例如练习判断、决定、客户接待等。

医疗革命

正如流行观点所说,药物的发明是昂贵而有风险的。但是,如果能使用数据找到更好的目标,以此减少风险呢?这是 Stratified Medical 的假设,使用深度学习技术进行医药研发。

在其他方面,Enlitic 和 Zebra Medical 使用深度学习技术做精准的诊断和决策支持工具,而 Your.MD 已经和英国国民健康服务机构合作,通过手机应用提供个性化的医疗协助。

更好的搜索

“那部电影有一个我姐姐喜欢的德国演员,和外星人有关,有真正的朋克配乐,那部电影是?”

搜索需要处理不准确的、主观的和个性化的任务,就和人类做的一样。它需要从各种嘈杂的内容中,帮助我们找到并确认和我们相关的内容。这涉及到学习环境和内容属性。实际上,这是一个关于自己的博客,这里也有很多案例:

1、Clarify 能够通过自己的 API,让视频和音频变得能够搜索。这相当于在文本中找到关键词,然后判断是否相关。这是一个有趣的节省时间应用。

2、Lumi 会通过你的浏览历史学习你的口味,提供相关和当下的内容。这是为不知足的好奇心提供的服务。

3、Yossarian Lives 是一个搜索引擎,可以做侧链,就像人类可以做的一样,来帮助获得创造力。

4、EyeEm 把机器学习技术应用在了摄影市场,它能够在没有标签的情况下,搜寻到有“快乐”、“下雨的伦敦”等特性的图片。而 Cortexica 和 Sentient Technologies/Shoes.com 使用相似的技术,来完善产品的搜索。

搜索相关的一个重要方面,是可信程度,这样来自社交媒体和新闻的内容才能被确认和相信。有人做这些事情么?

计算机安全

计算机安全的机器学习技术,现在已经吸引了很多风险投资(例如 Lookout 2.82 亿美元的投资,Vectra Networks 的 7800 万美元投资,Darktrace 的 4000 万美元投资,以及 Cybereason 的 8900 万美元投资),但最近的一些坏消息(例如最近 TalkTalk 的客户数据被黑)也显示了,这个市场远远没被满足。

如同其他火热的领域,这些产品表明上看起来都差不多,很难进行细致的区分。我需要在这个领域做更多的工作,并且近距离观察网络安全领域的创业孵化器 Cyber London。

有那么多的应用领域,我们很难只专注在很少的几个。我已经错过了很多喜欢的公司,只是因为它不符合这里的类别设置。当这篇文章已经被发布的时候,我也将不可避免的改变关于目录的想法,尤其是我下周将会参加 NIPS。

在新的数据集上开发和应用的速度是如此之快,让机器学习变成了让人兴奋的领域。尤其是,伦敦如今也有真正意义的上升势头,有接近世界一流的学术机构(帝国理工、伦敦大学学院、牛津和剑桥),已经建立起来的创业生态系统(关于机器学习的创业孵化器),以及目标用户群——金融、法律和政府。

所以告诉我,我还有什么遗漏的?

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-12-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

情感识别技术变革人机交互体验

最近俄亥俄州立大学的认知研究科学家们在人脸识别技术和机器学习方面有了突破性进展,能够让电脑比人类更准确地读取面部表情进而识别情感状态。这种"情感识别处理"技术的...

3557
来自专栏AI科技大本营的专栏

CCAI2017 | 智能金融论坛:听大佬们讲人工智能在金融领域的那些事儿

文/CSDN焦燕 整理/AI科技大本营(rgznai100) 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集...

3459
来自专栏大数据文摘

2015年科技预测:深度学习和机器智能将席卷世界

1386
来自专栏新智元

DeepMind 通用人工智能新进展:理解AI 智能体间的合作

DeepMind 官方博客今日更新,介绍了理解AI 智能体间合作原理的最新研究: “我们采用深层多代理强化学习来模拟AI 智能体间合作的出现。新的连续社会困境的...

3778
来自专栏AI科技大本营的专栏

机器学习和洗衣机的关系?

【AI科技大本营导读】机器学习是目前计算机领域最火的技术之一,从电商到自动驾驶,都有机器学习的应用。但是,当大众谈起机器学习时,却往往以 AI(人工智能) 代称...

692
来自专栏灯塔大数据

原创译文 | 微软放大招!面部识别无歧视,Face API更加精准识别人类肤色

微软近日在博客文章中宣布了Face API的重大更新,它改进了面部识别平台识别不同人种性别的能力,此前,这一直是计算机视觉平台面临的挑战。

764
来自专栏腾讯技术工程官方号的专栏

世界视频编码器大赛结果出炉,腾讯香农编码器跻身世界一流

? 2018年9月5日,世界视频编码器大赛成绩揭晓,腾讯自主研发的编码软件“香农编码器”(Tencent Shannon Encoder,简称T265)首次参...

1475
来自专栏新智元

【统览整个学术圈】上交大发布知识图谱AceKG,超1亿实体,近100G数据量

【新智元导读】由上海交通大学王新兵教授和张伟楠教授指导的Acemap团队知识图谱小组,近日发布了学术知识图谱AceKG,提供了近100G大小的数据集,为每个实体...

3776
来自专栏大数据文摘

谷歌为什么要开放TensorFlow

1936
来自专栏AI科技大本营的专栏

掌握哪些机器学习工具更受企业青睐?

根据 GitHub 活跃数、开发人员使用人数、在招聘描述中出现的频率等综合数据分析,Google的 TensorFlow 仍稳居第一,被广大网友一致认为非常适合...

702

扫码关注云+社区