专栏首页新智元AI 淘金热 | 机器学习创业机会在哪里?

AI 淘金热 | 机器学习创业机会在哪里?

机器学习淘金热正在到来!Libby Kinsey 是 Nesta 资本的投资经理,关注技术创新已经有 12 年。她根据自己的观察,总结出这波淘金热的创业机会,其中包括硬件、算法、数据、行业、情感、安全等各领域分析。

Libby Kinsey:机器学习和人工智能技术正快速进入到数据驱动的业务中,变得无所不在。我选择了一些大公司还没有占领的领域。这些是没有标注主权的领土,如果我认为这是下一个杀手级应用,那么我就会准备去做!

铁镐和铁锹策略

在加利福尼亚州的淘金热中,卖铁锹的人先富起来了,而机器学习的铁镐和铁锹(Pick and Shovel)会是硬件、数据输入以及算法等。

1、显而易见的是,机器学习的算法开发者已经不可避免的选择了开源道路。当然这也有例外。去年,牛津大学申报了一份专利文件,是关于 BP 算法的替代方案,名字叫做 Feedback Alignment Algorithm(p14)。我想知道他们会怎样进行商业化。

高品质的 SaaS 产品,能够让人们更容易使用学习算法,在这方面能够找到有需求的用户,一个典型例子是把前沿的深度学习带入到数据库的 MetaMind。另一个我很喜欢的项目是 The Automatic Statistician,它能够使用贝叶斯推论找到能最好解释数据的模型。另一个公司叫做 The Curious AI Company,它的第一笔风险投资是让它做垃圾分类(虽然很不性感但能赚钱),而它现在宣布要把软件作为一个工具包销售。

2、大公司已经拥有超大型的数据集,而且还会获得更多(例如 IBM 最近用 15 亿美元收购了 The Weather Channel,获得了数据)。数据一直就像低悬的水果(跳一跳就能摘到),例如社会和经济数据,但是在那些很难获得和很难进行标签的数据,依然有很多机会。面部表情的情感数据集就在这个类别中,还有 Pallas Ludens 的端对端注释服务,Opensensors.io 给公开来源的传感数据增加权重。 基因组和医疗图像的数据呢?这让位于棘手的隐私问题。如果能进行,就能提供个性化的治疗和照顾以及更好的诊断。关于这一点,我们可以看看 Genomics England 如何在产业参与中获得利益。

3、在硬件的前端层面,GPUs 使得跨越式发展得以可能(NVIDIA GeForce GTX Titan 能让我拥有从音频中识别蝙蝠声音的能力)。

蝙蝠声音的声谱图(下图)和ConvNet预测(上图)

但这些处理器都是为图像设计的。关于高效的机器学习的下一个巨大变革,会来自于专门给机器学习设计的芯片。Graphcore 把它们叫做智能芯片组。同时,Nervana Systems、Teradeep(Yann LeCun 是它的顾问)和 Thinci 也在制造自己的定制硬件。

那些培训公司(Udacity、Coursera、Kaggle 等)和代码库、项目管理公司(Atlassian)也在这个类别中。

探索情感

这个领域有很多创业公司,但是针对它们的服务却非常不周到。引用 MIT 情感计算组的一段话:

“情感是至关重要的人类经验,影响认知、感知,以及每天的任务诸如学习、交流甚至是理性决定。但是情感在很大程度上被技术忽略了,并且往往创造出让人沮丧的经历。”

这是一些图片,用来训练微表情的测试,感谢JB!

第一个任务是训练模型,用以识别人类的情感。Emotient、RealEyes 和 Affectivaall 使用脸部表情来推断情绪,现在主要还是出于市场的需求。Cogito 和 Beyond Verbalconcentrate 致力于通过声音理解情感,以完成市场研究报告和带来更好的顾客体验。

然后,模拟有情感的行为,和人类通过自然的方式来交互。Jibo 这个友善的机器人就是很好的例子,仅仅使用一双眼睛来表达自己的情绪。肯定会有便宜的玩具,能够自适应和回答问题(像治疗机器人 Paro,但用途是游戏),虽然我现在还没有找到。这样的好处是能够避免像玩具机器人 Toy Talk 和 Mattel 的 Hello Barbie TM 那样,对谈话隐私有很多的担忧,因为语音数据会存储在终端,而不是云端网络。

其他的应用包括个性化治疗、教育、冲突解决、谈判训练和适应性游戏。这些任务非常适合机器学习来完成,因为情感体验是主观和可变的。

进入专业领域

我会留下一个悬念,机器学习是会让我们变成多余的人,还是能够协助人类在完成很多专业的任务(这能给用户带来更多价值)?

这些技术会做什么事情呢?以法律专业为例子吧。Ravn Systems 会自动检查(重复的、无聊的)法律文件;Bitproof’s Peter 是人工智能法律助手,能够请求签名,生成合同和确认文档; Premonition.ai 能够使用数据审查在判决中出现的无意识偏见。

还有相似的工具提供给征兵、保险、金融管理等,这会让专人人士花更多的时间到更有满足感的工作中,例如练习判断、决定、客户接待等。

医疗革命

正如流行观点所说,药物的发明是昂贵而有风险的。但是,如果能使用数据找到更好的目标,以此减少风险呢?这是 Stratified Medical 的假设,使用深度学习技术进行医药研发。

在其他方面,Enlitic 和 Zebra Medical 使用深度学习技术做精准的诊断和决策支持工具,而 Your.MD 已经和英国国民健康服务机构合作,通过手机应用提供个性化的医疗协助。

更好的搜索

“那部电影有一个我姐姐喜欢的德国演员,和外星人有关,有真正的朋克配乐,那部电影是?”

搜索需要处理不准确的、主观的和个性化的任务,就和人类做的一样。它需要从各种嘈杂的内容中,帮助我们找到并确认和我们相关的内容。这涉及到学习环境和内容属性。实际上,这是一个关于自己的博客,这里也有很多案例:

1、Clarify 能够通过自己的 API,让视频和音频变得能够搜索。这相当于在文本中找到关键词,然后判断是否相关。这是一个有趣的节省时间应用。

2、Lumi 会通过你的浏览历史学习你的口味,提供相关和当下的内容。这是为不知足的好奇心提供的服务。

3、Yossarian Lives 是一个搜索引擎,可以做侧链,就像人类可以做的一样,来帮助获得创造力。

4、EyeEm 把机器学习技术应用在了摄影市场,它能够在没有标签的情况下,搜寻到有“快乐”、“下雨的伦敦”等特性的图片。而 Cortexica 和 Sentient Technologies/Shoes.com 使用相似的技术,来完善产品的搜索。

搜索相关的一个重要方面,是可信程度,这样来自社交媒体和新闻的内容才能被确认和相信。有人做这些事情么?

计算机安全

计算机安全的机器学习技术,现在已经吸引了很多风险投资(例如 Lookout 2.82 亿美元的投资,Vectra Networks 的 7800 万美元投资,Darktrace 的 4000 万美元投资,以及 Cybereason 的 8900 万美元投资),但最近的一些坏消息(例如最近 TalkTalk 的客户数据被黑)也显示了,这个市场远远没被满足。

如同其他火热的领域,这些产品表明上看起来都差不多,很难进行细致的区分。我需要在这个领域做更多的工作,并且近距离观察网络安全领域的创业孵化器 Cyber London。

有那么多的应用领域,我们很难只专注在很少的几个。我已经错过了很多喜欢的公司,只是因为它不符合这里的类别设置。当这篇文章已经被发布的时候,我也将不可避免的改变关于目录的想法,尤其是我下周将会参加 NIPS。

在新的数据集上开发和应用的速度是如此之快,让机器学习变成了让人兴奋的领域。尤其是,伦敦如今也有真正意义的上升势头,有接近世界一流的学术机构(帝国理工、伦敦大学学院、牛津和剑桥),已经建立起来的创业生态系统(关于机器学习的创业孵化器),以及目标用户群——金融、法律和政府。

所以告诉我,我还有什么遗漏的?

本文分享自微信公众号 - 新智元(AI_era),作者:Libby Kinsey

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-12-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【机器学习爆款App技术解读】如何用“摄像头秒解数独”

    【新智元导读】最近一款名叫 Magic Sudoku(魔法数独)的 App 火了,这款 App 能够“用摄像头解数独”,使用了计算机视觉、机器学习和增强现实技术...

    新智元
  • 【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法

    【新智元导读】近日,微软 AI 首席科学家邓力加盟对冲基金公司 Citadel 再次引发了人们对于机器学习技术应用于金融投资领域的关注。J.P.摩根最新的28...

    新智元
  • 百度开源自动驾驶人工智能模型 Road Hackers,张亚勤CES专访

    【新智元导读】 今天,在CES上,百度智能汽车宣布推出高级自动驾驶人工智能模型Road Hackers,并表示将基于此模型的百度自动驾驶训练数据对外开放,首期包...

    新智元
  • 【机器学习】机器学习创业机会在哪里?

    机器学习淘金热正在到来!Libby Kinsey 是 Nesta 资本的投资经理,关注技术创新已经有 12 年。她根据自己的观察,总结出这波淘金热的创业机会,其...

    陆勤_数据人网
  • 数据科学的前6大语言

    2012年的《哈佛商业评论》(Harvard business review)正确地将数据科学列为“21世纪最性感的工作”。即使在这份报告发表6年后的今天,《商...

    程序你好
  • 2017年 数聚中国 战略签约——中国7家大数据联盟签约组合

    数据猿导读 随着大数据产业发展的逐步深化以及行业格局的延展与增速日益显效,全国各城市间的大数据行业协会/同盟对于业务对接平台的需求应势而生。国内主要城市的大数据...

    数据猿
  • 数据科学的六大语言

    2012年哈佛商业评论将数据科学称为“21世纪最性感的工作。”即使在报告发布六年后,商业评论仍然得到证实。随着人工智能和机器学习的出现, “数据科学”在精通技术...

    February
  • 机器学习模型的“可解释性”到底有多重要?

    【导读】我们知道,近年来机器学习,特别是深度学习在各个领域取得了骄人的成绩,其受追捧的程度可谓是舍我其谁,但是有很多机器学习模型(深度学习首当其冲)的可解释性不...

    WZEARW
  • 重磅消息|2016中国大数据企业排行榜发布

    <数据猿导读> 7月14日,由首席数据官联盟集全国数万名业内精英梳理的《2016中国大数据企业排行榜》V2.0版正式亮相。该排行榜收集和整理了国内700余家大数...

    数据猿
  • eBay开发用于识别信用卡欺诈案例的AI系统

    信用卡欺诈比人们想象的更常见。2014年,在1760万起执法身份盗窃事件中,86%的受害者报告与现有信用卡或银行账户有关的欺诈行为。事实上,根据联邦贸易委员会的...

    AiTechYun

扫码关注云+社区

领取腾讯云代金券