AI 淘金热 | 机器学习创业机会在哪里？

新智元

发布于 2018-03-13 17:44:21

9770

发布于 2018-03-13 17:44:21

文章被收录于专栏：新智元

机器学习淘金热正在到来！Libby Kinsey 是 Nesta 资本的投资经理，关注技术创新已经有 12 年。她根据自己的观察，总结出这波淘金热的创业机会，其中包括硬件、算法、数据、行业、情感、安全等各领域分析。

Libby Kinsey：机器学习和人工智能技术正快速进入到数据驱动的业务中，变得无所不在。我选择了一些大公司还没有占领的领域。这些是没有标注主权的领土，如果我认为这是下一个杀手级应用，那么我就会准备去做！

铁镐和铁锹策略

在加利福尼亚州的淘金热中，卖铁锹的人先富起来了，而机器学习的铁镐和铁锹（Pick and Shovel）会是硬件、数据输入以及算法等。

1、显而易见的是，机器学习的算法开发者已经不可避免的选择了开源道路。当然这也有例外。去年，牛津大学申报了一份专利文件，是关于 BP 算法的替代方案，名字叫做 Feedback Alignment Algorithm（p14）。我想知道他们会怎样进行商业化。

高品质的 SaaS 产品，能够让人们更容易使用学习算法，在这方面能够找到有需求的用户，一个典型例子是把前沿的深度学习带入到数据库的 MetaMind。另一个我很喜欢的项目是 The Automatic Statistician，它能够使用贝叶斯推论找到能最好解释数据的模型。另一个公司叫做 The Curious AI Company，它的第一笔风险投资是让它做垃圾分类（虽然很不性感但能赚钱），而它现在宣布要把软件作为一个工具包销售。

2、大公司已经拥有超大型的数据集，而且还会获得更多（例如 IBM 最近用 15 亿美元收购了 The Weather Channel，获得了数据）。数据一直就像低悬的水果（跳一跳就能摘到），例如社会和经济数据，但是在那些很难获得和很难进行标签的数据，依然有很多机会。面部表情的情感数据集就在这个类别中，还有 Pallas Ludens 的端对端注释服务，Opensensors.io 给公开来源的传感数据增加权重。基因组和医疗图像的数据呢？这让位于棘手的隐私问题。如果能进行，就能提供个性化的治疗和照顾以及更好的诊断。关于这一点，我们可以看看 Genomics England 如何在产业参与中获得利益。

3、在硬件的前端层面，GPUs 使得跨越式发展得以可能（NVIDIA GeForce GTX Titan 能让我拥有从音频中识别蝙蝠声音的能力）。

蝙蝠声音的声谱图（下图）和ConvNet预测（上图）

但这些处理器都是为图像设计的。关于高效的机器学习的下一个巨大变革，会来自于专门给机器学习设计的芯片。Graphcore 把它们叫做智能芯片组。同时，Nervana Systems、Teradeep（Yann LeCun 是它的顾问）和 Thinci 也在制造自己的定制硬件。

那些培训公司（Udacity、Coursera、Kaggle 等）和代码库、项目管理公司（Atlassian）也在这个类别中。

探索情感

这个领域有很多创业公司，但是针对它们的服务却非常不周到。引用 MIT 情感计算组的一段话：

“情感是至关重要的人类经验，影响认知、感知，以及每天的任务诸如学习、交流甚至是理性决定。但是情感在很大程度上被技术忽略了，并且往往创造出让人沮丧的经历。”

这是一些图片，用来训练微表情的测试，感谢JB！

第一个任务是训练模型，用以识别人类的情感。Emotient、RealEyes 和 Affectivaall 使用脸部表情来推断情绪，现在主要还是出于市场的需求。Cogito 和 Beyond Verbalconcentrate 致力于通过声音理解情感，以完成市场研究报告和带来更好的顾客体验。

然后，模拟有情感的行为，和人类通过自然的方式来交互。Jibo 这个友善的机器人就是很好的例子，仅仅使用一双眼睛来表达自己的情绪。肯定会有便宜的玩具，能够自适应和回答问题（像治疗机器人 Paro，但用途是游戏），虽然我现在还没有找到。这样的好处是能够避免像玩具机器人 Toy Talk 和 Mattel 的 Hello Barbie TM 那样，对谈话隐私有很多的担忧，因为语音数据会存储在终端，而不是云端网络。

其他的应用包括个性化治疗、教育、冲突解决、谈判训练和适应性游戏。这些任务非常适合机器学习来完成，因为情感体验是主观和可变的。

进入专业领域

我会留下一个悬念，机器学习是会让我们变成多余的人，还是能够协助人类在完成很多专业的任务（这能给用户带来更多价值）？

这些技术会做什么事情呢？以法律专业为例子吧。Ravn Systems 会自动检查（重复的、无聊的）法律文件；Bitproof’s Peter 是人工智能法律助手，能够请求签名，生成合同和确认文档； Premonition.ai 能够使用数据审查在判决中出现的无意识偏见。

还有相似的工具提供给征兵、保险、金融管理等，这会让专人人士花更多的时间到更有满足感的工作中，例如练习判断、决定、客户接待等。

医疗革命

正如流行观点所说，药物的发明是昂贵而有风险的。但是，如果能使用数据找到更好的目标，以此减少风险呢？这是 Stratified Medical 的假设，使用深度学习技术进行医药研发。

在其他方面，Enlitic 和 Zebra Medical 使用深度学习技术做精准的诊断和决策支持工具，而 Your.MD 已经和英国国民健康服务机构合作，通过手机应用提供个性化的医疗协助。

更好的搜索

“那部电影有一个我姐姐喜欢的德国演员，和外星人有关，有真正的朋克配乐，那部电影是？”

搜索需要处理不准确的、主观的和个性化的任务，就和人类做的一样。它需要从各种嘈杂的内容中，帮助我们找到并确认和我们相关的内容。这涉及到学习环境和内容属性。实际上，这是一个关于自己的博客，这里也有很多案例：

1、Clarify 能够通过自己的 API，让视频和音频变得能够搜索。这相当于在文本中找到关键词，然后判断是否相关。这是一个有趣的节省时间应用。

2、Lumi 会通过你的浏览历史学习你的口味，提供相关和当下的内容。这是为不知足的好奇心提供的服务。

3、Yossarian Lives 是一个搜索引擎，可以做侧链，就像人类可以做的一样，来帮助获得创造力。

4、EyeEm 把机器学习技术应用在了摄影市场，它能够在没有标签的情况下，搜寻到有“快乐”、“下雨的伦敦”等特性的图片。而 Cortexica 和 Sentient Technologies/Shoes.com 使用相似的技术，来完善产品的搜索。

搜索相关的一个重要方面，是可信程度，这样来自社交媒体和新闻的内容才能被确认和相信。有人做这些事情么？

计算机安全

计算机安全的机器学习技术，现在已经吸引了很多风险投资（例如 Lookout 2.82 亿美元的投资，Vectra Networks 的 7800 万美元投资，Darktrace 的 4000 万美元投资，以及 Cybereason 的 8900 万美元投资），但最近的一些坏消息（例如最近 TalkTalk 的客户数据被黑）也显示了，这个市场远远没被满足。

如同其他火热的领域，这些产品表明上看起来都差不多，很难进行细致的区分。我需要在这个领域做更多的工作，并且近距离观察网络安全领域的创业孵化器 Cyber London。

有那么多的应用领域，我们很难只专注在很少的几个。我已经错过了很多喜欢的公司，只是因为它不符合这里的类别设置。当这篇文章已经被发布的时候，我也将不可避免的改变关于目录的想法，尤其是我下周将会参加 NIPS。

在新的数据集上开发和应用的速度是如此之快，让机器学习变成了让人兴奋的领域。尤其是，伦敦如今也有真正意义的上升势头，有接近世界一流的学术机构（帝国理工、伦敦大学学院、牛津和剑桥），已经建立起来的创业生态系统（关于机器学习的创业孵化器），以及目标用户群——金融、法律和政府。

所以告诉我，我还有什么遗漏的？

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2015-12-04，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能