前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【机器学习】机器学习创业机会在哪里?

【机器学习】机器学习创业机会在哪里?

作者头像
陆勤_数据人网
发布2018-02-27 15:15:31
1.3K0
发布2018-02-27 15:15:31
举报

机器学习淘金热正在到来!Libby Kinsey 是 Nesta 资本的投资经理,关注技术创新已经有 12 年。她根据自己的观察,总结出这波淘金热的创业机会,其中包括硬件、算法、数据、行业、情感、安全等各领域分析。

Libby Kinsey:机器学习和人工智能技术正快速进入到数据驱动的业务中,变得无所不在。我选择了一些大公司还没有占领的领域。这些是没有标注主权的领土,如果我认为这是下一个杀手级应用,那么我就会准备去做!

铁镐和铁锹策略

在加利福尼亚州的淘金热中,卖铁锹的人先富起来了,而机器学习的铁镐和铁锹(Pick and Shovel)会是硬件、数据输入以及算法等。

1、显而易见的是,机器学习的算法开发者已经不可避免的选择了开源道路。当然这也有例外。去年,牛津大学申报了一份专利文件,是关于 BP 算法的替代方案,名字叫做 Feedback Alignment Algorithm(p14)。我想知道他们会怎样进行商业化。

高品质的 SaaS 产品,能够让人们更容易使用学习算法,在这方面能够找到有需求的用户,一个典型例子是把前沿的深度学习带入到数据库的 MetaMind。另一个我很喜欢的项目是 The Automatic Statistician,它能够使用贝叶斯推论找到能最好解释数据的模型。另一个公司叫做 The Curious AI Company,它的第一笔风险投资是让它做垃圾分类(虽然很不性感但能赚钱),而它现在宣布要把软件作为一个工具包销售。

2、大公司已经拥有超大型的数据集,而且还会获得更多(例如 IBM 最近用 15 亿美元收购了 The Weather Channel,获得了数据)。数据一直就像低悬的水果(跳一跳就能摘到),例如社会和经济数据,但是在那些很难获得和很难进行标签的数据,依然有很多机会。面部表情的情感数据集就在这个类别中,还有 Pallas Ludens 的端对端注释服务,Opensensors.io 给公开来源的传感数据增加权重。 基因组和医疗图像的数据呢?这让位于棘手的隐私问题。如果能进行,就能提供个性化的治疗和照顾以及更好的诊断。关于这一点,我们可以看看 Genomics England 如何在产业参与中获得利益。

3、在硬件的前端层面,GPUs 使得跨越式发展得以可能(NVIDIA GeForce GTX Titan 能让我拥有从音频中识别蝙蝠声音的能力)。

蝙蝠声音的声谱图(下图)和ConvNet预测(上图)

但这些处理器都是为图像设计的。关于高效的机器学习的下一个巨大变革,会来自于专门给机器学习设计的芯片。Graphcore 把它们叫做智能芯片组。同时,Nervana Systems、Teradeep(Yann LeCun 是它的顾问)和 Thinci 也在制造自己的定制硬件。

那些培训公司(Udacity、Coursera、Kaggle 等)和代码库、项目管理公司(Atlassian)也在这个类别中。

探索情感

这个领域有很多创业公司,但是针对它们的服务却非常不周到。引用 MIT 情感计算组的一段话:

“情感是至关重要的人类经验,影响认知、感知,以及每天的任务诸如学习、交流甚至是理性决定。但是情感在很大程度上被技术忽略了,并且往往创造出让人沮丧的经历。”

这是一些图片,用来训练微表情的测试,感谢JB!

第一个任务是训练模型,用以识别人类的情感。Emotient、RealEyes 和 Affectivaall 使用脸部表情来推断情绪,现在主要还是出于市场的需求。Cogito 和 Beyond Verbalconcentrate 致力于通过声音理解情感,以完成市场研究报告和带来更好的顾客体验。

然后,模拟有情感的行为,和人类通过自然的方式来交互。Jibo 这个友善的机器人就是很好的例子,仅仅使用一双眼睛来表达自己的情绪。肯定会有便宜的玩具,能够自适应和回答问题(像治疗机器人 Paro,但用途是游戏),虽然我现在还没有找到。这样的好处是能够避免像玩具机器人 Toy Talk 和 Mattel 的 Hello Barbie TM 那样,对谈话隐私有很多的担忧,因为语音数据会存储在终端,而不是云端网络。

其他的应用包括个性化治疗、教育、冲突解决、谈判训练和适应性游戏。这些任务非常适合机器学习来完成,因为情感体验是主观和可变的。

进入专业领域

我会留下一个悬念,机器学习是会让我们变成多余的人,还是能够协助人类在完成很多专业的任务(这能给用户带来更多价值)?

这些技术会做什么事情呢?以法律专业为例子吧。Ravn Systems 会自动检查(重复的、无聊的)法律文件;Bitproof’s Peter 是人工智能法律助手,能够请求签名,生成合同和确认文档; Premonition.ai 能够使用数据审查在判决中出现的无意识偏见。

还有相似的工具提供给征兵、保险、金融管理等,这会让专人人士花更多的时间到更有满足感的工作中,例如练习判断、决定、客户接待等。

医疗革命

正如流行观点所说,药物的发明是昂贵而有风险的。但是,如果能使用数据找到更好的目标,以此减少风险呢?这是 Stratified Medical 的假设,使用深度学习技术进行医药研发。

在其他方面,Enlitic 和 Zebra Medical 使用深度学习技术做精准的诊断和决策支持工具,而 Your.MD 已经和英国国民健康服务机构合作,通过手机应用提供个性化的医疗协助。

更好的搜索

“那部电影有一个我姐姐喜欢的德国演员,和外星人有关,有真正的朋克配乐,那部电影是?”

搜索需要处理不准确的、主观的和个性化的任务,就和人类做的一样。它需要从各种嘈杂的内容中,帮助我们找到并确认和我们相关的内容。这涉及到学习环境和内容属性。实际上,这是一个关于自己的博客,这里也有很多案例:

1、Clarify 能够通过自己的 API,让视频和音频变得能够搜索。这相当于在文本中找到关键词,然后判断是否相关。这是一个有趣的节省时间应用。

2、Lumi 会通过你的浏览历史学习你的口味,提供相关和当下的内容。这是为不知足的好奇心提供的服务。

3、Yossarian Lives 是一个搜索引擎,可以做侧链,就像人类可以做的一样,来帮助获得创造力。

4、EyeEm 把机器学习技术应用在了摄影市场,它能够在没有标签的情况下,搜寻到有“快乐”、“下雨的伦敦”等特性的图片。而 Cortexica 和 Sentient Technologies/Shoes.com 使用相似的技术,来完善产品的搜索。

搜索相关的一个重要方面,是可信程度,这样来自社交媒体和新闻的内容才能被确认和相信。有人做这些事情么?

计算机安全

计算机安全的机器学习技术,现在已经吸引了很多风险投资(例如 Lookout 2.82 亿美元的投资,Vectra Networks 的 7800 万美元投资,Darktrace 的 4000 万美元投资,以及 Cybereason 的 8900 万美元投资),但最近的一些坏消息(例如最近 TalkTalk 的客户数据被黑)也显示了,这个市场远远没被满足。

如同其他火热的领域,这些产品表明上看起来都差不多,很难进行细致的区分。我需要在这个领域做更多的工作,并且近距离观察网络安全领域的创业孵化器 Cyber London。

有那么多的应用领域,我们很难只专注在很少的几个。我已经错过了很多喜欢的公司,只是因为它不符合这里的类别设置。当这篇文章已经被发布的时候,我也将不可避免的改变关于目录的想法,尤其是我下周将会参加 NIPS。

在新的数据集上开发和应用的速度是如此之快,让机器学习变成了让人兴奋的领域。尤其是,伦敦如今也有真正意义的上升势头,有接近世界一流的学术机构(帝国理工、伦敦大学学院、牛津和剑桥),已经建立起来的创业生态系统(关于机器学习的创业孵化器),以及目标用户群——金融、法律和政府。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
项目管理
CODING 项目管理(CODING Project Management,CODING-PM)工具包含迭代管理、需求管理、任务管理、缺陷管理、文件/wiki 等功能,适用于研发团队进行项目管理或敏捷开发实践。结合敏捷研发理念,帮助您对产品进行迭代规划,让每个迭代中的需求、任务、缺陷无障碍沟通流转, 让项目开发过程风险可控,达到可持续性快速迭代。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档