小数据学习对 AI 究竟有着怎样的影响? | CCAI 2017

近几年来,得益于大数据的积累、计算能力的提升,深度学习从学术到工程领域均取得了非常显著的发展与突破,尤其是诸如图像识别、语音识别等实际场景应用。但是,依赖于海量的训练数据、灵活的模型、足够的运算能力以及足以对抗维度灾难的先验经验,从很大程度上来讲妨碍了深度学习技术更为广泛的运用。为此,在全球范围内,众多人工智能领域的学术大师及业界专家上下求索,也由此催生了小数据学习(Learning from limited information),通过更少的数据以及更确定的方法让 AI 学习更加高效。

然而什么是小数据?机器怎样从小数据中学习?小数据学习将从哪些方面改变人工智能的研究与应用?在即将于 7 月 22 - 23 日举行的中国人工智能大会(CCAI 2017)上,特别邀请到日本理化学研究所先进智能研究中心主任 Masashi Sugiyama,现场为所有参会者一解小数据学习之惑,并分享其团队在监督弱化分类方面的最新研究进展。在会前,CSDN 记者特别采访了 Masashi Sugiyama 教授,接下来,让我们一起先睹为快。

Masashi Sugiyama 是日本理化学研究所先进智能项目组主任( Director of RIKEN Advanced Intelligence Project)。RIKEN 成立于 1917 年,是日本最大的综合研究机构,其中,由 Masashi Sugiyama 领导的先进智能项目组成立于 2016 年,主要着眼于研发下一代 AI 技术,如小数据学习、因果推理(Causal inference)、不确定性学习(Learning with uncertainty)以及假设检验等,同时,还有加速医学、材料科学、制造业的科研进程,解决基础设施管理、社会抗灾能力、老年医疗保健等社会问题。而 Masashi Sugiyama 教授本人的研究领域则包括机器学习的理论和算法(如协变量适应、密度比预估和强化学习等),及其在实际问题中的应用。

CSDN:什么是小数据学习?为什么要使用小数据学习?如何实现?

Masashi Sugiyama:虽然现在大数据学习仍是主流,但在很多应用领域,收集到足够机器用来学习的庞大的数据是非常昂贵的。在这种情况下,使用小数据进行学习是一个理想的解决方式。但也有它的弊端,因为当进行小数据学习时,我们需要目标领域中强大的先验知识作为支撑,过多先验知识的介入意味着牺牲掉机器学习的灵活性。所以使用有限信息进行学习的精髓在于,使用领域知识之外的相对便宜的数据进行学习。

CSDN:若小数据学习能够成功,将对哪些 AI 领域造成改变,进而对哪些行业产生影响?

Masashi Sugiyama:利用小数据进行学习是大数据学习的母集,所以说它一方面可以解决大数据学习不能解决的问题,另一方面在大数据学习已经得以应用的领域也能有所发挥,因为使用小数据学习能够在避免使用昂贵数据的同时达到更优的效果。

CSDN:您和您的团队在小数据学习方面已经取得了哪些进展?

Masashi Sugiyama:多样性对于小数据学习至关重要,因为对于不同的应用场景,收集数据的局限性是不同的。我们正在研发一种通用的算法使其解决机器学习过程中的不同问题,例如将很多不同种类的未标注数据集进行分类、将标注与未标注数据进行分类、半监督学习中的分类问题、充分标注的数据的分类问题等。

CSDN:日本的科研机构更倾向于哪些 AI 技术及应用的研究?哪些 AI 应用在日本已经落地?

Masashi Sugiyama:日本的机器学习研究人员更多地关注基础研究,当然,同时也会有一些人在科学及工程领域从事应用科学相关的研究工作。在基础研究与应用之间存在很大的鸿沟,如何搭建鸿沟上的桥梁至关重要。所幸,这些建桥的工作在一些领域已经逐渐展开,例如对癌症及老年痴呆的研究、再生医学、制造业、基础设施管理以及抗灾能力提升的研究等方面。

CSDN:您认为当前 AI 技术发展的瓶颈在那?并请展望 AI 未来的发展方向。

Masashi Sugiyama:私密性、安全性、以及伦理问题会成为人工智能系统发展的瓶颈。在 AI 技术发展之外,如何分析及管理 AI 可能带来的社会问题也是需要重视的方面。

CSDN:在本届 CCAI 现场,您将带来的演讲主要关于哪些方面?希望观众从中收获怎样的启发?

Masashi Sugiyama:我的演讲题目是《弱监督学习的最新研究进展》,在演讲中我将介绍我们对于弱监督学习下的分类问题的研究成果,包括将两种类别的无标签数据进行分类、将有标签与无标签数据进行分类、一个对于半监督分类问题的通用方法、以及对于有标签数据的分类。最后,我将简单介绍日本理化学研究所先进智能项目组(RIKEN AIP)。

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2017-07-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

帮AI摆脱“智障”之名,NLP这条路还有多远?

自然语言处理(NLP)是人工智能(AI)的一个分支,其目标是让计算机能够像人类一样理解、处理和生成自然语言。自然语言,又称人类语言,一般以文字或文本的形式存在于...

1362
来自专栏AI科技评论

关于gcForest这篇论文 我们请教了周志华教授以下几个问题

文章由宗仁,谷磊联合采访,AI科技评论团队整理。 AI科技评论按:3月3日下午,AI科技评论参加了由中国人工智能学会(CAAI)主办的【人工智能前沿讲习班】,本...

2314
来自专栏企鹅号快讯

深度学习如何落地安防应用?

今年,市场研究&咨询公司GrandViewResearch发布了一份深度学习市场分析报告。报告表明,2016年全球深度学习市场估值为2.72亿美元,其在自动驾驶...

2819
来自专栏新智元

百度徐伟:深度学习存在3大瓶颈,如何打造通用人工智能研究平台?

【新智元导读】百度IDL实验室杰出科学家徐伟关于“通用人工智能研究”的演讲,关于通用人工智能,此前大多数讨论都集中在相信不相信,可不可以实现阶段。但是,徐伟在本...

37410
来自专栏AI科技评论

学界 | MIT和Google让AI获得多种感官协调能力

AI科技评论消息 根据MIT和Google研究人员近期发表的论文,他们正在训练AI将图像、声音和文字等多方面信息匹配起来。 在语音识别、图像识别以及下围棋等单项...

3437
来自专栏AI科技评论

观点 | UC伯克利教授迈克尔·乔丹采访:人类对机器学习期待过高,机器学习的发展还应当更广阔

AI 科技评论按:2017年6月21日至22日,腾讯·云+未来峰会在深圳举行。在主题为“机器学习:创新视角,直面挑战”的演讲 - AI 科技评论后,AI 科技评...

2986
来自专栏数据的力量

京东DNN Lab首席科学家:用深度学习搞定80%的客服工作

1773
来自专栏AI科技评论

UC 伯克利优化理论教授谈深度学习:为了可解释性,我们可能需要牺牲一些模型表现

AI 科技评论按:在人工智能的浪潮之下,以深度学习为首的机器学习方法迅速席卷了各个领域,给许多问题带来了全新的解决方案(当然同时也带来了新的问题等待解决)。 除...

34515
来自专栏AI科技评论

学界|汤晓鸥:深度学习有哪三个要素,以及在中国创业是怎样一种感受?

雷锋网按:5月20日,由中国计算机学会(CCF)主办,Xtecher协办的2017 CCF青年精英大会在北京国家会议中心举行。中国工程院院士赵沁平、香港中文大学...

3645
来自专栏新智元

【重磅】谷歌大脑官方年度报告:TensorFlow、机器学习、自然语言处理(27 篇顶会论文)

【新智元导读】谷歌大脑负责人 Jeff Dean 今天在谷歌博客刊文,从论文发表、TensorFlow 到推广机器学习,全面总结团队 2016 年的工作,并分享...

28810

扫码关注云+社区