KDD2016论文亮点解析(一)

导读:KDD2016是首屈一指的跨学科会议,它聚集了数据科学,数据挖掘,知识发现,大规模数据分析和大数据方面的研究人员和从业人员。

论文一题目:稳定流体近似的卷积神经网络

摘要

在空气动力学相关设计、分析和优化问题方面,流场是通过使用计算流体动态学(CFD)求解器进行模拟的。然而,CFD模拟通常是计算昂贵,内存要求大、且耗时的迭代过程。CFD的这些缺点,限制了设计空间探索的机会,同时也破灭了交互设计的想法。我们提出了一个通用且灵活的近似模型,用于实时预测基于卷积神经网络(CNNs)的二维或三维领域中不均匀的稳态层流体。我们探索了几何表示的替代品和CNNs的网络体系结构。

我们表明,卷积神经网络估计速度场的速度,可以比一个GPU加速的CFD求解器快两个数量级,比一个基于CPU的CFD求解器快四个数量级(代价是有着更低的错误率)。这种方法可以在设计的早期阶段,为实时的交互设计提供即时反馈。相比于空气动力学领域现存的近似模型,CNNs确保了对整个速度场的有效评估。进一步说,设计师和工程师可以在不需要训练额外更低维度替代模型的情况下,直接将CNN近似模型应用到他们的设计空间探索算法中。

关键词:卷积神经网络;替代模型;计算流体动态学;机器学习

论文作者介绍

(1)Xiaoxiao Guo

学校:密歇根大学-安娜堡分校(University of Michigan)

研究领域:机器学习(Machine Learning)人工智能(Artificial intelligence)

更多相关领域论文:

·Deep learning for real-time Atari game play using offline Monte-Carlo tree search planning(2014 )

·Action-conditional video prediction using deep networks in atari games(2015)

·Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games(2016)

(2)Wei Li

机构:Autodesk Research

研究方向:人机交互绘图,人工机器智能 ,跨科学

更多相关论文:

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

(3)Francesco Iorio

机构:Autodesk Research

研究方向:多种核心和多核心系统上软件可扩展性、混合计算、在各种高性能平台上的加速器系统,通用设计和并行算法开发。

更多相关论文:

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

论文二题目:基于图像的聚类法的结构化双随机矩阵

摘要

作为最为重要的机器学习研究主题之一,聚类算法已经被广泛应用于多种不同的领域。目前,聚类算法在科学研究和工业实践中的普遍应用业已引起高度的关注。研究者已经提出大量的聚类算法,其中备受重视的当属运用相似矩阵基于图像的聚类方法。近来的研究工作使用双随机矩阵以规范输入相似矩阵,并改善基于图像的聚类模型。尽管这种双随机矩阵能够提高聚类模型的性能,其聚类结构并未如期望中那么清晰明了。因而,需要采用后置处理步骤提取最终聚类结果,所得结果可能并不太理想。

为了解决这一问题,本文我们提出一种新型凸模型,低秩约束图像拉普拉斯矩阵,运用该种新型模型学习结构化双随机矩阵。我们的新型结构化双随机矩阵能够直接显示聚类结构,并为将要连接在一起的成对数据点的概率编码,由此来改善聚类结果。我们获得了一种高效率的优化算法,以实现新的研究目标。此外,当输入信息不同时,我们采用的方法能够分别与K均值,谱图切割模型获取联系,在文中我们也将就此话题做理论层面的讨论。

我们基于合成和基准数据集开展实验研究,以验证我们所提出的方法的性能。实证研究结果证明,我们的模型为更好地解决K均值聚类问题提供了方法和途径。把由我们的模型提供的聚类指示结果作为初始值,K均值收敛等于一个更小的目标函数值,以取得更好地聚类性能。此外,将由我们模型的聚类性能与普聚类法和相关联的双随机模型的性能进行比较。在所有的数据集中,我们的模型的性能能够与其他相关模型相媲美,甚至优于其他模型。

关键词:双随机矩阵;图像拉普拉斯矩阵学习,K均值聚类算法,谱聚类算法

论文作者介绍

(1)Xiaoqian Wang

学校:美国德州大学阿灵顿分校计算机科学与工程系博士,

主要研究领域:机器学习与计算机生物学

相关学术成果:

·Clustering and projected clustering with adapted neighbors. (Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014. P977-986.)

·Higher-order dispersion compensation to enable a 3.6 μs wavelength-maintaining delay of a 100 Gb/s DQPSK signal(Optics letters.2010.p.2985-2987.)

·The Contrained Laplacian Rank Algorithm for Graph-Based Clustering(Thirtieth AAAI Conference on Artificial Intelligence.)

(2)Feiping Nie,聂飞平,

学校:美国德州大学阿灵顿分校计算机科学与工程系教授、博导,

研究方向:机器学习以及相关应用领域(模式识别,数据挖掘,计算机视觉,图像处理,信息检索等)的研究与开发工作。

相关学术成果:

·New Primal SVM Solver with Linear Computational Cost for Big Data Classific-ations(The 31st International Conference on Machine Learning (ICML), 2014.)

·Optimal Mean Robust Principal Component Analysis(The 31st International Conference on Machine Learning (ICML), 2014.)

·Robust Distance Metric Learning via Simultaneous L1-Norm Minimization and Maximization(The 31st International Conference on Machine Learning (ICML), 2014.)

(3)Heng Huang

学校:美国德州大学阿灵顿分校计算机科学与工程教授,德克萨斯大学西南医学中心临床科学兼职教授。

主要研究方向:大数据挖掘,机器学习,数据科学,生物信息学,系统生物学,神经信息学,脑科学,计算机视觉,医学图像分析,计算的可持续性,自然语言处理等研究领域。

相关学术成果:

·Structured,Doubly Stochastic Matrix for Graph Based Clustering(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·Robust and Effective Metric Learning Using Capped Trace Norm(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·New Multi-Task Learning Model to Predict Alzheimer's Disease Cognitive Assessment(18th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2016), accepted to appear.)

论文三题目:结构化深层网络嵌入

摘要

网络嵌入是一种学习网络顶点低维表示的重要方法,旨在捕获和保存网络结构。几乎所有的现有网络嵌入方法都采用的是浅层模型。然而,由于底层的网络结构很复杂,浅层的模型不能捕获高度非线性的网状结构,得到的是次优的网络表示。因此,如何找到一种既能有效地捕获高度非线性网络结构,又能保存全局和局部结构的方法是一个公开但重要的问题。

为了解决这个问题,本文提出了一种结构化深层网络嵌入方法,即SDNE。更具体地说,我们首先提出了一种半监督深层模型,其具有多层非线性函数,从而能够捕获高度非线性网络结构。然后,我们提出,同时利用一阶近似和二阶近似来保存网络结构。二阶近似被无监督部件用来捕获全局网络结构。而一阶近似作为监督部件中的监督信息,被用来保存局部网络结构。

通过在半监督深层模型中的共同优化,我们的方法可以同时保存局部和全局网络结构,并对稀疏网络具有较好的鲁棒性。根据经验,我们在五个真实世界的网络中进行实验,包括一个语言网络,一个引用网络和三个社交网络。结果表明,相比于基准,我们的方法明显能更好地重构原始网络,并且在三个应用上有持续收获,即多标记分类,链路预测和可视化。

关键词:网络嵌入,深度学习,网络分析

论文作者介绍:

(1)Daixin Wang(王岱鑫)

学校:清华大学计算机系

(2)Peng Cui(崔鹏)

学校:清华大学计算机系副教授

研究方向:机器学习、数据挖掘、社会媒体等。

(3)Wenwu Zhu(朱文武)

学校:清华大学计算机系国家“千人计划”特聘教授、博士生导师、系副主任,国家特聘专家,国家973项目首席科学家。曾任微软亚洲研究院主任研究员,英特尔中国研究院首席科学家,及美国贝尔实验室研究员等职。IEEE Fellow、SPIE Fellow、ACM Distinguished Scientist。

研究方向:三元空间大数据计算、社会化多媒体计算、多媒体云计算、未来多媒体通信与网络等。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-08-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

机器学习两次浪潮|机器学习

第一次浪潮:浅层学习 20世纪80年代末期,用于人工神经网络的反向传播算法(也叫Back Propagation算法或者BP算法)的发明,给机器...

28660
来自专栏AI科技大本营的专栏

当这位70岁的Hinton老人还在努力推翻自己积累了30年的学术成果时,我才知道什么叫做生命力(附Capsule最全解析)

Hinton,这个以“深度学习之父”和“神经网络先驱”响彻AI领域的名字,他的一举一动,都是热点导向。 当我们远望一位顶级人物时,除了他的学术,也许,我们更...

41160
来自专栏新智元

【计算机视觉这一年】万字长文盘点近百篇代表论文、应用和市场(全文报告下载)

作者:The M Tank 编辑:胡祥杰 刘小芹 【新智元导读】The M Tank发布了一份对计算机视觉领域最近一年进展的报告《A Year in Com...

39350
来自专栏AI2ML人工智能to机器学习

易图秒懂の神经网络潜行-RNN前生

在“易图秒懂の神经网络潜行-CNN前生"里面,简述了CNN的前生Neocognitron横空出世的环境和当时的影响。 这里描述RNN的前生, 叫SRN,简单递归...

9120
来自专栏大数据文摘

学界 | 北邮夺冠CVPR 2018 DeepGlobe比赛,他们是这样做卫星图像识别的

在刚刚结束的CVPR2018: DeepGlobe Road Extraction Challenge(全球卫星图像道路提取)比赛中,北京邮电大学信息与通信工程...

39950
来自专栏测试开发架构之路

小波系数

1. 求小波变化系数时a b怎么取? 小波变换的概念是由法国从事石油信号处理的工程师J.Morlet在1974年首先提出的,通过物理的直观和信号处理的实际需要经...

40780
来自专栏大数据挖掘DT机器学习

机器学习与数据挖掘的学习路线图

CSDN:白马负金羁 说起机器学习和数据挖掘,当然两者并不完全等同。如果想简单的理清二者的关系,不妨这样来理解,机器学习应用在数据分析领域 = 数据挖掘。同理...

31540
来自专栏专知

【深度】浅析Geoffrey Hinton最近提出的Capsule计划

【导读】本文全面介绍了深度学习的来龙去脉以及Hinton最近提出的Capsule计划。希望做物理的、做数学的、做生物的、做化学的、做计算机、包括做科幻的都能看的...

30560
来自专栏机器之心

浅析Geoffrey Hinton最近提出的Capsule计划

选自知乎专栏 作者:SIY.Z 机器之心经授权转载 本文有可能是知乎上分析介绍深度学习最为全面的文章之一。希望做物理的、做数学的、做生物的、做化学的、做计算机、...

417140
来自专栏机器学习算法与Python学习

Python做文本挖掘的情感极性分析(基于情感词典的方法)

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 我们会再接再厉 成为全网优质的技术类...

64560

扫码关注云+社区

领取腾讯云代金券