KDD2016论文亮点解析(一)

导读:KDD2016是首屈一指的跨学科会议,它聚集了数据科学,数据挖掘,知识发现,大规模数据分析和大数据方面的研究人员和从业人员。

论文一题目:稳定流体近似的卷积神经网络

摘要

在空气动力学相关设计、分析和优化问题方面,流场是通过使用计算流体动态学(CFD)求解器进行模拟的。然而,CFD模拟通常是计算昂贵,内存要求大、且耗时的迭代过程。CFD的这些缺点,限制了设计空间探索的机会,同时也破灭了交互设计的想法。我们提出了一个通用且灵活的近似模型,用于实时预测基于卷积神经网络(CNNs)的二维或三维领域中不均匀的稳态层流体。我们探索了几何表示的替代品和CNNs的网络体系结构。

我们表明,卷积神经网络估计速度场的速度,可以比一个GPU加速的CFD求解器快两个数量级,比一个基于CPU的CFD求解器快四个数量级(代价是有着更低的错误率)。这种方法可以在设计的早期阶段,为实时的交互设计提供即时反馈。相比于空气动力学领域现存的近似模型,CNNs确保了对整个速度场的有效评估。进一步说,设计师和工程师可以在不需要训练额外更低维度替代模型的情况下,直接将CNN近似模型应用到他们的设计空间探索算法中。

关键词:卷积神经网络;替代模型;计算流体动态学;机器学习

论文作者介绍

(1)Xiaoxiao Guo

学校:密歇根大学-安娜堡分校(University of Michigan)

研究领域:机器学习(Machine Learning)人工智能(Artificial intelligence)

更多相关领域论文:

·Deep learning for real-time Atari game play using offline Monte-Carlo tree search planning(2014 )

·Action-conditional video prediction using deep networks in atari games(2015)

·Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games(2016)

(2)Wei Li

机构:Autodesk Research

研究方向:人机交互绘图,人工机器智能 ,跨科学

更多相关论文:

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

(3)Francesco Iorio

机构:Autodesk Research

研究方向:多种核心和多核心系统上软件可扩展性、混合计算、在各种高性能平台上的加速器系统,通用设计和并行算法开发。

更多相关论文:

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

论文二题目:基于图像的聚类法的结构化双随机矩阵

摘要

作为最为重要的机器学习研究主题之一,聚类算法已经被广泛应用于多种不同的领域。目前,聚类算法在科学研究和工业实践中的普遍应用业已引起高度的关注。研究者已经提出大量的聚类算法,其中备受重视的当属运用相似矩阵基于图像的聚类方法。近来的研究工作使用双随机矩阵以规范输入相似矩阵,并改善基于图像的聚类模型。尽管这种双随机矩阵能够提高聚类模型的性能,其聚类结构并未如期望中那么清晰明了。因而,需要采用后置处理步骤提取最终聚类结果,所得结果可能并不太理想。

为了解决这一问题,本文我们提出一种新型凸模型,低秩约束图像拉普拉斯矩阵,运用该种新型模型学习结构化双随机矩阵。我们的新型结构化双随机矩阵能够直接显示聚类结构,并为将要连接在一起的成对数据点的概率编码,由此来改善聚类结果。我们获得了一种高效率的优化算法,以实现新的研究目标。此外,当输入信息不同时,我们采用的方法能够分别与K均值,谱图切割模型获取联系,在文中我们也将就此话题做理论层面的讨论。

我们基于合成和基准数据集开展实验研究,以验证我们所提出的方法的性能。实证研究结果证明,我们的模型为更好地解决K均值聚类问题提供了方法和途径。把由我们的模型提供的聚类指示结果作为初始值,K均值收敛等于一个更小的目标函数值,以取得更好地聚类性能。此外,将由我们模型的聚类性能与普聚类法和相关联的双随机模型的性能进行比较。在所有的数据集中,我们的模型的性能能够与其他相关模型相媲美,甚至优于其他模型。

关键词:双随机矩阵;图像拉普拉斯矩阵学习,K均值聚类算法,谱聚类算法

论文作者介绍

(1)Xiaoqian Wang

学校:美国德州大学阿灵顿分校计算机科学与工程系博士,

主要研究领域:机器学习与计算机生物学

相关学术成果:

·Clustering and projected clustering with adapted neighbors. (Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014. P977-986.)

·Higher-order dispersion compensation to enable a 3.6 μs wavelength-maintaining delay of a 100 Gb/s DQPSK signal(Optics letters.2010.p.2985-2987.)

·The Contrained Laplacian Rank Algorithm for Graph-Based Clustering(Thirtieth AAAI Conference on Artificial Intelligence.)

(2)Feiping Nie,聂飞平,

学校:美国德州大学阿灵顿分校计算机科学与工程系教授、博导,

研究方向:机器学习以及相关应用领域(模式识别,数据挖掘,计算机视觉,图像处理,信息检索等)的研究与开发工作。

相关学术成果:

·New Primal SVM Solver with Linear Computational Cost for Big Data Classific-ations(The 31st International Conference on Machine Learning (ICML), 2014.)

·Optimal Mean Robust Principal Component Analysis(The 31st International Conference on Machine Learning (ICML), 2014.)

·Robust Distance Metric Learning via Simultaneous L1-Norm Minimization and Maximization(The 31st International Conference on Machine Learning (ICML), 2014.)

(3)Heng Huang

学校:美国德州大学阿灵顿分校计算机科学与工程教授,德克萨斯大学西南医学中心临床科学兼职教授。

主要研究方向:大数据挖掘,机器学习,数据科学,生物信息学,系统生物学,神经信息学,脑科学,计算机视觉,医学图像分析,计算的可持续性,自然语言处理等研究领域。

相关学术成果:

·Structured,Doubly Stochastic Matrix for Graph Based Clustering(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·Robust and Effective Metric Learning Using Capped Trace Norm(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·New Multi-Task Learning Model to Predict Alzheimer's Disease Cognitive Assessment(18th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2016), accepted to appear.)

论文三题目:结构化深层网络嵌入

摘要

网络嵌入是一种学习网络顶点低维表示的重要方法,旨在捕获和保存网络结构。几乎所有的现有网络嵌入方法都采用的是浅层模型。然而,由于底层的网络结构很复杂,浅层的模型不能捕获高度非线性的网状结构,得到的是次优的网络表示。因此,如何找到一种既能有效地捕获高度非线性网络结构,又能保存全局和局部结构的方法是一个公开但重要的问题。

为了解决这个问题,本文提出了一种结构化深层网络嵌入方法,即SDNE。更具体地说,我们首先提出了一种半监督深层模型,其具有多层非线性函数,从而能够捕获高度非线性网络结构。然后,我们提出,同时利用一阶近似和二阶近似来保存网络结构。二阶近似被无监督部件用来捕获全局网络结构。而一阶近似作为监督部件中的监督信息,被用来保存局部网络结构。

通过在半监督深层模型中的共同优化,我们的方法可以同时保存局部和全局网络结构,并对稀疏网络具有较好的鲁棒性。根据经验,我们在五个真实世界的网络中进行实验,包括一个语言网络,一个引用网络和三个社交网络。结果表明,相比于基准,我们的方法明显能更好地重构原始网络,并且在三个应用上有持续收获,即多标记分类,链路预测和可视化。

关键词:网络嵌入,深度学习,网络分析

论文作者介绍:

(1)Daixin Wang(王岱鑫)

学校:清华大学计算机系

(2)Peng Cui(崔鹏)

学校:清华大学计算机系副教授

研究方向:机器学习、数据挖掘、社会媒体等。

(3)Wenwu Zhu(朱文武)

学校:清华大学计算机系国家“千人计划”特聘教授、博士生导师、系副主任,国家特聘专家,国家973项目首席科学家。曾任微软亚洲研究院主任研究员,英特尔中国研究院首席科学家,及美国贝尔实验室研究员等职。IEEE Fellow、SPIE Fellow、ACM Distinguished Scientist。

研究方向:三元空间大数据计算、社会化多媒体计算、多媒体云计算、未来多媒体通信与网络等。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-08-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CVer

[计算机视觉论文速递] 2018-03-20

通知:这篇推文有13篇论文速递信息,涉及图像分割、SLAM、显著性、深度估计、车辆计数等方向 往期回顾 [计算机视觉] 入门学习资料 [计算机视觉论文速递] ...

3878
来自专栏机器之心

观点 | 争议、流派,有关GAN的一切:Ian Goodfellow Q&A

选自fermatslibrary 机器之心编译 参与:思源、李泽南 自 2014 年提出以来,生成对抗网络(GAN)已经成为深度学习领域里最为重要的方向之一。其...

3498
来自专栏量子位

汤晓鸥为CNN搓了一颗大力丸

是重新搭一个模型呢,还是拿来新数据重新调参,在这个已经训练好的模型上搞迁移学习呢?

540
来自专栏大数据文摘

一文看懂生成式对抗网络GANs:介绍指南及前景展望

1644
来自专栏AI科技评论

CVPR 2018 中国论文分享会之 「GAN 与合成」

AI 科技评论按:2018 年 5 月 11 日,由微软亚洲研究院、清华大学媒体与网络技术教育部-微软重点实验室、商汤科技、中国计算机学会计算机视觉专委会、中...

662
来自专栏PPV课数据科学社区

练功 | 机器学习应补充哪些数学基础?

编者按:很多同学开始学习机器学习时候遇到的最大障碍就是数学基础,机器学习到底需要学习哪些数据知识?要掌握到什么程度呢?希望这篇文章对于大家学习大数据和机器学习有...

33810
来自专栏CDA数据分析师

MIT 用 AI 实现自动抠图,轻松打造效果惊艳的特效电影

随着电影越来越关注 CGI,电影制作人必须更加擅长「合成」,即将前景和背景图像融合,比如将演员放在飞机或行星上,或者放在电影《黑豹》里瓦坎达这样的虚构世界中。

282
来自专栏计算机视觉战队

一文读懂监督学习、无监督学习、半监督学习、强化学习这四种深度学习方式

一般说来,训练深度学习网络的方式主要有四种:监督、无监督、半监督和强化学习。在接下来的文章中,计算机视觉战队将逐个解释这些方法背后所蕴含的理论知识。除此之外,计...

2626
来自专栏机器之心

入门 | 迁移学习在图像分类中的简单应用策略

2617
来自专栏新智元

关于 NIPS 2016 你应该知道的 50 件事情

【新智元导读】Andreas Stuhlmüller 目前在斯坦福 Noah Goodman 教授 Computation & Cognition lab 当博...

2994

扫描关注云+社区