ICLR 2020 | 受启诺奖研究，利用格网细胞学习多尺度表达（视频解读）

AI科技评论

发布于 2020-04-16 16:18:59

5820

发布于 2020-04-16 16:18:59

文章被收录于专栏：AI科技评论

作者 | 买庚辰

编辑 | 丛末

本文对由美国加州大学圣巴巴拉分校完成的，被ICLR 2020录用的论文《Multi-Scale Representation Learning for Spatial Feature Distributions using Grid Cells》进行解读。

论文：https://arxiv.org/pdf/2003.00824.pdf

论文简介：

目前，非监督语言编码模型加大的推进了自然语言处理技术的发展，他的核心理念就是根据词语在文章中的位置以及上下文关系使用神经网络把词语转化为向量空间表达，这个结果非常适合与多种下游的任务。在空间分析领域，我们看到了非常相似的情况，GIS学者注重于把地理对象（例如POI）的绝对位置信息和周边环境信息加入模型当中，这意味着一个广义的（地理）空间表达模型会对众多任务都有帮助。

然而，除了简单的对空间进行分割或者直接把坐标输入前馈神经网络（FFN）的做法，目前不存在这样的广义空间表达模型，不仅如此也很少有学者研究如何同时对不同特征的空间分布进行总体建模，而这一情况经常在GIS数据中出现。

与此同时，我们注意到近期赢得诺贝尔奖的神经科学研究发现，哺乳动物的格网细胞（grid cell）提供了一种多尺度周期性的表达，这种表达作为哺乳动物大脑中位置编码的一种指标对于它们认路和整合路经信息十分重要。

基于这些发现，本文提出一种叫做Space2Vec的表达学习模型，他可以对地理对象的绝对空间位置和相对空间关系进行编码。我们在两个真实的地理数据上做了实验：1）根据POI的位置和周围环境信息预测它的种类；2）利用拍摄位置的影像分类。

实验结果表明由于这种多尺度的空间表达，Space2Vec在上述两个任务中都击败了众多成熟的机器学习方法，例如RBF，多层神经网络，以及网格镶嵌算法。更细致的实验分析显示所有的基线方法均只能在一个尺度下较好的描述空间分布，但在其他尺度下的表现很差，与之相反Space2Vec的多尺度空间表达方法可以同时处理多个尺度下的空间分布。

http://mpvideo.qpic.cn/0bf2lqaa2aaamiaepieqrrpfaxgdbvoaadia.f10002.mp4?dis_k=46b608716ddd94972e81183be3f56c4c&dis_t=1587025078

作者简介：