来源:专知本文为书籍,建议阅读8分钟这是关于深度学习的合成数据的第一本书。
这是关于深度学习的合成数据的第一本书,其覆盖的广度可能使这本书成为未来几年合成数据的默认参考。这本书也可以作为介绍机器学习的其他几个重要的子领域,在其他书中很少触及。机器学习作为一门学科,如果没有手边的内部优化工作是不可能的。这本书包括了优化的必要的筋,尽管讨论的核心是训练深度学习模型的日益流行的工具,即合成数据。预计合成数据领域将在不久的将来经历指数增长。这本书是这一领域的全面综述。
在最简单的情况下,合成数据指的是用于训练计算机视觉模型的计算机生成图形。合成数据还有很多方面需要考虑。在基本计算机视觉部分,本书讨论了基本的计算机视觉问题,包括低级(如光流估计)和高级(如对象检测和语义分割),户外和城市场景(自动驾驶)的合成环境和数据集,室内场景(室内导航),航空导航和机器人仿真环境。此外,它还涉及了计算机视觉之外的合成数据的应用(在神经编程、生物信息学、NLP等方面)。它还调研了关于改进合成数据开发和生成它的替代方法(如GANs)的工作。
这本书介绍和回顾了机器学习各个领域合成数据的几种不同方法,最值得注意的是以下领域: 领域自适应,使合成数据更真实,和/或适应模型,以对合成数据进行训练,并为生成具有隐私保证的合成数据。这个讨论伴随着对生成式对抗网络(GAN)的介绍和对差分隐私的介绍。
https://link.springer.com/book/10.1007/978-3-030-75178-4#about