文章/答案/技术大牛

发布

【密歇根大学｜Opto-Electronic Science】深度学习模型纳米光子逆设计性能基准

文章来源：企鹅号 - 真智AI

PART 1

文章信息

题目

Benchmarking deep learning-based models on nanophotonic inverse design problems

作者

Taigao Ma, Mustafa Tobah, Haozhu Wang*, L. Jay Guo*

单位

美国密歇根大学物理系；美国密歇根大学材料科学与工程系；美国密歇根大学电气工程与计算机科学系

期刊

Opto-Electronic Science，2022年 / 第1卷

DOI

10.29026/oes.2022.210012

PART 2

一句话概括

系统对比 Tandem Networks、VAE 与 GAN 在纳米光子逆设计中的准确性、多样性与鲁棒性表现，并给出模型选型建议。

准确性并非唯一指标——在真实纳米制造约束下，多样性与鲁棒性同样决定模型的工程价值。

PART 3

研究背景与科学问题

纳米光子逆设计旨在根据目标光学响应反推出结构参数。然而，该问题天然存在“一对多映射”——多个结构可能产生相似光学响应，使得传统神经网络难以稳定收敛。

优化算法虽可求解，但每个目标都需重新迭代仿真，计算成本高昂，难以支撑大规模设计任务（如结构色图像重建）。

近年来，深度学习方法可实现毫秒级预测，但现有研究几乎只关注准确性，忽略真实制造中的关键问题：

结构是否满足物理约束？

是否具有足够设计多样性以适应加工容差？

对制造误差是否敏感？

关键挑战

一对多映射导致模型输出坍塌或平均解

高纵横比、尖锐结构难以制造

预测结构可能违反物理约束

制造误差导致性能漂移

本文核心问题：不同深度生成模型在准确性、多样性与鲁棒性之间如何权衡？

PART 4

技术原理与创新点

本文系统基准测试三类模型：

Tandem Networks（确定性）

Variational Auto-Encoders（生成式）

Generative Adversarial Networks（生成式）

作者在两类代表性问题上进行对比：

低自由度模板结构（硅结构色）

高自由度自由形状结构（透射滤波器）

Tandem 通过前向网络约束逆网络，规避一对多问题；VAE 通过潜变量建模概率分布；GAN 通过对抗训练捕捉多模态结构分布。

方法分解

构建训练数据（RCWA 仿真）

训练三类逆设计模型

使用保留测试集评估：

准确性（MAE / RMSE / R²）

多样性（结构分布宽度/模态）

鲁棒性（物理约束 + 制造扰动）

创新清单

首次系统比较三类主流逆设计模型

提出“多样性 + 鲁棒性”量化指标

同时覆盖模板结构与自由结构两类问题

公开全部代码与数据用于社区基准测试

本质差异：Tandem 强制收敛到单解，VAE 学习单峰分布，GAN 可捕捉多峰结构分布。

PART 5

实验验证与性能

实验包含两个任务：

结构色逆设计（8411样本）

自由形状透射滤波器（63757样本）

所有模型使用独立随机种子重复训练以确保统计可靠性。

模板结构：硅结构色

评测维度

准确性

•

MAE：0.0043（Tandem）vs 0.0074（VAE）

•

RMSE：0.0070（Tandem）

•

R² > 0.99（三模型）

物理约束失效率

•

Tandem：1.35%

•

VAE：0%

•

GAN：0.21%

制造扰动鲁棒性

•

MAE≈0.05–0.06（±5 nm扰动）

关键结果表

Tandem 与 VAE 准确性最佳，而 GAN 在结构多样性方面显著领先。

自由形状透射滤波器

评测维度

光谱误差

•

MAE：0.0277（VAE 最优）

•

RMSE：0.0444（VAE 最优）

多样性（不规则度分布）

•

Tandem：单点

•

VAE：单峰

•

GAN：多峰

制造扰动鲁棒性

•

三者接近，VAE略优

当强调光谱精度时优选 VAE；当强调结构多样性时优选 GAN。

PART 6

学术贡献

构建纳米光子逆设计首个系统化深度学习基准

提出可泛化的多样性与鲁棒性评估框架

揭示生成模型在工程可制造性中的优势

为模型选型提供实用决策依据

本文将逆设计模型评价从“单一精度指标”推进到“工程可用性范式”。

PART 7

局限性与未来方向

本文仍存在若干局限：

仅限于分布内设计

鲁棒性未纳入训练损失

未测试强化学习或物理驱动混合方法

待解决问题

将制造扰动显式纳入损失函数

提升模型外推能力

构建多指标统一评价体系

下一步关键方向：将制造容差与物理约束嵌入可微训练框架中。

PART 8

总结

本文系统比较三类主流深度学习逆设计模型，揭示了准确性、多样性与鲁棒性之间的关键权衡关系。

Tandem 与 VAE 提供高精度解，GAN 提供最大结构自由度。实际工程应用需根据设计目标进行模型选择。

在纳米制造时代，最优模型不是“最准”的，而是“最可制造”的。

PART 9

图文赏析

Figure 1

三种所考虑模型的结构：(a) Tandem 网络，(b) VAE，(c) GAN。每个神经网络的构建和训练的详细描述

Figure 2

(a) 硅结构色逆向设计的模板结构。插图中显示了四个结构参数（D, H, G, P）。

Figure 3

(a) 五个随机选择的颜色逆向设计示例（蓝色、棕色、红色、黄色和绿色）。第一行是目标颜色，其中

Figure 4

(a) 绿色颜色（c）的1000个逆向设计结构参数的归一化密度分布，其CIE坐标为(x,

Figure 5

Tandem 网络(a)(d)、VAE(b)(e)和GAN(c)(f)的两个随机选择的透射光谱逆向设计示例。

Figure 6

三种模型多样性的比较。(a–c) 红色柱状图显示了归一化不规则度密度分布

发表于: 1天前2026-03-13 12:06:34
原文链接：https://page.om.qq.com/page/ONyfddpjaKT84KikStNkCnUQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

【密歇根大学｜Opto-Electronic Science】深度学习模型纳米光子逆设计性能基准

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐