
ICLR 2026 录用结果公布,共计 5356 篇论文。
对于 AIDD 领域的研究者而言,如何从海量论文中快速定位相关工作,是每年顶会季的必修课。
我们对全部接收论文进行了系统性筛选与分析,整理出 132 篇 AIDD 核心论文,覆盖蛋白质设计、分子生成、分子对接、分子动力学等主流方向。
本文将从论文分布、技术趋势、代表性工作三个维度进行深度解读。
我们通过三层筛选策略,从 5356 篇论文中提取 AIDD 相关工作:
第一层:关键词初筛(5356 → 538)
基于 40+ 个核心关键词(molecule、protein、drug、docking、binding 等),对论文标题、摘要和关键词进行匹配。
第二层:噪声去除(538 → 210)
排除因歧义词(如 synthesis、atom)误匹配的视频生成、图像编辑等无关论文。
第三层:人工校验(210 → 132)
逐一检查边缘案例,剔除"通用图生成"、"理论证明"等与 AIDD 无直接关联的工作。
132 篇论文的主题分布如下:
方向 | 数量 | 占比 | 代表性论文 |
|---|---|---|---|
🧬 蛋白质设计与折叠 | 35 | 26.5% | SimpleFold, ProteinAE, La-Proteina |
🧪 小分子生成与优化 | 30 | 22.7% | FragFM, SynCoGen, MolEditRL |
🔗 分子对接与相互作用 | 20 | 15.2% | h-MINT, SigmaDock, PoseX |
⚛️ 分子动力学与力场 | 15 | 11.4% | ATOM, MarS-FM, BioMD |
💊 药物发现应用 | 15 | 11.4% | DrugTrail, SYNC, DeepSADR |
🧬 生物序列建模 | 10 | 7.6% | PatchDNA, AntigenLM |
🔬 其他(单细胞、病理等) | 7 | 5.3% | scDFM, HEIST |
关键洞察:
蛋白质方向论文数量超过小分子方向,这与近年来 AlphaFold 引发的蛋白质 AI 热潮密切相关。ICLR 2026 延续了这一趋势,蛋白质设计、逆折叠、全原子生成成为热门议题。
约 40% 的论文采用了扩散模型,覆盖:
扩散模型的优势在于生成质量高、多样性好,但采样速度较慢。多篇论文提出了加速策略,如 FragFM 的片段级生成、DriftLite 的轻量化推理。
Flow Matching 作为扩散模型的“近亲”,在本届 ICLR 有 15+ 篇论文采用:
相比扩散模型,Flow Matching 的训练和采样更高效,正在成为分子建模的新宠。
约 25% 的论文使用了 GNN 进行分子表征:
值得关注的是,SE(3) 等变网络(如 E(3)NN、EGNN)在分子建模中已成为标配,几乎所有涉及 3D 结构的工作都采用了等变架构。
约 15 篇论文将 LLM 应用于化学/生物领域:
LLM 在分子理解、化学推理、结构解析等任务上展现出潜力,但在精确的结构生成任务上仍不如专用模型。
论文 | 亮点 |
|---|---|
SimpleFold | 简化版蛋白质折叠,证明复杂架构并非必需 |
La-Proteina | 部分隐空间 + Flow Matching 的原子级蛋白质生成 |
Constrained Diffusion | 支持硬约束的蛋白质设计 |
Multi-state Protein Design | DynamicMPNN:多状态蛋白质设计 |
Scaling Atomistic Protein Binder Design | 预训练 + 测试时计算扩展 |
论文 | 亮点 |
|---|---|
FragFM | 片段级离散 Flow Matching,高效分子生成 |
SynCoGen | 联合反应与坐标建模,生成可合成分子 |
MolEditRL | 扩散 + 强化学习的分子编辑 |
SYNC | 可合成性评估新基准 |
Refine Drugs | 片段精修而非从头生成 |
论文 | 亮点 |
|---|---|
h-MINT | 层次化分子交互网络 |
SigmaDock | 片段级 SE(3) 扩散对接 |
PoseX | 超越物理方法的交叉对接 |
SAIR | 合成数据集助力蛋白质-配体交互学习 |
Towards All-Atom Foundation Models | 全原子结合亲和力预测基础模型 |
论文 | 亮点 |
|---|---|
ATOM | 多任务分子动力学预训练神经算子 |
MarS-FM | 马尔可夫状态模型 + Flow Matching |
BioMD | 全原子生物分子动力学生成模型 |
Geometric GNN Diffusion | 稳定分子动力学模拟 |
Learning Boltzmann Generators | 约束质量传输的 Boltzmann 生成器 |
基准 | 任务 | 论文 |
|---|---|---|
SYNC | 分子可合成性评估 | SYNC: Measuring Synthesizability |
3DCS | 分子表征的构象敏感性 | 3DCS: Datasets and Benchmark |
GeomMotif | 蛋白质生成的几何保持能力 | GeomMotif: A Benchmark |
PepBenchmark | 多肽机器学习标准化评测 | PepBenchmark |
ChemEval | LLM 化学能力评测 | ChemEval |
面对 132 篇论文,逐篇精读不太现实。我们推荐使用 Google NotebookLM 进行快速分析。




有一说一,总结的真不错

第一步:总体概览 → 了解主要研究方向和趋势
第二步:分主题分析 → 深入蛋白质/分子生成/对接等子领域
第三步:技术对比 → 横向比较扩散模型/Flow Matching/GNN
第四步:数据集基准 → 了解评测标准和 SOTA
第五步:未来展望 → 把握研究趋势
第六步:生成综述 → 输出完整报告
请根据我上传的论文,总结 ICLR 2026 AIDD 领域的主要研究方向。
哪些技术方法应用最广泛?有哪些新兴趋势?
请引用具体论文标题作为支撑。
NotebookLM 会基于上传的论文内容回答问题,并给出具体引用,适合快速建立领域全景图。
完整 132 篇论文列表和筛选脚本已开源:
👉 GitHub:
https://github.com/minddance-x/ICLR2026-AIDD
仓库包含:
欢迎 Star 和 Fork。如有遗漏或建议,欢迎 Issue 反馈。