每日学术速递1.2

AiCharm

发布于 2024-01-04 12:19:31

1400

发布于 2024-01-04 12:19:31

文章被收录于专栏：AiCharm

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理

Subjects: cs.CV

1.Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning

标题：Pangu-Agent：具有结构化推理的可微调多面手智能体

作者：Filippos Christianos, Georgios Papoudakis, Matthieu Zimmer, Thomas Coste, Zhihao Wu, Jingxuan Chen, Khyati Khandelwal, James Doran, Xidong Feng, Jiacheng Liu, Zheng Xiong, Yicheng Luo, Jianye Hao, Kun Shao, Haitham Bou-Ammar, Jun Wang

文章链接：https://arxiv.org/abs/2312.14878

摘要：

创建人工智能 (AI) 代理的关键方法是强化学习 (RL)。然而，构建一个将感知直接映射到行动的独立强化学习策略会遇到严重的问题，其中最主要的是它缺乏跨多个任务的通用性以及需要大量的训练数据。主要原因是在制定政策时无法有效地将先验信息融入到感知-行动循环中。大型语言模型（LLM）作为将跨领域知识融入人工智能代理的基本方式而出现，但缺乏针对特定决策问题的关键学习和适应。本文提出了一个将结构化推理集成和学习到人工智能代理策略中的通用框架模型。我们的方法论受到人脑模块化的启发。该框架利用内在和外在函数的构造来添加先前对推理结构的理解。它还提供了学习每个模块或功能内部模型的自适应能力，与认知过程的模块化结构一致。我们深入描述了该框架，并将其与其他人工智能管道和现有框架进行了比较。本文探讨了实际应用，包括证明我们方法有效性的实验。我们的结果表明，当嵌入有组织的推理和先验知识时，人工智能代理的表现和适应能力要好得多。这为更具弹性和通用的人工智能代理系统打开了大门。

2.HyperMix: Out-of-Distribution Detection and Classification in Few-Shot Settings

标题：HyperMix：少样本设置中的分布外检测和分类

作者：Nikhil Mehta, Kevin J Liang, Jing Huang, Fu-Jen Chu, Li Yin, Tal Hassner

文章链接：https://arxiv.org/abs/2312.15086

摘要：

分布外（OOD）检测是现实世界机器学习系统的一个重要主题，但分布内样本有限的设置尚未得到充分探索。这种少样本 OOD 设置具有挑战性，因为模型在负责识别 OOD 样本之前很少有机会了解数据分布。事实上，我们证明了最近最先进的 OOD 方法在少数样本设置中无法超越简单的基线。因此，我们提出了一个名为 HyperMix 的超网络框架，对生成的分类器参数使用 Mixup，以及不需要额外的异常值数据集的自然的剧集外异常值暴露技术。我们在 CIFAR-FS 和 MiniImageNet 上进行了实验，在少样本情况下明显优于其他 OOD 方法。

3.Towards Learning Geometric Eigen-Lengths Crucial for Fitting Tasks(ICML 2023)

标题：学习几何特征长度对于拟合任务至关重要

作者： Yijia Weng, Kaichun Mo, Ruoxi Shi, Yanchao Yang, Leonidas J. Guibas

文章链接：https://arxiv.org/abs/2312.15610

项目代码：https://yijiaweng.github.io/geo-eigen-length/

摘要：

一些极低维但至关重要的几何特征长度通常决定某些几何任务的成功。例如，测量物体的高度非常重要，以检查它是否可以放在柜子的架子之间，而沙发的宽度在尝试将其移动通过门口时至关重要。人类已经在常识中具体化了如此重要的几何特征长度，因为它们在作为简洁而有效、高度可解释和通用的对象表示方面非常有用。然而，学习系统是否能够配备类似的功能，从执行任务中自动发现此类关键几何量，仍然是一个模糊和未充分探索的问题。因此，在这项工作中，我们首次针对这个问题制定并提出了一个新颖的学习问题，并建立了一个包括任务、数据和评估指标的基准套件来研究该问题。我们专注于一系列常见的拟合任务作为所提出的学习问题的测试平台。我们探索潜在的解决方案，并证明通过简单地观察成功和失败的拟合试验来学习特征长度的可行性。我们还尝试几何基础以实现更准确的特征长度测量，并研究学习的特征长度在多个任务中的可重用性。我们的工作标志着学习关键几何特征长度的第一步探索性步骤，我们希望它能够启发未来的研究来解决这个重要但尚未充分探索的问题。

喜欢的话，请给我个在看吧！

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-01-02，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能