前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【源头活水】顶刊解读!Nature子刊 Machine Intelligence(IF 23.8)2024年第6卷第5期(1)

【源头活水】顶刊解读!Nature子刊 Machine Intelligence(IF 23.8)2024年第6卷第5期(1)

作者头像
马上科普尚尚
发布2024-06-18 14:05:55
1170
发布2024-06-18 14:05:55
举报

“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!

具有同理心的个性化AI

1.Empathic AI can’t get under the skin. Nat Mach Intell 6, 495 (2024). https://doi.org/10.1038/s42256-024-00850-6(Editoral

具有同理心的个性化AI

引语:个性化的、具有同理心模拟能力的LLM(大型语言模型)即将问世。对个体用户的影响需要仔细考虑。

人类很容易在聊天机器人中识别出类似人类的特质和能力。德裔美国计算机科学家约瑟夫·魏岑鲍姆(Joseph Weizenbaum)在20世纪60年代就发现了这种效应,他创建了一个名为ELIZA的程序,该程序被广泛认为是第一个聊天机器人。用户输入陈述,程序生成可以模拟人与计算机之间自然语言对话形式的响应。与今天的LLM(大型语言模型)相比,ELIZA非常原始,主要通过识别“关键词”和执行“文本操作”来运行。许多用户都被迷住了,当与聊天机器人互动时,他们感知到了理解或同理心等人类特征。魏岑鲍姆对于这种幻觉的力量感到惊讶和沮丧,并对过度依赖人工智能(AI)及其破坏人类价值观表示担忧。

几十年后,LLM能够进行流畅的类似人类的对话,根据需要以任何风格产生输出。鉴于LLM的广泛可用性和流行性,以及个性化聊天机器人到用户特定数据的新兴能力,人类倾向于在计算程序中投射人类特质的倾向需要进一步审查,考虑到对个体用户和社会可能产生的广泛影响。

考虑一种越来越被LLMs(大型语言模型)模仿的人类能力与特质:同理心——理解和分享他人感受的能力。LLMs以浪漫聊天机器人、个人助理、心理健康应用程序或治疗师的形式,可以给用户一种理解、同理心、关怀和爱的感觉。然而,语言模型无法体验这些心理状态,这使得作者提出了一个有趣的问题:如果同理心AI没有同理心,这有关系吗?

具有同理心的AI在伦理方面的若干问题

2. Shteynberg, G., Halpern, J., Sadovnik, A. et al. Does it matter if empathic AI has no empathy?. Nat Mach Intell 6, 496–497 (2024). https://doi.org/10.1038/s42256-024-00841-7(Correspondence

具有同理心的AI在伦理方面的若干问题

一台机器如果它能模拟出任何人可能想要的任何体验,一旦这台机器被激活,人们就无法分辨这种体验是否真实。当罗伯特·诺齐克在1974年提出这一思想实验时,人们普遍认为,如果有人永久性地将自己连接到这样的机器上,那将是一个可怕的错误。然而,在随后的几十年里,主流文化认知对于与现实保持联系的核心价值缺变得愈发脆弱,而人们寻求被大型语言模型(LLM)理解、关怀甚至爱抚的同理心,使得使用AI的趋势却在上升。

人类的未来真的会有共情人工智能吗?答案是未知的。但值得关注的是,拥有关爱能力的人也应该有能力收回关爱。任何低于这一标准的事情都会造成情感束缚,破坏真正关系的可能性。

表1 共情人工智能伦理和后果涉及的若干问题

l When people seek out empathic LLMs, are they looking for imagined or actual companionship?(当人们寻求具有同理心的LLMs时,他们可能在寻找的是想象中的陪伴还是实际的陪伴?)

l What is the experience of empathic LLM disillusionment?(具有同理心AI的幻灭感体验是怎样的?)

l Do/should/can long-term users of empathic LLMs sustain the belief that AI care is simulated rather than real?(长期用户是否能够、应该或可以维持这样一种信念,即AI的关怀是模拟的而非真实的?)

l How does the experience of LLM disillusionment compare to that of losing a human social bond? (具有同理心AI的幻灭感体验与失去真实人类社会的社交纽带相比较如何?)

l Do people have to, at least temporarily, believe that LLMs have real empathy to feel care?(人们是否必须,至少暂时地,相信LLM有真正的同理心来感受到关心?)

l What is the frequency of empathic LLM disillusionment? (人们在使用同理心LLM时,幻灭感体验的频率会是怎么样的?)

机器学习可解释性、统计学习理论

3.Marcondes, D., Simonis, A. & Barrera, J. Back to basics to open the black box. Nat Mach Intell 6, 498–501 (2024).

https://doi.org/10.1038/s42256-024-00842-6Comment

机器学习可解释性、统计学习理论(Statistical Learning Theory,SLT)

引语:机器学习的大多数研究工作都集中在性能上,而与模型行为的解释无关。我们呼吁回归机器学习方法的基础,更多地关注基于统计理论的基本理解的发展。

过去几十年来,由于高性能计算资源和数据的不断增加,机器学习研究得到了极大的推动。尽管由此带来的机器学习方法的进步带来了无数的好处,但它们的不加选择的使用也引发了许多道德、伦理和法律问题,这些问题通常与模型的不可审计性和不可解释性有关。

近期,大量的研究工作已经投入到实现可解释性上,这一努力是由可解释人工智能(AI)的倡议所推动的。然而,机器学习研究仍然主要是以性能为导向的,模型的准确性通常优于其可解释性和理解性。此外,大多数机器学习研究都是经验性的,并且发表研究的条件是提高现有方法的性能,而对于基础理论研究的关注相对较少。

前沿的面向算法的学习方法是基于深度神经网络(DNN)的,虽然也有其他流行的方法基于随机森林,例如。DNN架构是表示假设的一种方法。事实上,当使用DNN时,学习过程从选择特定的架构开始。尽管许多研究结果表明,DNN是通用的近似器,但在哪些假设可以用固定的体系结构表示,这些假设的属性是什么,以及如何通过约束相关的DNN体系结构来约束假设空间等方面,文献中存在空白。我们认为,这些问题缺乏答案是由于DNN的黑箱性质,是假设空间与其表示之间失去联系的症状

研究体系结构和假设空间之间的联系,需要人们后退十几步来提出最基本的问题,这些问题的答案不会立即提高实用方法的性能,但这可能是更深入理解DNN的第一步。然而,成功发表机器学习研究主要依赖于在基准任务上的良好表现,因此基础研究在学术社区上的地位有限。

因此,我们呼吁对机器学习研究的评价不仅要看其实证表现,还要看其数学的严谨性、可解释性和可控性。我们认为,一种学习方法应该满足关于其性能、其统计合理性、其结果的可解释性和对其行为的控制的最低标准。我们鼓励社区讨论这些标准应该是什么,并在文献中为可能不符合性能标准,但在数学上严格、可解释和可控的作品留出空间。

我们相信,促进基础研究将激励人们追求被忽视的重要研究方向,并有助于解决当前现代方法缺乏可解释性和控制力的问题。

深入理解深度学习

4. Wang, G. Diving into deep learning. Nat Mach Intell 6, 502–503 (2024).

https://doi.org/10.1038/s42256-024-00840-8books & arts

深入理解深度学习(书籍推荐)

推荐书籍名称:Understanding Deep Learning

作者:Simon J. D. Prince

出版社:The MIT Press: 2023. 544

书籍网站:https://udlbook.github.io/udlbook/

我对这本新书《Understanding Deep Learning》印象深刻,该书由Simon J.D. Prince撰写,并由MIT Press出版(并且可以在线免费获取PDF格式)。已经存在各种此类知名书籍,例如Ian Goodfellow、Yoshua Bengio和Aaron Courville所著的《Deep Learning2》,同样来自MIT Press,通常被认为是深度学习的“圣经”。Aurélien Géron所著的《Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow3》,因其实用的方法而受到赞誉,使用流行的库实现深度学习模型。Michael Nielsen所著的《Neural Networks and Deep Learning4》以其对初学者清晰直观的解释而闻名。Rajalingappaa Shanmugamani所著的《Deep Learning for Computer Vision5》专注于计算机视觉,因此与其它书籍的广泛覆盖相比,其范围较窄。最新的是Christopher Bishop和Hugh Bishop所著的《Deep Learning: Foundations and Concepts6》,同样优秀,风格与Prince的书相似。《Understanding Deep Learning》以其高度易懂的解释补充了现有文献——附有68个Python笔记本,可在Google Colab环境中立即使用——同时也深入研究了理论。这本书的妙处在于其能够解开复杂概念的神秘面纱,而不会减少它们的复杂性,这得益于清晰的解释和好的例子。此外,它超越了基础知识,通过提供深入理解的基础,向读者提出了高级话题的挑战。因此,这本书特别适合学术倾向的读者。

最大扩散强化学习、具身智能

5. Berrueta, T.A., Pinosky, A. & Murphey, T.D. Maximum diffusion reinforcement learning. Nat Mach Intell 6, 504–514 (2024).

https://doi.org/10.1038/s42256-024-00829-3(article

最大扩散强化学习、具身智能

机器人和动物都通过它们各自的身体和感官体验世界。它们的具身性限制了它们的经历,确保这些经历在空间和时间中连续不断地展开。因此,具身智能体的经历内在地是相互关联的。这种相关性为机器学习带来了根本性的挑战,因为大多数技术都依赖于数据独立同分布的假设。在强化学习中,数据是直接从智能体的顺序经历中收集的,这种假设的违反往往是不可避免的。在这里,我们提出了一种方法,它通过利用遍历过程的统计力学原理,我们称之为最大扩散强化学习,来克服这一问题。通过降低智能体经历之间的相关性,我们的方法能够证明在连续部署中实现一次性学习,跨越个体任务尝试的整个过程。此外,我们证明了我们的方法不仅很好地泛化了众所周知的最大熵技术,而且在流行的基准测试中稳健地超越了最先进的性能。我们在物理、学习和控制的交叉点上取得的成果,为具身强化学习智能体中透明和可靠的决策制定奠定了基础

扩散模型、量子计算、量子电路合成

6. Fürrutter, F., Muñoz-Gil, G. & Briegel, H.J. Quantum circuit synthesis with diffusion models. Nat Mach Intell 6, 515–524 (2024).

https://doi.org/10.1038/s42256-024-00831-9

扩散模型、量子计算、量子电路合成

量子计算最近作为一项变革性技术崭露头角。然而,它所承诺的优势依赖于有效地将量子操作转化为可行的物理实现。在本文中,我们采用了生成性机器学习模型,特别是去噪扩散模型(DMs),来促进这一转变。利用文本作为条件输入,我们引导模型在基于门的量子电路中产生所需的量子操作。值得注意的是,DMs允许我们在训练期间绕过在经典模拟量子动力学中固有的指数级开销——这在以往的机器学习技术中一直是一个瓶颈。我们在两个任务上展示了模型的能力:纠缠生成和酉编译。该模型擅长生成新的电路,并支持典型的DM扩展,如掩蔽和编辑,例如,使电路生成符合目标量子设备的约束。鉴于它们的灵活性和泛化能力,我们预期DMs将在量子电路综合中发挥关键作用,不仅增强实际应用,还为理论量子计算提供洞见

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档