MIT林肯实验室智能和决策技术小组,研究开发了一个神经网络,可以执行类似人类推理思路的步骤,回答关于图像内容的问题。该模型被命名为透明设计网络(TbD-net),在解决问题时直观地呈现其思维过程,使人类分析师能够解释其决策过程。该模型比当今最好的视觉推理神经网络表现更好。
了解神经网络如何做出决策,是AI研究人员面临的一项长期挑战。神经网络是受人类大脑启发的AI系统,旨在复制人类学习的方式。它们由输入层、输出层,以及介于两者之间的隐藏层组成,将输入转换为正确的输出。
一些深度神经网络变得越来越复杂,即使构建它们的工程师也不清楚内部发生了什么,它们也因此被称为“黑匣子”。
MIT研究人员开发TbD-net的目的是使神经网络的内部工作透明化,这样人们就能解释AI产生的结果。TbD-net利用一种AI技术来解释人类语言问题,并将这些问题分解为子任务,然后利用多种AI技术来处理这些任务。
经过测试,TbD-net的成绩超过了目前性能最佳的视觉推理模型。研究人员使用一个由70,000张训练图片和700,000个问题组成的视觉问答数据集,以及15,000张图片和150,000个问题的测试和验证集,来评估TbD-net模型。TbD-net初始模型在数据集上的准确度高达98.7%,据研究人员称,这远远强于其他神经网络模型。
研究人员称,这个结果可以更高,因为他们的模型有一个优势——透明度。研究人员可以看到模型出现问题的地方并进行改进,最终测试的准确度为99.1%。
—完—
想知道AI加教育领域有哪些最新研究成果?
想要AI领域更多的干货?请关注小编
领取专属 10元无门槛券
私享最新 技术干货