首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

任何表面皆可触屏,无需传感器,超低成本投影虚拟显示器只需一个摄像头

机器之心报道 编辑:小舟 把手机显示的内容投影到任意平面进行「触屏」操作,这事似曾相识又有点魔幻...... 自从智能手机问世以来,使用触摸与数字内容进行交互变得无处不在。不过到目前为止,触摸屏主要限于袖珍设备。 近日,来自日本多所大学的研究者组成的研究团队提出了一种新的低成本方法,能够将任何表面变成触摸屏,为人们与数字世界的交互提供了新的可能性。 之前允许通过触摸操纵投影图像的工作大多依赖于特殊的输入设备、多个传感器或图像处理算法,难以处理混乱或令人困惑的视觉内容。而该研究提出的新系统只需在投影仪下方连

01

学界 | 看一遍人类动作就能模仿,能理解语义的谷歌机器人登上无监督学习的新高度

AI 科技评论按:机器学习能让机器人学会复杂的技能,例如抓住把手打开门。然而学习这些技能需要先人工编写一个奖励函数,然后才能让机器人开始优化它。相比之下,人类可以通过观察别人的做法来理解任务的目标,或者只是被告知目标是什么,就可以完成任务。目前,谷歌期望通过教会机器人理解语义概念,以使得机器人能够从人类的示范中学习动作,以及理解物体的语义概念,完成抓取动作。 以下为 AI 科技评论编译的这篇谷歌博客的部分内容。 问题的引入 人类与机器人不同,我们不需要编写目标函数即可以完成许多复杂的任务。我们可以这样做,是

08

Improved Techniques for Training Single-Image GANs

最近,人们对从单个图像而不是从大型数据集学习生成模型的潜力产生了兴趣。这项任务意义重大,因为它意味着生成模型可以用于无法收集大型数据集的领域。然而,训练一个能够仅从单个样本生成逼真图像的模型是一个难题。在这项工作中,我们进行了大量实验,以了解训练这些方法的挑战,并提出了一些最佳实践,我们发现这些实践使我们能够比以前的工作产生更好的结果。一个关键点是,与之前的单图像生成方法不同,我们以顺序的多阶段方式同时训练多个阶段,使我们能够用较少的阶段来学习提高图像分辨率的模型。与最近的最新基线相比,我们的模型训练速度快了六倍,参数更少,并且可以更好地捕捉图像的全局结构。

02

OpenCV3 和 Qt5 计算机视觉:1~5

在最基本的形式和形状中,“计算机视觉”是一个术语,用于标识用于使数字设备具有视觉感觉的所有方法和算法。 这意味着什么? 好吧,这就是听起来的确切含义。 理想情况下,计算机应该能够通过标准相机(或与此相关的任何其他类型的相机)的镜头看到世界,并且通过应用各种计算机视觉算法,它们应该能够检测甚至识别并计数人脸。 图像中的对象,检测视频馈送中的运动,然后执行更多操作,这些操作乍一看只能是人类的期望。 因此,要了解计算机视觉的真正含义,最好知道计算机视觉旨在开发方法以实现所提到的理想,使数字设备具有查看和理解周围环境的能力。 值得注意的是,大多数时间计算机视觉和图像处理可以互换使用(尽管对这个主题的历史研究可能证明应该相反)。 但是,尽管如此,在整本书中,我们仍将使用“计算机视觉”一词,因为它是当今计算机科学界中更为流行和广泛使用的术语,并且因为正如我们将在本章稍后看到的那样,“图像处理”是 OpenCV 库的模块,我们还将在本章的后续页面中介绍,并且还将在其完整的一章中介绍它。

02
领券