首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

视频 | 跟AI打一架,用人类方式

AI 科技评论按:这里是,AI研习社编译 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解 AI 领域最新研究成果。...一个闻者伤心听者落泪旧闻:人工智能在有限规则 1V1 比赛中击败了一些人类顶级玩家,当时奖金池是 2000 万美金。这是 AI 史上一个巨大里程碑。我们注意观看当时顶级玩家表情。 ?...之后旁边的人员激动万分前来握手,我们玩家脸上笑嘻嘻,心里···。心疼!人类玩家惨被 AI 虐杀,什么里程碑,人家只是个想要好好玩游戏宝宝!你却对使外挂? ?...但是在 1V1 获胜后,下一个里程碑是在标准 5V5 比赛中击败了人类团队。 ? 人工智能始终在通过自我对抗训练进行学习,每天如此,80% 游戏是自己与自己对抗,20% 是与过去自己对抗。...v=yEOEqaEgu94 ( AI 科技评论往期也有过详细报道文章,具体请见 虽又击败了人类选手,但我们认为 OpenAI 5v5 DOTA AI 不过如此)

30730
您找到你想要的搜索结果了吗?
是的
没有找到

Kaggle竞赛中使用YoloV5将物体检测性能翻倍心路历程

在比赛早期阶段,努力提高基准模型分数,但我找不到有用在线资源,这就是写这篇文章原因。带你们踏上一段从头到尾旅程,简要地向你们展示所走每一步,成绩几乎翻了一倍。...经历了惨痛教训,但最终还是用以下规范构建了一个初始模型: YoloV5-XL 图像分辨率从3K调整为512 知道这听起来很简单,一开始也是这么。...这是一个微不足道改进,但我想在这里传达重点是,如果以这个分辨率开始,可能不会进一步提高分数。...这被称为“2 class filter”,比赛中每个人都采用了这个方法,因为它大大提高了分数。我会在下一篇文章中介绍。...这就是ML特点,并不是所有的技术都能以同样方式使不同模型受益。

1.1K20

机器学习中对抗性攻击介绍和示例

概念 对抗样本是专门设计输入,旨在欺骗机器学习 (ML) 模型,从而导致高置信度错误分类。有趣是这种方式图像所做修改虽然温和,但足以欺骗 ML 模型。...在这篇文章中,展示微小变化如何导致灾难性影响。下图总结了对抗性攻击过程: 考虑上面的猫图像,我们添加了一个小扰动,经过计算使图像被高置信度地识别为柠檬。...更具体地说,我们将获取图像并计算相对于所需标签损失(在本例中为“柠檬”)。我们获得输入图像计算梯度,并将其乘以一些小常数 epsilon。...输入图像。它获取输入并打印出预测类及其概率。...这个模型现在把我们猫归类为柠檬概率非常高,但我们可以清楚地看到图像在视觉上仍然是一只猫。 最后总结 如你所见,对抗性攻击非常简单和有趣。

80810

“众矢之的”马库斯回应14个问题,将深度学习质疑到底

结论核心是: 尽管我提出很多问题,但我不认为我们需要放弃深度学习。...条纹模式与校车输出单元激活紧密相关,后者反过来与一组低级特征相关,但在一个典型图像识别深度网络中,没有一个由车轮、底盘、窗户组成完整校车典型。几乎所有欺骗神经网络文献都利用了这一点。...还指出: 显然,深度学习和无监督学习在逻辑上并不是对立。深度学习主要用于带标签数据有监督环境,但我们也可以通过其他途径,以无监督方式来利用深度学习。 结论也是积极。...很想看看,目前有哪些无监督学习项目的案例能证明Marcus说法是错误也很想看看。...用一种不同方式反思目前大多数机器学习系统,它们只是不打算“跳出框框”思考。这对某些目的来说是可以,但对其他目的却不行。如果实现通用人工智能,机器推断必须跳出这些框框,达到人类思考宽度。

740100

如何用TeX“复活”两千多年前《几何原本》?

这本书主要特点是,它不是普通字母名称,如“三角形ABC”,它直接在文本中使用了微缩图片来表述。即三角形图像。...Byrne这两种方式用了,而我使用了以下这个公式:L'= Lal1-a,其中L'是文本中线段长度,L是原始线段长度,l是所需线段长度,a是介于0和1之间某个数字。...之后,一些“叶子”以相同方式生长。曲线形状和特点是可调节。 ? 结果不能说很满意,但我正在慢慢改进算法,希望达到最好效果。无论如何,你可以用你选择图片替换生成首字母。...Byrne书中没有任何三维几何体,只在简介中有平行六面体图像也没有为它制作任何工具,但在某些地方,添加一些,所以我开始“Byrne化”11-13号书,用它实践一下新工具。...还不知道如何能否自动化地解决这些问题,但我绝对试一试,因为手工修复真的很无聊。 ? MetaPost可以在LaTeX中使用,也可以作为独立程序使用。

85830

Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑运作机制,但不是通过反向传播

但我目前信念是,反向传播,也即目前深度学习工作方式,与大脑所做完全不同,大脑是以不同方式来获得梯度。...想说是,很多研究人员都知道这个,但可能不是每个人都知道Alex结果和Ilya之前在ImageNet图像识别竞赛上工作相比错误率降低了一半。...认为我们还需要别的东西,但我认为,在不久将来,我们将会看到非永生计算机,它们制造成本很低,它们必须通过学习来获取所有的知识,而且它们所需能量很低。...你是愿意有一百万个标签错误图像,还是愿意有一万个标签准确图像有一个假设,重要是标签和准确性之间互信息量。...一旦学生看到标签和输入之间关系,那么一个错误标签错误性就很明显。所以如果它被随机地错误用了也没关系,但是有一个相变,在这个相变中你必须让它足够好,学生们能明白这个道理。

36310

如何用TeX“复活”两千多年前《几何原本》?

这本书主要特点是,它不是普通字母名称,如“三角形ABC”,它直接在文本中使用了微缩图片来表述。即三角形图像。...Byrne这两种方式用了,而我使用了以下这个公式:L'= Lal1-a,其中L'是文本中线段长度,L是原始线段长度,l是所需线段长度,a是介于0和1之间某个数字。...之后,一些“叶子”以相同方式生长。曲线形状和特点是可调节。 结果不能说很满意,但我正在慢慢改进算法,希望达到最好效果。无论如何,你可以用你选择图片替换生成首字母。...Byrne书中没有任何三维几何体,只在简介中有平行六面体图像也没有为它制作任何工具,但在某些地方,添加一些,所以我开始“Byrne化”11-13号书,用它实践一下新工具。...还不知道如何能否自动化地解决这些问题,但我绝对试一试,因为手工修复真的很无聊。 MetaPost可以在LaTeX中使用,也可以作为独立程序使用。

1.4K31

【Rust日报】2022-03-05 Onefetch

默认情况下,git仓库信息显示在主要语言logo旁边,但您可以进一步配置onefetch,以在支持终端上使用图像、文本输入或完全不使用任何内容。...Github 链接,https://github.com/o2sh/onefetch coca v0.3.0发布: coca在一年前发布了上一个版本,在这之后只是偶尔投入在这上面。...自从const genericsMVP版本稳定以来,一直发布一个新版本。这真的让coca大放异彩,但我总是先补充一些别的东西。...www.reddit.com/r/rust/comments/t6npfj/announcing_coca_v030_allocationfree_data/ 发布 ds-transcriber 1.0.0 允许向您展示...这是一个由DeepSpeech为基础crate,可以让你轻松获取麦克风录音,完全离线。有一些性能改进和错误修复。然而,大多数更改是为了使公共API更友好、更干净。

37210

Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑运作机制,但不是通过反向传播

但我目前信念是,反向传播,也即目前深度学习工作方式,与大脑所做完全不同,大脑是以不同方式来获得梯度。...想说是,很多研究人员都知道这个,但可能不是每个人都知道Alex结果和Ilya之前在ImageNet图像识别竞赛上工作相比错误率降低了一半。...认为我们还需要别的东西,但我认为,在不久将来,我们将会看到非永生计算机,它们制造成本很低,它们必须通过学习来获取所有的知识,而且它们所需能量很低。...你是愿意有一百万个标签错误图像,还是愿意有一万个标签准确图像有一个假设,重要是标签和准确性之间互信息量。...一旦学生看到标签和输入之间关系,那么一个错误标签错误性就很明显。所以如果它被随机地错误用了也没关系,但是有一个相变,在这个相变中你必须让它足够好,学生们能明白这个道理。

72320

2021 年 Python 好与坏

在这篇文章中,聊下 Python 最大优势和不足,以不足为主,因为这些问题已经存在了许多年,而且其中有些导致了很多问题。这篇文章对 Python 评价看起来非常负面。...前 言 在这篇文章中,聊下 Python 最大优势和不足,以不足为主,因为这些问题已经存在了许多年,而且其中有些导致了很多问题。...更糟糕是,在使用 pip install 和 conda install 时遇到了不同错误。Python 版本不同,错误也不同——是小版本,如 3.7 vs 3.8。...而用 Python,上周代码今天就不能用了都准备好和他决斗了。但我突然就停住了,这家伙说得很有道理。 这个问题主要存在于库中,但这种快速变化且有破坏性东西令人非常恼火。...看不出来这些库有什么理由重写 / 重构。 是的,明白。有时候,你不得不重构代码。代码是由不取得报酬志愿者维护,诸如此类。但我希望社区能更严肃地对待向后兼容性。

44610

厉害了,用“深度学习”写了个老板探测器(附源码)

如果上班时候放松一下,或者直说偷偷懒,看点和工作无关网页,这时候万一老板突然出现在背后,会不会感到很难堪呢?...整个工程中应用了Keras深度学习框架来建立识别人脸神经网络,和一个网络摄像头用来捕捉老板的人脸。 任务是这样 当老板接近工位时,电脑就会自动切换屏幕 办公室情况如下: ?...所以,反正老板就在身边,就简单粗暴拍摄了一段他视频,然后把视频分解成大量图像图像预处理 现在有很多人脸图像了,但还不能拿它们来建立学习模型,必须要裁剪掉与脸部不相关部分。...使用ImageMagick来提取人脸,你可以用别的图像软件来做。 总之,最后收集了大量的人脸图像,就像这样: ▼ ? 估计是全世界拥有最多老板头像的人了,肯定比他爸爸妈妈要多多。...在实践过程中,发现OpenCV图像精度不够高,虽然不影响识别,但我准备改用Dlib来提高精度,另外自己编写人脸检测训练模型。 网络摄像头获取图像不够清晰,准备换个摄像头。

98170

博客用不着什么JavaScript框架

提高网站性能:静态 HTML 文件在 99% 时候都比动态页面更快。...是这么:“这听起来像是渐进增强,但用不着什么投入”。不幸是,就像大多数听起来过于美好事情一样,经过一些调查发现它就是个坑。...用 Eleventy 从头开始 这时候感觉有点不对劲——使用一个会大量推送客户端 JavaScript 框架,却要删除所有 JavaScript 代码,这似乎是一种很复杂网站构建方式。...选择使用 Eleventy 来构建自己网站,但我知道这种方法并不适合所有人——完全按照自己意愿来构建某些东西可能是很麻烦事情。...黑暗模式切换——虽然可以只用 CSS 来实现,无需访问 cookies 或本地存储,但我没办法在页面之间保持设定值。 是否会在不久将来在网站上加入 JavaScript 呢?

4.1K10

关注数据而不是模型:是如何赢得吴恩达首届 Data-centric AI 竞赛

虽然模型和训练过程是固定但我们可以自由改进数据集并更改训练和验证数据分割。我们还可以添加新图像,但在训练和验证分割中提交图像组合必须小于10K。...-从训练集中生成了大约 1M 随机增强图像作为候选来源。 -数据评估电子表格用于跟踪不准确(错误分类图像)并注释数据。...-对于预训练模型,使用了在 ImageNet 上训练 ResNet50。 -使用 Annoy 包来执行近似最近邻搜索。 -每个错误分类验证图像要检索最近邻数量是一个超参数。...下一步,利用预训练模型提取图像嵌入,用于计算图像之间余弦相似度,从而自动获取与验证集中错误分类图像相似的增强图像。 在这里,使用预训练模型进行一般特征提取是一种迁移学习方法。...假设通过以这种方式获取增强图像,我们可以提高模型从分布长尾学习模式机会。

65240

是如何赢得吴恩达首届 Data-centric AI 竞赛

虽然模型和训练过程是固定但我们可以自由改进数据集并更改训练和验证数据分割。我们还可以添加新图像,但在训练和验证分割中提交图像组合必须小于10K。...-从训练集中生成了大约 1M 随机增强图像作为候选来源。 -数据评估电子表格用于跟踪不准确(错误分类图像)并注释数据。...-对于预训练模型,使用了在 ImageNet 上训练 ResNet50。 -使用 Annoy 包来执行近似最近邻搜索。 -每个错误分类验证图像要检索最近邻数量是一个超参数。...下一步,利用预训练模型提取图像嵌入,用于计算图像之间余弦相似度,从而自动获取与验证集中错误分类图像相似的增强图像。 在这里,使用预训练模型进行一般特征提取是一种迁移学习方法。...假设通过以这种方式获取增强图像,我们可以提高模型从分布长尾学习模式机会。

73510

厉害了,利用深度学习开发老板探测器(附源码)

如果上班时候放松一下,或者直说偷偷懒,看点和工作无关网页,这时候万一老板突然出现在背后,会不会感到很难堪呢?...整个工程中应用了Keras深度学习框架来建立识别人脸神经网络,和一个网络摄像头用来捕捉老板的人脸。 任务是这样 当老板接近工位时,电脑就会自动切换屏幕 办公室情况如下: ?...所以,反正老板就在身边,就简单粗暴拍摄了一段他视频,然后把视频分解成大量图像图像预处理 现在有很多人脸图像了,但还不能拿它们来建立学习模型,必须要裁剪掉与脸部不相关部分。...使用ImageMagick来提取人脸,你可以用别的图像软件来做。 总之,最后收集了大量的人脸图像,就像这样: ▼ ? 估计是全世界拥有最多老板头像的人了,肯定比他爸爸妈妈要多多。...在实践过程中,发现OpenCV图像精度不够高,虽然不影响识别,但我准备改用Dlib来提高精度,另外自己编写人脸检测训练模型。 网络摄像头获取图像不够清晰,准备换个摄像头。

78220

谷歌AutoML创造者Quoc Le:未来最好的人工智能模型将由机器生成

实际上感谢 Jeff Dean 在这个想法初期所提供帮助。 记得在 2014 年,有一次和 Jeff 吃了一顿午餐,他也分享了非常类似的看法。...谷歌 AI 负责人 Jeff Dean 神经架构搜索与您之前研究有何不同? 这不同于我之前在计算机视觉领域工作。这段研究经历源自一个想法,并且也在随时间成长。也有过一些错误想法。...比如,曾想自动化和重建卷积,但那是个错误直觉想法。也许应该接受卷积,然后使用卷积来构建其它东西?这对来说是一个学习过程,但不算太坏。...认为人们会使用 GAN 来生成更好图像但我不认为人们会使用 GAN 来生成更好架构。 迁移学习在 AutoML 技术中扮演怎样角色? 迁移学习有两种类型。...因为现在搜索空间中具有某些先验知识,所以即使我们宣称我们用 AutoML 做一切工作,特定先验知识元素仍会进入搜索空间。认为这还不够理想,研究这个问题。

56620

上班族必备,日本小哥用深度学习开发识别老板探测器(附源码)

如果上班时候放松一下,或者直说偷偷懒,看点和工作无关网页,这时候万一老板突然出现在背后,会不会感到很难堪呢?...整个工程中应用了Keras深度学习框架来建立识别人脸神经网络,和一个网络摄像头用来捕捉老板的人脸。...所以,反正老板就在身边,就简单粗暴拍摄了一段他视频,然后把视频分解成大量图像。 2.图像预处理 现在有很多人脸图像了,但还不能拿它们来建立学习模型,必须要裁剪掉与脸部不相关部分。...使用ImageMagick来提取人脸,你可以用别的图像软件来做。 总之,最后收集了大量的人脸图像,就像这样: ▼ 估计是全世界拥有最多老板头像的人了,肯定比他爸爸妈妈要多多。...在实践过程中,发现OpenCV图像精度不够高,虽然不影响识别,但我准备改用Dlib来提高精度,另外自己编写人脸检测训练模型。 网络摄像头获取图像不够清晰,准备换个摄像头。

86520

通过Canvas在浏览器中更酷展示视频

当我们创建类新示例Processor时,我们抓取video和canvas元素然后从画布中获取2D上下文。...最终我们只是采用了 Mozilla团队描述 方法,也就是将每个RGB估值器设置为其中所有3个平均值。随后我们更新图像数据数组中这些值,并将更新后版本写入到上下文中。...一个接近实际例子:分析和利用视频细节 这里与大家分享一下Phil痛苦——2015年以来,他一直任职于Demuxed 公司。...但我本人却并未利用机器学习实现什么酷炫优化。...这里强调是:不是数据科学家,这是第一次亲自使用Tensorflow。尽管使用机器学习搭建视觉分析框架并进行实时分析看上去非常酷炫,但这一切真的能在实际案例当中起到决定性关键作用吗?

2.1K30

特斯拉AI总监:复现了LeCun 33年前神经网络,发现和现在区别不大

现如今, MacBook Air (M1) CPU 就能运行这个实现,而且只用了 90 秒(实现了大约 3000 倍加速)。...但我确信还有其他影响精确复现原因,如这篇论文对权重初始化方案描述有点过于抽象;PDF 文件中可能存在一些格式错误(小数点、平方根符号被抹掉等等)。...最后,该论文使用了「牛顿法特殊版本,该版本使用了 Hessian 正对角近似」。但我用了 SGD,因为它明显更简单。而且,论文作者表示,「这种算法被认为不会带来学习速度巨大提升」。...总的来说,如果回到 1989 年,将把错误率降低 60%(把错误数从 80 降到 30 个),测试集错误率仅为 1.5%。...扫码关注 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式  往期推荐  ICCV2021涨点神器:新方式在视觉类领域提升精度(附源代码) ResNet

31630
领券