首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8931
文章
6288176
阅读量
277
订阅数
仅花费60美元就能破坏0.01%数据集,AI模型性能显著降低
机器之心报道 编辑:袁铭怿 网络规模的数据集很容易受到低成本的投毒攻击,这种攻击只需要一小部分被破坏的样本就可以使整个模型中毒。 用于训练深度学习模型的数据集已经从数千个精心策划的示例增长到具有数十亿个从互联网自动爬取样本的网络规模数据集。在这种规模下,通过人力管理来确保每个示例的质量是不可行的。到目前为止,这种数量高于质量的权衡是可以接受的,一方面是因为现代神经网络对大量标签噪声具有很强的适应力,另一方面是因为对噪声数据的训练甚至可以提高模型在非分布数据上的效用。 虽然大型深度学习模型对随机噪声具有一定
机器之心
2023-02-27
3990
暴雪也没拦住的新版本:Linux之父家中停电6天,「冰冻荒原」版Linux内核还是来了
上个月,受恶劣天气影响,美国多个地区出现大规模断电,Linux 之父 Linus Torvalds 所在的俄勒冈州波特兰地区也没有幸免。但比较励志的是,即使经历了六天的断电生活,Linus Torvalds 还是赶出了新一版的 Linux 内核(候选版本)——Linux 5.12 rc1。
机器之心
2021-03-15
5140
抠图只精细到头发丝还不够,Adobe新方法能处理6000×6000的高分辨率图像
抠图是图像和视频编辑与合成的关键技术。通常,深度学习方法会以整个输入图像和相关的 trimap 作为输入,使用卷积神经网络来推断前景蒙版(alpha matte)。这种方法在图像抠图领域实现了 SOTA 结果。但是,由于硬件限制,这些方法在实际的抠图应用中可能会失败,因为现实世界中需要抠图的输入图像大多具备很高的分辨率。
机器之心
2020-09-24
6450
搜索关键词加个「VS」有何用?学下棋、追剧都不在话下
你是否尝试过在搜索引擎里输入一个关键词,然后再输入「vs」,看看它能给你自动匹配出什么东西?
机器之心
2020-07-09
3970
BAIR最新RL算法超越谷歌Dreamer,性能提升2.8倍
此次研究的本质在于回答一个问题—使用图像作为观测值(pixel-based)的 RL 是否能够和以坐标状态作为观测值的 RL 一样有效?传统意义上,大家普遍认为以图像为观测值的 RL 数据效率较低,通常需要一亿个交互的 step 来解决 Atari 游戏那样的基准测试任务。
机器之心
2020-06-01
4470
一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……
内容审核在很多领域都有非常重要的作用,它不仅需要通过分类器识别图像或其它数据不适合展示,同时还能结合语义分割模型对这些限制级图像进行处理(Mask 掉敏感部分)。这样在不过多影响内容的情况下去除掉不合适的信息。开发者 alexkimxyz 构建的这个项目大概收集了 20 多万张敏感图像,且通过 URL 的形式展示了 GitHub 中。
机器之心
2019-04-30
1.8K0
IEEE发布2017年编程语言排行榜:Python高居首位,PHP第八
选自IEEE Spectrum 作者:Stephen Cass 机器之心编译 参与:蒋思源、李亚洲 今天,IEEE Spectrum 发布了第四届顶级编程语言交互排行榜。因为有各种不同语言的排行,所以
机器之心
2018-05-09
4950
观点 | PHP or Python如何选择?或许你应该考虑一下这三个问题
选自Hackernoon 机器之心编译 参与:黄小天、李亚洲 2017 年可谓是网页应用与 API 之年,开发者不用每次重新发明轮子,而是利用脚手架和第三方库就能确保项目在几天内实时部署。 尽管 RE
机器之心
2018-05-07
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档