来自弗吉尼亚理工大学、台湾清华大学和 Facebook 的研究者提出了一种将单个 RGB-D 输入图像转换为 3D 照片的方法,利用多层表示合成新视图,且新视图包含原始视图中遮挡区域的 hallucinated 颜色和深度结构。
现在Facebook已经将此项技术完善,并集成到了APP上,也就是说,在FB软件上,用静态的2D照片,也能体会到丰满的3D立体感。
Instagram宣布开始使用AI检测其社交网络平台上发布的图片中的网络欺凌行为,突出了科技公司在其审核过程中使用自动化的努力。
---- 新智元报道 来源:code.facebook.com 【新智元导读】今天,Facebook正式公布PyTorch 1.0,这个新的框架将PyTorch 0.4与Caffe2合并,并整合ONNX格式,让开发者可以无缝地将AI模型从研究转到生产,而无需处理迁移。 今天,Facebook正式公布PyTorch 1.0,这是将基于Python的PyTorch与Caffe2合并的一个新版本的框架,让开发者可以无缝地将AI模型从研究转到生产,而无需处理迁移。 “现在,你只需要使用PyTorch 1.0
选自Medium 作者:Alex Honchar 机器之心编译 参与:陈韵竹、刘晓坤 2017 年是机器学习领域最有成效、最具创意的一年。现在已经有很多博文以及官方报道总结了学界和业界的重大突破。本文略有不同,Alex Honchar在Medium发文,从研究者的角度分享机器学习明年发展的走向。机器之心对此行了编译和整理。 本文的预测基于 2012 年以来我关注的学术界和科技巨头实验室的研究思路演变。我所选择的领域,从我的观点来看,都多多少少尚处于发展的初级阶段,但是已经为研究做足了准备,且在 2018 年
最近因项目需要,得把OpenCV捡起来,登录OpenCV官网,竟然发现release了4.0.0-beata版本,所以借此机会,查阅资料,了解下OpenCV各版本的差异及其演化过程,形成了以下几点认识:
但每年研究关注的内容都有所变化,有学者整理了2020年中最重要的、最有意思的人工智能相关论文,其中人工智能伦理 、模型偏见等都受到了比以往更多的重视。
场景描述:将「马赛克」像素级别的大头照转换成高清照片,是一种怎样的体验?杜克大学提出的 AI 算法,不仅可以「去掉马赛克」,还能精细到每一道皱纹、每一根头发。你要试试吗?
Midjourney 跟 ChatGPT 在 prompt 的使用上有很多不一样的地方,本章会详细介绍下 Midjourney 的 text prompt 区别。
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 以NeRF为代表的神经渲染技术高速发展,学界已经不满足合成几个新视角让照片动起来了。 接下来要挑战的是根据照片直接输出3D模型,可以直接导入到电影、游戏和VR等图形生产线里的那种。 所用照片不是出自高质量数据库,就是直接从网上搜集游客拍摄的各大景点,设备、天气、距离角度等都会不一致。 生成的结果远看结构完整,近看细节丰富,如果你有VR设备也可以在Demo中直接预览3D版。 这项最新突破由浙江大学和康奈尔大学团队合作完成,登上图形学顶会SIGGRAPH
【新智元导读】Facebook的“十年路线图”,人工智能成为重中之重。作为“后来者”的Facebook凭何赶超谷歌和微软等在人工智能已经遥遥领先的公司?本文深入Facebook人工智能最核心的两个部门:LeCun的FARI和Candela的AML,一个负责研究,一个负责应用,从某种程度上代表了学术和产业的矛盾,LeCun 如何平衡?文章认为,开放或封闭是Facebook能否在AI上获得成功的一个关键,更多的开源才会带来更多的人才。 Facebook的公司文化盛产口号,不少还都挺流行的,比如扎克伯格和其他高管
在过去的几年里,机器学习为各行各业开创了新纪元,诞生了许多成功的案例: Facebook 的面部识别,Netflix 的智能电影推荐系统,PrimaAI 的图像风格转换,Siri 的语音识别,Google Allo 的自然语言处理,及其他很多开发中的项目。
在过去的一年里,Mybridge AI 比较了近 8,800个开源机器学习项目,选择了前30名(概率只有0.3%)。 这是一个竞争激烈的名单,精挑细选了2017年1月到12月之间发布的最佳开源机器学习库、数据集和应用程序。Mybridge AI 通过考量受欢迎程度、参与度和新近度来等指标来评估这些参选项目的质量。这些项目在Github得星的数量平均为3,558个,其质量相当不错。 开源项目对数据科学家来说可能大有裨益。 通过阅读源代码并在现有项目之上构建一些东西来可以加快学习步伐。是该拿出时间来玩玩过去一年
本文介绍了神经网络在计算机视觉领域的应用,包括卷积神经网络、生成对抗网络、循环神经网络等。文章还讨论了训练数据集的重要性、模型的可解释性以及神经网络在医疗、自动驾驶等领域的应用。最后,文章提醒读者,虽然神经网络具有强大的拟合能力,但它们也有许多挑战,如过拟合、训练数据集偏差等。
原标题:Adobe国际认证-新的 Creative Cloud 版本支持创造性协作、推动创新并赋能创造性职业
谷歌正试图通过新的Active Question Answering(Active QA)智能体来模仿这一点,这是一个使用强化学习来训练AI进行问答的系统。当你提出一个问题时,它会产生很多有相似含义的问题。它会搜索所有问题的答案,然后选择最好的答案返回给你。
本周,全球的计算机视觉专家们即将齐聚威尼斯参加 ICCV (International Conference on Computer Vision)2017,展示计算机视觉和相关领域的最新研究进展。ICCV由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。CVPR每年召开一次,而ECCV和ICCV在世界范围内每年间隔召开。ICCV论文录用率很低,也符合它顶级会议的地位。 今年ICCV中,Facebook有15篇论文被收录,同时Faceboo
作者:Georgia Gkioxari、Shubham Tulsiani、David Novotny
你可能还记得《哈利·波特》里的神奇世界,报纸上的照片会动,墙壁上的名人画像能说话,甚至开门入户都要与“门神”胖夫人暗号问答一番。
导读:当地时间 2 月 18 日,Facebook 首席首席人工智能科学家、卷积神经网络之父 Yann LeCun 在旧金山的国际固态电路大会上发表了一篇论文,分享了他关于人工智能发展的一些看法,同时也谈到自己对于芯片和硬件发展的关注和研究。
Apache Kafka 是一个分布式开源流平台,被广泛应用于各大互联网公司。Kafka 设计之初被用于消息队列,自 2011 年由 LinkedIn 开源以来,Kafka 迅速从消息队列演变为成熟的事件流处理平台。
Kafka 设计之初被用于消息队列,自 2011 年由 LinkedIn 开源以来,Kafka 迅速从消息队列演变为成熟的事件流处理平台。
Kafka 具有四个核心 API,借助这些 API,Kafka 可以用于以下两大类应用:
在 2019 年,英特尔、高通和英伟达等大型芯片制造商发布了专门设计用于仅执行基于 AI 应用程序的芯片,主要用于计算机视觉领域、自然语言处理和语音识别。
提醒一下,我们计划发布的 QIIME 2 计划于 2020 年 8 月发布 (QIIME 2 2020.8),但请继续关注更新。
尽管今年世界上发生了这么多事情,我们还是有机会看到很多惊人的研究成果。特别是在人工智能更精确的说是计算机视觉领域。此外,今年还聚焦了许多重要的方面,比如伦理方面、重要的偏见等等。人工智能和我们对人类大脑及其与人工智能的联系的理解在不断发展,在不久的将来显示出了有前途的应用,这一点我一定会讲到。
11月23日,《牛津英文词典》宣布选择放弃“2020年度词汇”的评选,将2020年形容为“无法用一个单词妥帖概括的一年”。
论文名称:Collaborative Distillation for Ultra-Resolution Universal Style Transfer
自去年推出该功能以来,人们已经向Facebook上传了超过7000万张360度照片。Facebook使用多种方法来捕获360度照片和视频,这使人们可以与他们的朋友分享身临其境的体验。如果您拥有专用的360度相机,如理光Theta S或Giroptic iO,则可以从相机直接发布到Facebook。而现在大部分高端Android和iOS智能手机也都拥有全景模式的相机,可用于拍摄360度照片。
在过去几年中,机器学习开辟了很多新的领域,出现了很多高级应用案例:Facebook的脸部识别、Netflix的电影推荐、PrimaAI的图像风格转移、Siri的语音识别、Google Allo的自然语言处理等等。
这就是来自伯克利大学和谷歌的最新研究:NeRF,只需要输入少量静态图片,就能做到多视角的逼真3D效果。
新智元报道 编辑:Cecilia 【新智元导读】Facebook近日发布基于人脸识别技术的新功能"Photo Review",将个人肖像的知情权和控制权交还给用户。如果别人上传的照片中有你的形象,即使上传者没有对你进行标注,你也会收到提醒。这一功能可视作Facebook正在致力于消除用户对肖像隐私遭到滥用的担忧。 国内外各种社交媒体上,假冒明星的账户满天飞。顶着明星头像四处坑蒙拐骗的高仿号比比皆是。从明星到普通人,每个人都面临着个人肖像被滥用的风险。 全球最大的社交媒体Facebook曾在201
新智元报道 编辑:Cecilia 【新智元导读】Facebook近日发布基于人脸识别技术的新功能"Photo Review",将个人肖像的知情权和控制权交还给用户。如果别人上传的照片中有你的形象,即使上传者没有对你进行标注,你也会收到提醒。这一功能可视作Facebook正在致力于消除用户对肖像隐私遭到滥用的担忧。 国内外各种社交媒体上,假冒明星的账户满天飞。顶着明星头像四处坑蒙拐骗的高仿号比比皆是。从明星到普通人,每个人都面临着个人肖像被滥用的风险。 全球最大的社交媒体Facebook曾在2010年推出
选自arXiv.org 机器之心编译 参与:李泽南 UC Berkeley 的研究者们在图像风格转换领域的探索一直引人注目,几个月前的人工智能生成「猫片」:edges2cats 图像转换系统风靡一时。最近,该论文作者之一 Jun-Yan Zhu 又为我们展示了另一种图像风格转换技术。经过训练,这种被称为 CycleGAN 的新方法可以让马变成斑马,莫奈的画作变成照片,橘子变成苹果……在论文发表后,研究小组在 GitHub 上公布了该项研究的 Torch 实现。读者可点击阅读原文下载此论文。 论文:Unpa
本贴总结了2019年Reddit机器学习板块中分享的17个令人印象深刻的项目、研究、demo以及更多相关内容。其中既包括AI大厂的高光项目(GPT-2、StyleGAN等),也有小团队甚至个人做出的有趣的东西。希望小伙伴们能在这些精选资源中获得自己的收获。
“机器学习”的概念自上世纪50年代出来以来就备受科技界的关注,而近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来识别图像、声音和文本等数据。 美国科技媒体《连线》杂志网络版日前发文对“机器深度学习”技术的最新进展进行了总结。以下是文章的主要内容。 在QuocLe的眼中,世界都是由一系列的数字组成的。“一张数码照片实际上都是数字,”他说道,“如果将人们所说的话拆分成单独的音素,那么它们同样可以被编译成数字。”如果按照QuocLe的说法,就
借助于深度神经网络,俄罗斯国立高等经济大学的人研究人员已经提出了一种新方法,能够从视频中识别出人的身份。该方法不需要大量的照片,并且与现有方法相比具有明显更高的识别准确度——即使只有某个人的一张照片可用。
作者 | 鸽子 随着深度学习在各行各业的应用日趋成熟,应用范围越来越多元,AI工程师也开始头疼起来: 数据量越来越多,需要应对的场景越来越细分,模型的训练求越来越复杂,因此,耗在上面的时间也越来越长。 有没有一些前沿的研究,能大大缩短工程师在模型训练上的时间呢? 有! 近日,Facebook人工智能实验室就提出了一种新方法,称其能大幅度减少机器视觉任务的模型训练时间,只要1个小时,就能训练完如ImageNet这样的超大规模数据集。 不过,准确来说,Facebook提出的这套方法,其实解决的是图像小批量
1. GraphQL来啦! 当Facebook构建移动应用的时候,它需要的是一个强大的数据获取API: 足够强大,满足Facebook自身复杂业务的需求; 足够简单,对开发者和使用者来说很容易上手与使
GraphQL就是为了满足这一个需求而产生的,Facebook从2012年开始完善,与2015年展开GraphQL的开源的进程,并形成一个围绕GraphQL的社区。
近日,美国联邦贸易委员会(Federal Trade Commission ,FTC)公布了一项特殊的处罚决定:勒令一家名为「Everalbum」的公司删除其从客户手中收集的照片,以及利用这些数据训练出的所有算法。
第一篇是对发布的文档进行了学习,后续会针对比较重要的部分进行详细分析和学习。包括:
CSS最令人兴奋的新领域之一莫过于在3D空间操作网页元素,这一新技能给你打开了3D世界的大门,如果你能Get这一项技能,你也能绘制这个真实的世界。CSS 3D 第一次被介绍是在2009年,最早被应用在Safari浏览器。
在IT圈有这样一句(笑)话:任何一件需要重复两遍以上的事情,都有必要为它写一个脚本自动完成。话虽然夸张,但确实是这样的道理,事实上,在我们日常作业的许多方面其实都有"代码化"的途径,是否能掌握它取决于你有没有一颗喜欢探索的心(或者被重复性工作折磨的程度),今天我们来介绍一种神奇的命令,来使用Stata生成流程图。 老方法V.S.新方法 老方法---在word上手动点选 在word上画流程图有多麻烦,用Stata生成流程图就会有多简单。 回忆一下以前我们使用word画流程图的时候,是什么样子,我们在菜单栏、选
自从 Web 开始迅猛发展,对程序员来说开发 API 是一项很艰巨的任务。我们开发 API 的方式必须随着时间的推移而发展,以便我们始终可以开发良好、直观且设计良好的API。
📷 『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。 架构 使用WebRTC和WebVR进行VR视频通话 本文来自Google的开发专家Dan Jenkins,他喜欢将最新的Web API与RTC应用程序混合在一起。他还在Nimble Ape经营自己的咨询和开发公司。本文中,他给出了一个代码实现——通过使用WebVR将FreeSWITCH Verto WebRTC视频会议转换为虚拟现实会议的。LiveVideoStack对原文进
领取专属 10元无门槛券
手把手带您无忧上云