作者 | Weize Quan , Kai Wang, Dong-Ming Yan , Xiaopeng Zhang
杨净 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你算个什么鸟? 面对上面这两张图,一个AI发出了灵魂拷问。 左边桃面牡丹鹦鹉,右边费氏牡丹鹦鹉。 一眼识破的它早就看到左边的鸟的喙部和眼圈与右边的不一样。 不行,再来!再来看这组。(文末揭晓答案) 好,我放弃了。 这个来自浙大计算机学院和阿里安全的“找茬”选手,识别准确率达到了91.3%,已经是业内最优水平。研究成果已被多媒体国际顶会ACM MM 2021收录。 不光鸟,阿猫阿狗也能行,甚至花草植物也能行。 看看这连两张照片,吉娃
编者按:一年前,Facebook发布了照片分享应用Moments,于前不久关闭了iOS版Facebook照片同步功能,力推Moments应用,该应用运用了人脸识别技术。不过,Facebook人工智能实验室负责人Yann Lecun在为我们通俗易懂地介绍Moments的应用原理时表示,除了简单的人脸识别技术,Facebook将利用更卓越的计算机视觉技术和AI技术为用户提供更多便利,如尝试开发计算机的移情能力,当然,这些便利的应用背后需要强大的算法和繁琐的训练过程做支撑。让我们一起期待未来计算机能够更好地理解人
选自code.Facebook 作者:Dhruv Mahajana、Ross Girshick、Vignesh Ramanathan、Manohar Paluri、Laurens van der Maaten 机器之心编译 参与:路、张倩 人工标注数据需要耗费大量人力成本和时间,对模型训练数据集的规模扩大带来限制。Facebook 在图像识别方面的最新研究利用带有 hashtag 的大规模公共图像数据集解决了该问题,其最佳模型的性能超越了之前最优的模型。 图像识别是 AI 研究的重要分支之一,也是 F
人工智能在经过了5年突破性的发展,2015年是人工智能发展的一个里程碑。计算机已经变得更加的精巧并且学习速度比以前更快。 谷歌的高级研究员Jeff Dean说,AI领域可以说确实处于加速发展中。为了庆祝他们的成就和制定关于人工智能领域的发展计划,这周Dean和许多其他AI领域的顶级人物聚集在蒙特利尔召开的神经信息处理系统会议。这个会议开始于1987年,并且由于其对AI领域不断进行探索研究,最近几年其已经发展成硅谷众多公司必须参加的重大会议。Facebook的首席执行官马克扎克伯格在NIPS上宣布要成立一个
数据猿导读 基于云计算技术的通信公司Fuze获1.04亿美元融资;法国巴黎银行拟30亿欧元投资科技领域,以面对市场冲击;我国首家大数据流通与交易技术工程实验室正式揭牌成立……以下为您奉上更多大数据热点
导读: 在5亿4千万年的自然选择和进化下,人类精密的视觉体系能够在不到1s的时间内完成图像捕捉、图像识别、图像理解等一系列过程,成为我们感知世界的第一扇大门。 计算机视觉(Computer Vision, CV),就是以人工智能技术模拟人类视觉体系,教计算机利用摄像机和电脑对目标进行分割、分类、识别、跟踪、判别决策,和我们一样“看懂”世界,甚至看见我们目力所不能及的新视界。 作为人工智能的重要核心技术之一,计算机视觉技术其实就在我们身边,目前应用于安防、金融、硬件、营销、驾驶、医疗等领域,帮助提升我
翻译 | Serene 编辑 | 阿司匹林 出品 | 人工智能头条(公众号ID:AI_Thinker) 2017 年 7 月,最后一届 ImageNet 挑战赛落幕。 为何对计算机视觉领域有着重要贡献的 ImageNet 挑战赛,会在 8 年后宣告终结? 毕竟计算机系统在图像识别等任务上的准确率已经超过人类水平,每年一次突破性进展的时代也已经过去。 近日,FAIR(Facebook AI Research) 的 Ross Girshick 、何恺明等大神联手,在 ImageNet-1k 图像分类数据集上取得
美团基础研发平台视觉智能部与中科院计算所展开科研课题合作,共同构建大规模数据集Food2K,并提出渐进式区域增强网络用于食品图像识别,相关研究成果已发表于T-PAMI 2023。
在人工智能飞速发展的今天,大模型的感知能力已经达到了令人惊叹的水平。但是,它们真的能够像人类一样,洞悉图片中的深层含义吗?为了探讨多模型大模型与人类的差距,来自中科院深圳先进院,M-A-P,华中科技大学,零一万物,滑铁卢大学等多家机构联合提出了首个用于评估多模态大模型(MLLMs)图像隐喻理解能力的综合性基准测试II-Bench。
导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础。算法、数据、系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升级。 一、背景介绍 前面的系列文章分别介绍了算法和数据,如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础。算法、数据、系统三位一体,组合成完整的OCR在线服务。伴随着算法的升级和业务的持续接入,系统也经历了从单机版升级到分布式版本;从为了每个算法定制系统
Keras是一个高层神经网络API,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。Keras 为支持快速实验而生,能够把你的idea迅速转换为结果,如果你有如下需求,请选择Keras:
图像识别是计算机视觉中最为成熟的领域了。从 ImageNet 开始,历年都会出现各种各样的新模型,如 AlexNet、YOLO 家族、到后面的 EfficientNet 等。这些模型都在刷新着各种图像识别领域的榜单,创造更令人惊讶的表现。
AI科技评论报道 编辑:琰琰 话说,你能看出上面这三只鹦鹉有什么不一样吗?脸盲如我,要使出玩“我们来找茬”的十级能力。 AWSL,鹦鹉鹦鹉,傻傻分不清楚。 结果,AI一顿操作猛如虎,进行了判断:左边的是桃面牡丹鹦鹉,右边的是国家保护动物费氏牡丹鹦鹉,二者区别仅在于喙的颜色以及白色眼圈。 小鸟并不孤单,猫猫狗狗和花花草草也在被“找茬”。 最近,浙江大学和阿里安全在AI细粒度图像识别技术上取得了新进展,利用RAMS-Trans相关技术先后在公开数据集CUB(鸟类识别)、St
结果,AI一顿操作猛如虎,进行了判断:左边的是桃面牡丹鹦鹉,右边的是国家保护动物费氏牡丹鹦鹉,二者区别仅在于喙的颜色以及白色眼圈。
内容一览:人脸识别可以锁定人类身份,这一技术延申到鲸类,便有了「背鳍识别」。「背鳍识别」是利用图像识别技术,通过背鳍识别鲸类物种。传统的图像识别依赖于卷积神经网络 (CNN) 模型,需要大量训练图像,并且只能识别某些单物种。近期,夏威夷大学的研究人员训练了一种多物种图像识别模型,该模型在鲸类应用中表现出色。
近日,百度深度学习实验室主任林元庆在百度年终媒体分享会上做了《看懂AI-百度技术开放日》的演讲,从客观层面阐述了人工智能技术研发的四大支柱,为我们呈现了让人工智能更深层,更极致的方法论,下面是演讲精华
一个偶然的机会,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为QQ空间、腾讯地图、腾讯游戏、等50多款产品提供图像技术支持。每天QQ空间有2亿上传图片的活跃用户,团队单日最多处理照片达6亿张,累计已经分析处理了超过300亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对一些关键技术,
传统的水果图像识别系统的一般过程如下图所示,主要工作集中在图像预处理和特征提取阶段
近日,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对
下面这张在网上流传的图片展示了吉娃娃和松饼之间惊人的相似之处。这些图像通常在人工智能(AI)行业(包括我自己)的演示中共享。 但有一个问题没有人回答过:在消除像吉娃娃或松饼这样的图像的不确定性时,到
AI 科技评论按:近日 Facebook 科学家团队发布基于主题标签的深度学习方法,使用已有的拥有主题标签的图片作为训练数据,从而大幅提升了训练数据集的大小。数据集的增大必然会引起图片错误率的提升,他们同时发布了处理图片噪音的方法。他们团队的这项工作对于现今的图片识别领域有着广泛而深远的影响。AI科技评论对全文翻译如下。
机器之心专栏 机器之心编辑部 来自香港中文大学、上海人工智能实验室等机构的研究者提出了高效的视频理解迁移学习框架 EVL,通过固定骨干基础模型的权重,节省了训练计算量和内存消耗。 视觉基础模型近两年取得了瞩目发展。从一方面而言,基于大规模互联网数据的预训练已经给模型预置了大量的语义概念,从而具有良好的泛化性能;但另一方面,为充分利用大规模数据集带来的模型尺寸增长,使得相关模型在迁移到下游任务时面临着低效率问题,尤其是对于需要处理多帧的视频理解模型。 论文链接:https://arxiv.org/abs/2
本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。
GeekPwn虽然是一场黑客趴,但也非常适合普通用户来参与,尤其是在蒋昌建老师这位老司机带路的情况下。10月24日,草榴节……呸!程序员节,来自全国各地还有部分海外的黑客们汇聚魔都,这场为期两天的黑客趴GeekPwn 便正式拉开帷幕。
导读:早在21世纪初开发大数据技术(诸如Hadoop、Pig和Hive)时所开展的研究和产品开发,就已经涵盖了目前大多数大型商业企业所开展的工作。
大众集团日前宣布,将加大投资力度来加强其位于德国慕尼黑AI数据实验室的实力,专门致力于人工智能技术的研发。大众方面称,虽然目前正在削减内部开支,但作为IT计划的一部分,大众在慕尼黑的AI数据实验室并未受到影响,会有更多的人力投入人工智能团队的建设。 据了解,大众数据实验室的研究团队将继续发展无人驾驶技术和机器人学,主要研究方向包括机器学习技术,即引导机器人和传感器加强识别能力,以对行驶中遇到的物体和不同情形作出辨识,换言之,团队希望提高汽车摄像头的检测能力,减少无人驾驶汽车因拍摄盲区等而存在的安全隐患。 另
随着人工智能和机器学习技术在互联网的各个领域的广泛应用,其受攻击的可能性,以及其是否具备强抗打击能力一直是安全界一直关注的。之前关于机器学习模型攻击的探讨常常局限于对训练数据的污染。由于其模型经常趋向于封闭式的部署,该手段在真实的情况中并不实际可行。在GeekPwn2016硅谷分会场上,来自北美工业界和学术界的顶尖安全专家们针对当前流行的图形对象识别、语音识别的场景,为大家揭示了如何通过构造对抗性攻击数据,要么让其与源数据的差别细微到人类无法通过感官辨识到,要么该差别对人类感知没有本质变化,而机器学习模型可
选自free Code Camp 作者:Mariya Yao 机器之心编译 参与:蒋思源、刘晓坤 本文通过吉娃娃与松饼的图像对比了流行的六大计算机视觉API,作者希望能借助这些识别情况帮助读者了解各
细粒度图像识别 [1] 是视觉感知学习的重要研究课题,在智能新经济和工业互联网等方面具有巨大应用价值,且在诸多现实场景已有广泛应用…… 鉴于当前领域内尚缺乏该方面的深度学习开源工具库,南京理工大学魏秀参教授团队用时近一年时间,开发、打磨、完成了 Hawkeye——细粒度图像识别深度学习开源工具库,供相关领域研究人员和工程师参考使用。本文是对 Hawkeye 的详细介绍。
神经网络压缩是指在对神经网络性能影响不大的情况下,通过有关方法来减少网络的参数和存储空间,大体上可以分为近似,量化和剪枝三类方法。
“在未来30年, 人工智能将取代目前世界上50%的工作。” ——莱斯大学 计算机科学教授 Moshe Vardi 不管未来怎么样,我觉得提高设计师的效率是眼前最容易做到的事情。 设计师打交道最多是图像
Airtest是一款网易出品的基于图像识别面向手游UI测试的工具,也支持原生Android App基于元素识别的UI自动化测试。主要包含了三部分:Airtest IDE、Airtest(用截图写脚本)和 Poco(用界面UI元素来写脚本)。来自Google的评价:Airtest 是安卓游戏开发最强大、最全面的自动测试方案之一。 图示为AirtestIDE中脚本运行范例 本文重点是针对Airtest中的图像识别进行代码走读,加深对图像识别原理的理解(公众号贴出的代码显示不全仅供参考,详细代码可以在git
早在2019年8月,伦敦癌症研究所就在 NPJ Breast Cancer 杂志上发表了一篇文章,称他们将 AI 应用于分析乳腺癌的基因序列与分子数据,最终成功识别出 5 种新的乳腺癌亚型,还能辨识出哪些女性对乳腺癌有较好的免疫力。
---- 新智元报道 来源:aiweirdness、gizmodo 编译:肖琴 【新智元导读】神经网络的专长之一是图像识别。谷歌、微软、IBM、Facebook等科技巨头都有自己的照片标签算法。但即使是顶尖的图像识别算法,也会犯非常奇怪的错误,它只看到它希望看到的东西。同样,即使是非常聪明的人类,也会被算法“愚弄”。 今天,只要你生活在互联网的世界,你就可能与神经网络交互。神经网络是一种机器学习算法,从语言翻译到金融建模等各种应用,神经网络都可以发挥作用。它的专长之一是图像识别。谷歌、微软、I
大数据时代,文本、语义和社交分析就像企业的“天眼”,可以聆听到来自用户、患者和市场的声音。目前文本、语义和社交分析技术已经包括金融、医疗、传媒、电商在内的在多个行业得到广泛应用,企业从海量的互联网和企业内部数据,包括文本、视频等结构化和非结构化数据中提取那些能提高决策质量的有用信息和情报。 但是,文本、语义和社交分析技术依然处于成长期,在一些领域,例如数据分析和市场研究方面的应用还只是刚刚起步,而在相对成熟的领域,例如用户体验、社交聆听和用户互动方面,还有很大的提升空间。 总之,文本、语义和社交分析技术
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门、OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子、图像增强技术、图像分割等,后期结合深度学习研究图像识别、图像分类应用。希望文章对您有所帮助,如果有不足之处,还请海涵~
编者按:新手上路都会有一个疑问,如果自己没有相关基础,如何学习晦涩的专业知识?此前雷锋网编译了《从0到1:我是如何在一年内无师自通机器学习的?》,这篇文章讲述了 Per Harald Borgen 的自学历程。而关于深度学习,GitHub的 songrotek 同样有话要说。原文名为《Deep Learning Papers Reading Roadmap》,雷锋网奕欣及老吕IO整理编译,未经许可不得转载。 0. 深度学习的“圣经” 提到入门级的书,就不得不提这一本 Bengio Yoshua,Ian J.
(接上篇) 吸引之处 那么到底什么是图像识别呢?世界上的大多数事物有自己的名称,图像识别的功能就是告诉人们这些图像上显示的是哪些事物。换句话来说,根据图像辨别出图像中出现的事物。 我们无法从椅子的内在去描述它, 能做的就是给出很多个不同椅子的样子,然后说:长得像这样的,我们就称为椅子。所以实际上,我们是通过将看到的事物与椅子的外观进行对比,如果两者很像,我们就认为这个事物叫椅子,如果不像,那它就不是椅子。 现在有很多系统采用这种吸引子Attractors。想像这样一个场景,在群山周围,一滴雨有可
大家好,前几天的时候写过一篇滴滴和自动驾驶的文章,大家反响很好。有些小伙伴在后台给我留言说让我详细讲讲自动驾驶,倒不是我不想讲,而是确实没干过。好在我虽然没吃过猪肉,但之前听过很多大佬的内部分享,也算是看过猪跑了,就把我了解到的结合一些我自己的思考分享给大家。
通知:这篇推文有14篇论文速递信息,涉及目标检测、图像分割、显著性目标检测、人脸识别和GAN等方向 最近有些忙,论文速递频率快下降至两天一更了,希望大家可以体谅。 前文回顾 [计算机视觉] 入门学习资料 [计算机视觉论文速递] 2018-03-14 [计算机视觉论文速递] 2018-03-11 目标检测 [1]《Illumination-aware Faster R-CNN for Robust Multispectral Pedestrian Detection》 Abstract:对于行人检测来
在计算机视觉领域,图像识别这几年的发展突飞猛进,但在进一步广泛应用之前,仍然有很多挑战需要我们去解决。本文中,微软亚洲研究院视觉计算组的研究员们为我们梳理目前深度学习在图像识别方面所面临的挑战以及具有未来价值的研究方向。
基于忆阻器的神经形态计算系统为神经网络训练提供了一种快速节能的方法。但是,最重要的图像识别模型之一——卷积神经网络还没有利用忆阻器交叉阵列的完全硬件实现。此外,由于硬件实现收益小、变化大,设备特性不完善,其结果很难媲美软件实现。
科研路上我们往往会读到让自己觉得想法很惊艳的论文,心中对不同的论文也会有一个排名,以下介绍了一些知乎作者心中白月光般存在的深度学习领域论文,看看是否你们拥有同样心目中的The one。
导语 | GAME AI SDK 是腾讯 TuringLab 研发的首个开源项目,着重解决自动化测试工具中的通用性问题,最初主要用于游戏 AI 自动化测试服务,现在可用于手机 APP、PC 端游戏、软件等专项自动化测试。通过 AI 算法进行大数据训练的网络模型具有良好的通用性,可以直接在同一类游戏(软件)中适用。文章作者:周大军,腾讯 AI 工程组专家工程师。
李林 编译整理 量子位 出品 | 公众号 QbitAI 2015年,黑人兄弟Jacky Alciné震惊地发现,他们被Google图像识别算法歧视了:Google Photos竟然把他的黑人朋友分类成
来源:PaperWeekly 本文约1800字,建议阅读5分钟 本篇文章介绍一下我们于 ECCV-2022 发表的一篇模型自蒸馏文章。 传统的知识蒸馏(Knowledge Distillation,KD)需要一个预训练的教师模型来训练一个学生模型,这种模式的缺点是需要设计并训练额外的教师网络,并且两阶段的训练过程提升了流水线开销。自网络知识蒸馏(Self-Knowledge Distillation,Self-KD),顾名思义,则是不依赖额外的教师网络进行指导,利用网络自身的知识来指导自身的学习,从而实现自
本文主要介绍了一种基于Java和C++混合编程的图像识别服务框架的设计与实现,该框架可以同时支持多种图像识别算法,并提供了灵活的配置方式和容错机制,可广泛应用于各类业务场景。
领取专属 10元无门槛券
手把手带您无忧上云