本周三,Google 发布了最新的 Cloud AutoML 技术,该技术能使企业开发者们通过 Google Cloud 平台自动创建机器学习模型。谷歌首先将发布 AutoML Vision,即用于建立机器视觉模型的工具,随后将陆续推出用于机器翻译和自然语言处理等的工具。 Cloud AutoML 将是开发者的利器,即便你不懂机器学习,也能训练出一个定制化的机器学习模型。具体来说,开发者只需要上传一组图片,然后导入标签或者通过 App 创建,随后 Cloud AutoML 就会自动生成一个定制化的机器学
翻译 | AI 科技大本营(rgznai100) 参与 | 刘畅、林椿眄 编辑 | 周翔、Donna 本周三,Google 发布了最新的 Cloud AutoML 技术,该技术能使企业开发者们通过 Google Cloud 平台自动创建机器学习模型。谷歌首先将发布 AutoML Vision,即用于建立机器视觉模型的工具,随后将陆续推出用于机器翻译和自然语言处理等的工具。 Cloud AutoML 将是开发者的利器,即便你不懂机器学习,也能训练出一个定制化的机器学习模型。具体来说,开发者只需要上传一组
MobileVLM 是一款专为移动设备设计的快速、强大和开放的视觉语言助手。它结合了面向移动设备的架构设计和技术,包括从头开始训练的 1.4B 和 2.7B 参数的语言模型、以 CLIP 方式预训练的多模态视觉模型,以及通过投影实现的高效跨模态交互。在各种视觉语言基准测试中,MobileVLM 的性能可媲美大型模型。此外,它还在高通骁龙 888 CPU 和英伟达 Jeston Orin GPU 上展示了最快的推理速度。
2019年入职、拿到200万offer的钟钊,仅用不到1年的时间,就带领团队将AutoML算法研究应用到了千万台华为Mate系列和P系列手机上。
谷歌从 17 年发布 MobileNets 以来,每隔一年即对该架构进行了调整和优化。现在,开发者们对 MobileNetV3 在一次进行了改进,并将 AutoML 和其他新颖的思想融入到该移动端的深度学习框架中。谷歌发布了相关文章对升级后的 MobileNetV3 进行了讲解,我们将其整理编译如下。
1.What Makes Good Examples for Visual In-Context Learning?
来源:medium 作者:Alex Honchar 翻译:刘小芹 【新智元导读】本文从开发者的角度,总结了GAN、AutoML、语音识别、NLP等已经可以用于实际产品的技术,以及值得关注的新趋势。作者认为,有ONNX这类的统一格式,Caffe Zoo等模型库,以及AutoML等自动化工具,制作基于AI的应用已经变得非常容易。 GAN与造假 虽然生成对抗网络几年前就出现了,我对它是相当怀疑的。几年过去了,即使看到GAN在生成64x64分辨率的图像方面取得了巨大的进步,我对它仍是怀疑的。在阅读了一些数学文章
过去几十年来,废物产生量大幅增加,这主要与经济发展和城市化密切相关。这种废物产生量的增加给全球各国政府在高效处理和管理方面带来了重大挑战。尽管发达国家已经实施了废物分类系统,但由于污染问题,仍有相当一部分废物最终被填埋或焚烧,导致可回收材料的不可持续浪费。
从深度学习技术被提出以来,一直践行着“think big”的理念。特别是当预训练技术被广泛应用之后,更多的数据结合更大的模型参数量会持续带来模型性能的提升,这条定律不断被近期发布的各种大模型所验证。在刚刚过去的2021年,百度文心大模型中的ERNIE3.0、微软和英伟达联合推出的MT-NLP以及谷歌的Switch Transformer等等,参数量可达千亿甚至万亿。
“他在深度学习爆炸的年代,冷静判断趋势,敢于投身主流研究领域之外的新兴方向 AutoML。他是业界最早提出可实用网络模型结构搜索算法的研究者之一,创建了国内第一代 AutoML 算法,并在 TPAMI、CVPR、 NIPS、 ICLR、 ICCV 等顶级期刊会议发表了多篇论文。他执着地想做能 work 的 research。” 作者 | 杏花 编辑 | 青暮 最近,“华为中国”头条号在《华为人》文章中高调宣称,2019 年入职、拿到 200 万 offer 的钟钊,仅用不到1年,就带领团队把 AutoML
通常在机器学习面试中,问完常见基础知识的技术问题之后会有具体的项目问题的讨论,所以这里准备了一些项目相关的话题,以可以帮助你准备和通过计算机视觉相关的面试。
谷歌又有了大动作。在大洋彼岸的谷歌Cloud Next conference大会上,谷歌一口气发布了多款AI新品和工具,主要包括:
过去一年,关于人工智能的事件、发现和发展比比皆是。很难从这些嘈杂的环境里分辨出关于 AI 的真实信号,即便可以,很多人也不知道那些信号表达的是什么信息。因此,我将尽力提炼过去一年里人工智能大环境中的一些模式来让你明确这一点。甚至,我们会在不久的将来见证其中的一些趋势。
视错觉图像可以欺骗人眼,这一直是引人入胜的研究课题,因为研究它们可以为人类认知和感知提供有价值的见解。澳大利亚弗林德斯大学的研究人员最近进行了一项非常有趣的研究,他们使用计算机视觉模型来预测视错觉的存在及其影响程度。
过去的一年,在 AI 领域里发生了许多事情,也有很多发现和丰富的发展。很难在各种观点中提取出有效的信号,如果它存在,那么这个信号又说明了什么。这篇文章的目的正在于此:我将尝试提取过去一年在 AI 领域里一些共通的模式。如果幸运的话,我们将看到一些(AI 的)趋势是如何延伸到不久的将来。
卷积神经网络(CNN)已被广泛用于图像分类、人脸识别、目标检测和其他领域。然而,为移动设备设计 CNN 是一项具有挑战性的工作,因为移动端模型需要体积小、速度快,还要保持精准。尽管人们已经做了大量努力来设计和改进移动端模型,如 MobileNet 和 MobileNetV2,但手动创建高效模型仍然是一项挑战,因为要考虑的因素太多。从最近 AutoML 神经架构搜索方面的进展受到启发,我们在想移动端 CNN 模型的设计是否也能受益于 AutoML 方法。
对于给定的音频数据集,可以使用Spectrogram进行音频分类吗?尝试使用Google AutoML Vision。把音频文件转换成各自的频谱图,并使用频谱图作为分类问题的图像。
新智元编译 来源:Google Research 作者:Ekin Dogus Cubuk & Barret Zoph 编辑:闻菲、克雷格 【新智元导读】谷歌研究人员最新提出了一种自动数据增强方法,
随着医疗行业的飞速发展,如何能针对每位患者的病情和个体差异,快速、精确地选择适合的诊疗方案,成为了人们关注的新焦点。在临床实践中,如何最大化病患问诊效率和利益,具备个性定制化的“精准医疗”已然成为了行业发展的重大趋势。在不断涌现的大数据、AI人工智能等先进技术的帮助下,医疗领域也迎来了优化革新的大好机遇。 台湾年洗肾人口破 9万,半数因心血管疾病死亡 肾脏作为人体的重要器官,承担着过滤血液、排除代谢废物、平衡水分电解质等关键功能。对于肾功能不足以维持生存的病患而言,肾透析是除了肾移植外唯一的保命手段。然而
在本教程中,我将向大家展示如何在Google AutoML中创建单个标签分类模型。我们将使用来自generate.photos的AI生成的面孔数据集。通过算法训练来判断一张脸是男性还是女性。之后,我们会将模型部署到云中,并创建该算法的Web浏览器版本。
近日,谷歌大脑的创始成员和 AutoML 的缔造者之一Quoc Le再推新研究论文,在题为“对抗性样本改善图像识别”一文中提出一种增强的对抗训练将对抗性样本AdvProp。
在5月20日举办的WAVE SUMMIT 2022深度学习开发者峰会上,百度发布了行业最大视觉多任务文心VIMER-UFO 2.0大模型,模型参数量达到170亿,单模型28项公开数据集SOTA,基于飞桨Task MoE架构,根据任务的不同自动选择激活最优的区域,从而实现100倍参数压缩,同时支持下游任务快速扩展。
近日,2021全球人工智能技术大会在杭州成功举办,在计算机视觉论坛上,腾讯优图实验室副总经理黄飞跃正式宣布,腾讯优图联合厦门大学人工智能研究院正式发布《2021十大人工智能趋势》(以下简称趋势报告),该趋势报告基于腾讯优图和厦门大学人工智能研究院长期对人工智能尤其是计算机视觉的研究洞察,提出3D视觉技术、数字内容产业、AI深度学习算法、人工智能内核芯片等方向的前沿预测。
如果说算法模型是果实,那么开发它的环境和框架就是培育果树的土壤。尽管平时在开发中,框架和底层环境没有那么引人瞩目,但没有这些底层技术的支持,优秀的思路和创意也就无从实现。当前,深度学习社区基本上被 TensorFlow 和 PyTorch 两大框架垄断。开源框架固然具有很高的人气和易用性,但是在国际环境变幻莫测的大背景下,是否依赖这些框架就足够保险呢?同时,如果企业有新的想法和业务需求,开源框架能否完美实现?是否能够无缝嵌入业务之中?这些都是 AI 企业需要思考的问题。
利用边缘计算和物联网设备进行实时分析具有广阔的发展前景,但为边缘部署设计的分析模型将会面临一些挑战。
机器之心发布 机器之心编辑部 腾讯优图实验室联合厦门大学人工智能研究院发布《2021 十大人工智能趋势》报告,对 3D 视觉技术、深度学习算法、人工智能内核芯片等众多领域的发展趋势进行了预测。 6 月 5 日,2021 全球人工智能技术大会(GAITC 2021)在杭州举办,汇集人工智能产学研各界领军者,以国际化、前瞻化、产业化视角,解析并洞察了新一代人工智能发展路径。 在大会上,腾讯优图实验室联合厦门大学人工智能研究院正式发布《2021 十大人工智能趋势》(以下简称“趋势报告”),基于双方长期对人工智能尤
2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分。至此,AutoML 开始进入大众的视野。
大模型那么香,我们将它从云侧拿到端侧开发应用,比如让每台手机都标配一个大模型,岂不是更香?
【导读】元学习描述了训练深度神经网络相关的更高级别的元素。在深度学习文献中,“元学习”一词经常表示神经网络架构的自动化设计,经常引用“ AutoML”,“少量学习”或“神经架构搜索”。OpenAI的魔方机器人手的成功源于诸如“通过梯度下降学习如何通过梯度下降学习”之类的可笑标题的论文,证明了该想法的成熟。元学习是推动深度学习和人工智能技术发展的最有希望的范例。
前不久,这家公司宣布加入 NVIDIA Metropolis 计划,为企业提供更快、更轻松、更易于访问的视觉 AI。Plainsight 的端到端视觉 AI 平台简化了机器学习过程,使客户能够快速创建并成功运行自己的视觉 AI 应用程序,以解决高度多样化的业务挑战。NVIDIA Metropolis 是一个应用程序框架、一组开发人员工具和合作伙伴生态系统,可将视觉数据和人工智能结合在一起,以提高各行各业的运营效率和安全性。
实时视频流分析在智能监控、智慧城市、自动驾驶等场景中具有重要价值. 然而计算负载高、 带宽需求大、延迟要求严等特点使得实时视频流分析难以通过传统的云计算范式进行部署. 近年来兴 起的边缘计算范式, 将计算任务从云端下沉到位于网络边缘的终端设备和边缘服务器上, 能够有效解 决上述问题. 因此, 许多针对实时视频流分析的边缘计算研究逐渐涌现.
自2012年至今,计算机视觉领域蓬勃发展,各种模型不断涌现,短短 8 年时间,计算机视觉领域便发生了天翻地覆的变化。那么如何看待过往变化,当下研究又如何?
高质量模型的设计和更新迭代是当前 AI 生产开发的痛点和难点,在这种背景下,自动化机器学习(AutoML)应运而生。2017年,谷歌正式提出神经网络架构搜索(Neural Architecture Search,NAS),并成为 AutoML 的核心组成部分。美团技术团队也对AutoML领域进行了积极探索,本文系美团与上海交通大学合作的一篇被深度学习顶会 ICLR 2021 收录的论文解读。
选自Medium 机器之心编译 参与:陈韵竹 近日,Medium上一篇题为《AI in 2018 for developers》的文章,针对机器学习应用于业界的机器学习开发人员,根据2017年的人工智能领域的最新和最重大进展,对2018年的进展做了展望。 大家好,又见面了!在上一篇文章中,我谈到了自己关于研究领域的看法,即哪些研究领域正在成熟且能在今年发展壮大。继续从事研究当然很棒,但是,必定还有一些人工智能领域在 2017 年已经成熟、现已准备投入大规模应用了。这就是本文的主题——我想分享的是那些已经发展
根据 GitHub 活跃数、开发人员使用人数、在招聘描述中出现的频率等综合数据分析,Google的 TensorFlow 仍稳居第一,被广大网友一致认为非常适合入门学习的 Keras 、人气涨势迅速的 PyTorch 、还有 Caffe 、Theano、MXNet 、CNTK 、Caffe 2.0、FastAi 等框架都紧随其后,受到越来越来多开发者和企业的关注。
众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!
自从AI出现之后,人类对于AI的担忧就从来没有消停过,特别是AlphaGo的横空出世将AI带到大众跟前,对AI的争论就更加激烈。对于普通大众而言,AI是否会毁灭人类不需太关心,但是对AI是否会取代人类工作就异常敏感了。夸张的是,现在某些高考填报志愿指南就有一个考量:这个职业是否会被AI取代,比如平民考生填报志愿的3个关键点这篇文章就认为将被AI取代的职业有:财会、英语、法律、人力资源等等,不建议报考。
最近,来自UC伯克利的计算机视觉「三巨头」联手推出了第一个无自然语言的纯视觉大模型(Large Vision Models),并且第一次证明了纯视觉模型本身也是可扩展的(scalability)。
在过去的十年中,出现了许多涉及计算机视觉(CV)的项目,无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的:
大家好,欢迎来到专栏《AutoML》,在这个专栏中我们会讲述AutoML技术在深度学习中的应用,这一期讲述现有可用的AutoML平台。
元学习描述了设计与训练深度神经网络相关的更高级别组件的抽象。术语“元学习”在深度学习文献中经常提及“ AutoML”,“少量学习(Few-Shot Learning)”,而涉及到神经网络体系结构的自动化设计时,则会提及“神经体系架构搜索(Neural Architecture Search)”。OpenAI的魔方机器人手的成功源于诸如“通过梯度下降学习如何通过梯度下降学习”之类的可笑标题的论文,魔方机器人手的成功反过来也证明了这些想法的成熟。元学习是推动深度学习和人工智能技术发展的最有希望的范例。
整个操作过程,从导入数据到标记和训练模型,都只需要用鼠标拖放界面即可完成。 人工智能和深度学习首席科学家李飞飞本周在某个新闻发布会上表示,人工智能和机器学习仍然是一个进入门槛高的领域,需要专业知识和资源,很少有公司自己能雇佣起机器学习和数据科学家。 兵贵神速,在今天的凌晨,谷歌就发布了用机器学习来训练机器学习的神器:Cloud AutoML Vision。 AI训练AI 谷歌的Cloud AutoML到底是什么? Cloud AutoML是一套机器学习产品,其背后的逻辑是用AI制作AI。它能够使具有有限机
机器之心原创 记者:CZ、Tony Peng 当地时间 5 月 17 日,谷歌在山景城开启了本年度的谷歌 I/O 开发者大会。昨日机器之心对此次大会上将出现的有关人工智能和机器学习的内容进行了梳理。机器之心作为谷歌官方受邀媒体来到现场,近距离为大家报道谷歌人工智能的最新进展。 从大会主题演讲可以看出,谷歌人工智能主要体现在以下五大方面: AI First 的整体战略; TPU 的升级与云服务; 集研究、工具、应用于一体的 Google.ai ; 人工智能技术的产品落地; 基于安卓和 TensorFlow 的
边缘AI(Edge AI)依然是新兴领域,许多人不清楚该为他们的项目选择哪些硬件平台。本文将比较一些当前领先的边缘AI平台。
OpenGVLab开源超高性能预训练模型,节省90%数据量!分类、目标检测、语义分割、深度估计,四大任务一网打尽! 作者丨吴彤 编辑丨陈彩娴 Github链接:https://github.com/opengvlab 家人们,你们有没有这种苦恼? 搬一次家就换一次家具,那些又贵又重的家具既不好搬运,又不好全部带走。 下一次又重新购置一遍家具,浪费钱不说,关键是来来回回都做一样的事情!家具还没用过几次,利用率不高呀! 这种搬家的苦恼,就好比AI领域,做几个任务就需要开发几个高度定制的模型,不仅所需的数据采
安妮 编译自 arXiv 量子位 出品 | 公众号 QbitAI 俗话说的好,耳听为虚。但眼见……也不一定为实。 机器学习模型很容易受到对抗样例的影响,一个图片中的微小变化可能会让模型将之认错。 例子
新智元报道 来源:Google Cloud Next18 作者:新智元编辑部 【新智元导读】谷歌云年度Next大会召开,李飞飞和李佳的“佳飞?”组合也迎来了她们在谷歌云的又一座里程碑:度过艰辛时刻
今年 7 月,2019 腾讯广告算法大赛「终极之战」在深圳腾讯滨海大厦顺利举行。本次总决赛现场,腾讯广告高级应用研究员石瑞超为大家带来了题为《广告场景下的 AI 视觉算法应用》的演讲。视觉算法应用于广告创意的三个阶段包括广告创建、广告审核及广告播放。研究员石瑞超为我们展示了 AI 视觉算法在解决广告落地中痛难点的优势与应用方法。以下是他的分享内容,AI 开发者做了不改变原意的整理与编辑。
Evolved Transformer不仅实现了最先进的翻译结果,与原始的Transformer相比,它还展示了语言建模的改进性能。
领取专属 10元无门槛券
手把手带您无忧上云