首页
学习
活动
专区
工具
TVP
发布

最强AI算力芯片昇腾910助阵,华为Atlas平台成普惠AI新选择

围棋对弈,曾被认为是机器计算的禁区,随着深度学习算法的突破,现在计算机的棋力已经可以全面压制人类顶尖棋手;自动泊车,原本是顶级豪车才具备的卖点,而现在已经成为越来越多的国产新能源汽车的标配……智能化浪潮在席卷世界,甚至连我们身边的每一盏信号灯、每一个摄像头都在走向智能化,普惠AI需要坚实的底层架构基石。

8月23日,随着具有最强AI算力的昇腾910发布,Atlas智能计算平台实现了产品线的再一次扩充,Atlas平台也成为了普惠AI的优先选择。

Atlas平台已实现全栈全场景AI解决方案覆盖

人工智能(AI)在几年前还是一个略显高大上的科技词汇,但现在无论是在各种科技峰会还是日常生活中,人们讨论的焦点已经不再是人工智能的种种美好愿景,而是在讨论如何将AI技术运用到自己的业务或者生活之中,到了实际应用阶段,人们会对AI加速组件的成本、开发环境和商业价值有更现实的评判和考量。

人工智能的广泛普及,近年来被视为生产力再次提升的一个重要契机,但AI算力昂贵、AI开发工具匮乏等现实问题,又成为了AI发展不得不面对的现实。所以,人们希望AI市场上出现新变量,可以提供多样性的AI算力选择和具有弹性的AI开发工具包以及成熟健全的AI生态。

华为在2018年全联接大会上提出了全栈全场景AI战略,并发布了AI芯片昇腾310和昇腾910;在2019年8月23日,华为正式发布了算力最强的AI处理器昇腾910和全场景AI计算架构MindSpore,华为公司轮值董事长徐直军在发布会上宣布:华为昇腾910、MindSpore的推出,标志着华为已完成全栈全场景AI解决方案(Portfolio)的构建,也标志着华为AI战略的执行进入了新的阶段。

徐直军在发布昇腾910产品之前,首先重申了华为公司的AI战略:投资AI基础研究,在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求) 、能耗高效(更低的算力和能耗) ,安全可信、自动自治的机器学习基础能力;打造全栈全场景解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的AI平台;投资开放生态和人才培养,面向全球,持续与学术界、产业界和行业伙伴广泛合作;把AI思维和技术引入现有产品和服务,实现更大价值、更强竞争力;应用AI优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量。

徐直军还发布了全场景AI计算框架 MindSpore。能否大大降低AI应用开发的门槛,能否实现AI无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与AI计算框架息息相关。为此,去年华为全联接大会上,华为提出,AI框架应该是开发态友好,要能适应每个场景包括端、边缘和云。经过近一年的努力,全场景AI计算框架MindSpore在这三个方面都取得了显著进展。

华为Atlas人工智能计算平台基于华为昇腾系列AI处理器和业界主流异构计算部件,通过模块、板卡、小站、AI服务器等丰富的产品形态,打造面向“端、边、云”的全场景AI基础设施方案,可广泛用于“平安城市、智慧交通、智慧医疗、AI推理”等领域。随着华为昇腾910正式发布,华为的Atlas人工智能计算平台在全栈全场景AI解决方案产品序列上也逐渐完整,用户可以根据自身不同的算力需求和业务特点来打造不同的AI解决方案。

其中Atlas 200 AI加速模块只有半个信用卡大小,却可以支持16路高清视频实时分析,功耗仅为9.5W左右,应用在智能摄像头、无人机等物联网智能化领域非常适宜。

Atlas300 AI加速卡则采用半高的PCIe卡设计,主要面向数据中心和边缘侧服务器场景,单卡即可支持64TOPS INT8计算性能,相比业内同类型产品有3倍的性能提升,可以为深度学习和推理提供强大的算力支持。

Atlas500 智能小站适用于边缘侧产品,机顶盒大小可以实现16路高清视频处理能力,可广泛应用于交通、无人零售、智能制造等领域。Atlas 深度学习解决方案则在标准建构和编程基础之上,提供经过优化的AI环境,同时集成华为集群管理、任务调度等功能组件,可以大幅降低企业AI应用的门槛,让用户买回去开箱即可用。

之前市面上流行的GPU加速AI服务器,在模型训练这样的应用更适合,在训练算法成熟后,其实在执行时并不需要如此超高的计算力,而是需要功能和成本更为平衡的解决方案,之前市场上FPGA加速卡无论是种类还是数量上可选择的空间都非常狭小。

现在业内主流的AI计算平台通常采用x86计算平台+NVIDIA异构计算加速卡,而华为Atlas计算平台涵盖x86平台、AI计算平台和ARM计算平台,无论是从解决方案的丰富程度上,还是在单机单卡计算密度上,都让用户有充足的选择空间和余地,用户可以根据自己的业务需求选择更适合自己的方案组合。

昇腾芯片,让AI算力多样性从愿景变为现实

要想造一部好车,一台好的发动机必不可少。而要打造一个性能强劲、功耗控制得当的AI加速平台,一颗好的AI处理器也是不可或缺的。

在HC2018上,昇腾910的技术规格其实已经公布,而此次徐直军给出了AI处理器昇腾910的实际测试成绩,在算力方面,昇腾910完全达到了设计规格,半精度 (FP16)算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。徐直军表示:昇腾910总体技术表现超出预期,作为算力最强AI处理器,当之无愧。华为已经把昇腾910用于实际AI训练任务。比如,在典型的ResNet50 网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升。面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资,推出更多的AI处理器,面向全场景持续提供更充裕、更经济、更适配的AI算力。

除了最新发布的昇腾910,其实更早发布的昇腾310 AI处理器,已经被广泛应用于实际之中,昇腾310在最大功耗仅8W的情况下,其整数精度(INT8)算力达到16Tops,半精度(FP16)算力达到8Tops,同时,该芯片中还集成了16通道 全高清 视频解码器,是面向边缘计算场景最强算力的AI SoC。自发布以来,基于昇腾310芯片的产品和云服务获得广泛应用。其中,基于昇腾310的MDC和很多国内外主流车企在园区巴士、新能源车、自动驾驶等场景已经深入合作。基于昇腾310的Atlas系列板卡、服务器,与数十家伙伴在智慧交通、智慧电力等数十个行业落地行业解决方案。基于昇腾310,华为云提供了图像分析类服务、OCR服务、视频智能分析服务等云服务,对外提供API达50多个,日均调用量超过1亿次,而且数量仍在快速增长,预计年底日均调用量超过3亿次。另有超过100多个客户使用昇腾310开发定制AI算法。

专为AI而生的昇腾芯片,可以说是AI原生芯片,在算力密度、功耗等方面,与同类产品相比都保持着明显的性能优势,昇腾芯片也成为Atlas平台鲜明的个性化标签,为用户提供了差异化的方案选择。

华为不只造AI芯片,而是在构筑AI完整生态

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190828A0OER100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券