专栏首页GPUS开发者金山云正式推出GPU云服务器实例

金山云正式推出GPU云服务器实例

近日,金山云正式推出GPU云服务器实例P3I实例,目前已在金山云官网上线。P3I实例是业内首款采用英伟达高性能计算卡Tesla P4的云服务器产品,单实例负载能力是传统CPU的30倍以上,具有访存性能高、联网增强、配备新一代网卡三大特点,性价比更高,为包括语音识别、语义识别、语音合成、人脸识别、图像识别、场景识别、广告推荐、智能游戏和无人驾驶等在内的多种人工智能应用场景提供基础设施支撑,满足企业级客户对于计算的高标准需求。

P3I实例的推出,将加速人工智能技术应用的普及,通过优质的产品和体验,让人工智能的潜力得以全面释放。

率先采用Tesla P4计算卡

当下,人工智能可谓热度空前,上至科技巨擘,下至创业新秀,纷纷将人工智能技术当作开掘市场金矿的利器,例如智能音箱、智能电视、刷脸支付、无人超市、智能推荐、无人驾驶等等,大量的商业应用场景被一一建构,这对计算量、数据量、深度学习等能力提出了更高的要求。如何为人工智能提供充沛动力,加速相关应用的开发,降低计算成本压力,成为摆在很多企业面前的现实问题。

在金山云看来,作为深度学习的重要支撑,近年来GPU在很大程度上提高了服务器的运算能力,大幅度提升训练速度,由此产生的云端计算集群,已成为人工智能的重要引擎。此次推出的P3I实例,是业内首款采用英伟达高性能计算卡Tesla P4的云服务器实例产品,将为人工智能的应用提供澎湃动力。

Tesla P4专为处理深度学习工作负载,可提升服务器的工作效率,在任意超大规模神经网络上的推理延迟,较CPU降低15倍以上,推理吞吐效率较CPU提高60倍以上,相比英伟达上一代计算卡M4有更低的延迟和更大的吞吐。因此,P3I实例有着更好的性价比和效率,单实例负载能力是配备传统CPU服务器的30倍以上,适用于深度神经网络模型的推理预测等场景。

P3I实例提供两种配置,第一种配置一颗Tesla P4 GPU搭载8GB DDR5显存、14核vCPU、120GB内存和500GB SSD硬盘,计算能力5.5TFlops;第二种配置两颗Tesla P4 GPU搭载16GB DDR显存、28核vCPU、240GB内存和1000GB SSD硬盘,计算能力11TFlops。客户在使用该产品建设深度学习平台时,可根据业务负载选择不同配置,从而满足客户的定制化需要。

三大特点配合Tesla P4,助人工智能多点开花

为更好地发挥Tesla P4的作用,P3I实例具有三大特点。首先,P3I实例提高了Tesla P4的访存性能,进行了延时优化,性能提升22%,接近物理机水平。通过优化云服务器Hypervisor层性能,降低Tesla P4访问内存开销,优化了GPU DMA访存性能,加快HOST内存到数据交换速率,将充分发挥Tesla P4的运算能力。

第二,全线支持联网增强。P3I实例的联网增强大幅提高实例发包速率,能够降低60%以上的网络延迟。在刷脸认证、刷脸支付、刷脸门禁、语音识别等应用场景中,客户对时间延迟的敏感度最高,联网增强可大幅降低预测请求到预测系统(运行于P3I实例上)的时间延迟,加上Tesla P4低延迟的特点,P3I实例能为客户带来更优质的体验。

第三,P3I实例配备新一代智能网络适配器,带宽得到进一步提升。在人工智能的推理预测应用中,客户除了对时间延迟敏感,对于系统吞吐也有较高要求,P3I实例配备的新一代网络适配器,可帮助客户提升网络吞吐一倍以上,能够更好适配Tesla P4的吞吐能力。

人工智能需要找到应用场景,发展才有意义。P3I实例的推出,将帮助人工智能应用在各个行业不断落地,让客户更好发挥自身的优势和资源。目前,P3I实例已开放购买(https://kec.console.ksyun.com/pub/gpu.html),已有多家知名人工智能厂商的数十个应用正在适配。在人工智能产业从技术变革行进到应用落地的重要阶段时,P3I实例将成为金山云推动产业发展进步的新引擎。

本文分享自微信公众号 - 吉浦迅科技(gpusolution)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 破解人类神经密码:得人工智能者得天下

    吴恩达(Andrew Ng)是斯坦福大学人工智能实验室主任,2013年《时代》杂志评选的全球最具影响力百大人物中上榜的十几名科技人物之一,目前领导着G...

    GPUS Lady
  • AMD发布APPML源码,构建clMath库

    APPML(Accelerated Parallel Processing Math Library )和Bolt(C++ template librar...

    GPUS Lady
  • 微软推出价值4000万美元的人工智能健康计划

    尽管人工智能已经渗透到许多技术密集型行业,但医疗行业的发展速度仍是典型的缓慢,而在医疗保健领域,功能性人工智能的实施仍相对罕见。微软现在的目标是加速这一进程,它...

    GPUS Lady
  • 人工智能及相关图书推荐

    人工智能及相关图书书单,共6本: 《人工智能简史》 《走近2050:注意力、互联网与人工智能》【有电子版】 《科学的极致:漫谈人工智能》【有电子版】 《机器人科...

    小莹莹
  • SpaceX推迟载人绕月商业计划,原定于今年第二季度发射 | 热点

    镁客网
  • 个人情报收集系统浅谈

    *文章原创作者: ArthurKiller,转载请注明来自FreeBuf(FreeBuf.COM) 前言 IT的全称为information technolog...

    FB客服
  • postMessage与postMessage跨域

    HTML5学堂今日postMessage跨域教学流程 先为大家讲解postMessage的基本知识 之后,我们书写一个实例:使用静态的iframe,实现A域前端...

    HTML5学堂
  • 物流巨头顺丰如何布局AI?这是其AI首席科学家的详细解读

    随着人工智能的发展,一些物流公司也纷纷尝试利用人工智能技术优化物流环节,提高物流效率。就人工智能将如何改变物流业?物流领域人工的岗位和人工智能之间的关系是什么?...

    企鹅号小编
  • JVM性能调优实践(二)——G1 垃圾收集器分析、调优篇

    关于G1 GC以及其他垃圾收集器的介绍可以参考前一篇JVM性能调优实践——G1 垃圾收集器介绍篇。了解了G1垃圾收集器的运行机制之后,就可以针对一些GC相关参数...

    周三不加班
  • Java中private、protected、public和default的区别

    default:同一包中的类可以访问,声明时没有加修饰符,认为是friendly,本包

    ydymz

扫码关注云+社区

领取腾讯云代金券