7 月 21 日,“决胜算力时代 ”AI 算力高端闭门分享会在北京天使汇极客咖啡举办。本次分享会由 CSDN 发起,由 CTO 俱乐部,深脑链、AI 科技大本营和区块链大本营协办。
分享会从 AI 算力的现状和趋势谈起,并从硬件设计和算法优化两个层面切入,剖析算力提升的最新落地经验和误区,最后针对算力成本居高不下的普遍现状,引入算力的新型协作方式---借用区块链生态的分布式协作,大幅降低企业算力成本。
以下为嘉宾分享内容简介:
▌1. 国科大数据挖掘与高性能计算实验室负责人刘莹教授发表了题为《基于异构并行计算的大数据分析与挖掘》的演讲。
刘莹教授提到,单 CPU 的发展已经不能满足实际应用的需求,AI 时代必须要依靠并行计算。目前,并行计算的主流架构是异构并行计算平台。除了科技巨头和人工智能公司在做相关研究之外,她的团队也在做基于异构并行环境的一些数据挖掘研究,也就是人工智能的一些算法,包括关联规则、聚类到分类,而对于自动编码机,推荐算法他们也做了异构并行资源,包含GPU集群上面的加速。
以协同过滤算法为例,它是一种非常重要的推荐系统算法,他们为此设计了两个计算核,一个是计算相似度,一个是计算平均值,把这些核心计算全部都在 GPU 上进行计算来加速算法。他们团队目前正在做的基于光学遥感图像的舰船检测与识别项目就是在 GPU 加速下完成的,建模时间比 CPU 的速度提升了 57 倍。
PPT链接: https://img-bss.csdn.net/201807241705592588.pdf
▌2. 探智立方联合创始人宋煜则介绍了 AutoML,讲述了其计算力的需求的分析与展望。
他指出,AutoML 最核心的内容就是用计算力和数学方法自动做数据特征提取以及模型建模。
AutoML 的整个过程需要大量的计算力,它对算力需求分为两部分,第一部分是本身的模型评估,这与平时模型的训练类似。第二部分是模型搜索,所以模型的搜索过程可能是对最优解分布的估计,在估计完之后,过程拿到的结果反过来会重新影响到参数,重新对最优解分布范围重新做一次估计。
宋煜认为,AutoML 的发展最重要的一点是,用矩阵表达计算图结构并且把所有图操作变成矩阵运算,从而使得模型设计可以使用 blas 库加速,以及针对特殊算法设计加速芯片。
▌3. PerfXLab澎峰科技联合创始人张先轶分享了主题为《InferXLite:轻量级深度学习推理框架》的内容。
张先轶介绍了 InferXLite 轻量级深度学习推理框架以及配套的底层性能加速库。他们关注在嵌入式端侧的部署,比如无人机、智能摄像头等。他主要从性能库(BLAS、DNN库等)和框架两个维度讲述了嵌入式 AI 性能优化。
针对深度学习优化,他们主要为了解决四个问题:GEMM Kernrl 优化,包括 Neon 指令、预取距离参数、Unroll 参数;GEMM Pack 函数,Pack 函数优化,尽量连续写;并行化,需要细粒度切分;定点化,要实现 int8 gemm。
PPT链接: https://img-bss.csdn.net/201807241658331383.pdf
▌4. 深脑链 CEO 何永以《区块链驱动的人工智能云计算平台》为题作了分享。
由于爆炸增长的 AI 算力需求是目前制约人工智能发展的主要瓶颈,所以他谈到了区块链如何以分布式协作,将“挖矿”和 AI 训练结合在一起,将汇集闲散的算力用于 AI 训练中,以及如何将区块链浪费资源的计算转化为高效率的人工智能深度学习,机器学习训练和区块链计算挖矿。
何永认为未来中心化的云计算可能会走向分步式的云计算,主要有以下两个原因,第一是 GPU 很便宜,可以节省 70% 以上的成本。可以通过闲置资源再利用的方式,比如可以把资金拿出来,然后在生产链上使用,生产链就会提供便宜机器。其次区块链在早期很多机器接入进来,除了能够整个生产力系统分配的奖励之外,还可以获得支付的算力,这两部分组成了一个完整收入,不过这对一个使用算力的人来说费用其实很少,这就满足了需求和供应两端的需求。
关于私密数据的问题,何永表示,训练数据都是在生产链之上,最终拿到模型,所以对于数据的提供方来说可以做隐私控制,最终可以拿到便宜的隐私数据。
为什么这些一定要通过区块链技术来做?首先,区块链技术是一个完全去中心化的技术。如果是中心化的系统,如果服务器宕机,整个服务系统就都不可用。第二就是代币经济。使用机器的人付的代币是直接的点对点支付,中间省去了利润的剥夺过程。还有挖矿的经济机制,也就是早期即使没有任何人使用,只要把机器接入进来就可以给奖励。第三是开源透明。第四是改变了经济关系。
PPT链接: https://img-bss.csdn.net/201807241705215066.pdf