机器之心报道
作者:泽南
9 岁的字节跳动宣布「全擎投入」企业技术服务市场,一上来就计划要做 50 年。
每年夏季举行的 CVPR 是人工智能领域里最被人关注的盛会之一。在这场万名学者参与,持续多天的活动中,时不时会涌现出引领下个方向的前沿研究,正如 2016 年的 ResNet、YOLO,2009 年的 ImageNet,还有 2015 年的 Inception 一样。
这些在业内如雷贯耳的模型和数据集不断进化发展,如今已经成为了摄像头中的识别算法,手机上的人脸解锁功能、拍照美颜工具甚至自动驾驶汽车上识别红绿灯的能力。
CVPR 大会上也有着各式各样的图像识别竞赛,来自科技公司、学术机构的研究者们会利用最领先的技术一决高下,而因为赛制更加贴近现实,参赛队伍们提出的解决方案很可能几个星期之后就会出现在 App 上,成为手机上的一个新功能。
在今年的 CVPR 上,由 AI Benchmark 举办的「移动 AI 挑战赛」引人关注,而在其中「实时移动端检测场景赛」上获得冠军的队伍,成绩相比第二名高出了八倍还多。
这支名叫 ByteScene 的队伍来自字节跳动。
绝对优势夺冠
CVPR 2021 的 MAI 竞赛上,字节跳动工程师们组成的队伍 ByteScene 夺得了实时移动端场景检测(Camera Scene Detection)比赛的冠军。
这是一个在苹果 A11 处理器( 用于 iPhone X、iPhone 8 / 8 Plus )上,使用移动端深度学习框架 TensorFlow Lite CoreML 运行实时移动端场景检测算法的比赛。任务要求 AI 算法对摄像头输入的图像实时预测出其场景类别,共有 30 个场景类别,训练集却只有 9900 张图片,对于人工智能来说,存在很大的过拟合风险。
ByteScene 团队却利用迁移学习方法拿出了一个容量仅为 8.2Mb 的小模型,实现了 95% 的 Top 1 识别准确率,平均延迟仅 4.4 毫秒,最终得到的分数是第二名的八倍还多。
实时移动端场景检测技术在抖音和剪映等产品里已经落地应用。由于操作简单,使用体验智能化,这项技术提升了 App 上的用户体验。
短视频是目前最火的应用方向,但对于人们来说,制作一段高质量的视频往往是件困难的事。「智能模板匹配」为大众用户提供了一个低门槛的快捷视频创作方式,真正实现了「一键成片」。
在 CVPR 竞赛中用到的图像场景检测和分类算法通过预测每个素材中的场景类别,为智能模板匹配提供了重要依据,让普通用户也能通过简单的操作,剪辑出高质量的视频。
提出技术,在竞赛中夺冠,又将其应用到抖音中的技术团队,是字节跳动的「智能创作团队」。该团队的研究领域覆盖音视频、计算机视觉、语音、图形图像、工程软件开发等多个方向。
现在,这一团队的技术又成为「火山引擎」的一部分,正式对外开放了。
数智化转型这门生意,正在吸引越来越多的互联网大厂。6 月 10 日,字节跳动旗下智能科技品牌火山引擎的首场品牌发布会在北京举行。
随着火山引擎一系列核心技术的发布,字节跳动正式官宣进军面向企业的 to B 市场。
把字节跳动的「秘密」开放出去
企业市场和个人用户市场的挑战不同,进入 ToB 市场,字节跳动首先展现出了自己的态度:把自己的「秘密」开放给企业客户。
做企业服务这件事,对于字节来说并不是从零开始。和一直所践行的理念相同,字节跳动的 to B 业务也源自需求驱动。
故事要从 2017 年说起,当时的字节跳动刚刚因为今日头条个性化推荐系统成为人们谈论的话题,一家手机厂商突然找过来希望使用这种技术来优化自己的应用商店。
「最后我们决定干这一单,这就是字节跳动 To B 的第一笔订单,」字节跳动副总裁杨震原表示。「效果出奇的好,客户的广告收入一下子增加了 117%,双方技术团队都获得了提升。在这项合作之后我们决定沿着这个方向继续做下去。」
很快,其他手机厂商就找上门来。在这之后字节跳动又开始尝试推动计算机视觉和数据分析产品。
2020 年 6 月,字节跳动正式推出了企业技术服务平台火山引擎,依托大数据、人工智能等技术能力,以及增长理念与方法论,这家公司希望能够为客户提供技术产品与解决方案,帮助企业完善数字化转型底层建设。
上个星期的正式发布,则宣告了字节跳动已下定决心,要将成立至今的所有技术能力开放给全行业。不论是神秘的推荐系统,还是强大的 AI 美颜功能,在抖音、今日头条、西瓜视频等应用上的技术,所见即所得。
「字节跳动在过去九年间的高速增长,沉淀了经过大规模实践验证的增长方法、工具和技术能力,」火山引擎总经理谭待说道。「这些能力在火山引擎上有机地组合成为了统一的基础服务、技术中台、智能应用和行业解决方案四层架构。其中包含 60 多款单品,被统称为『智能增长技术』。」
具体说来,它提供的能力包括三个方面:
综合了方法、工具和技术,火山引擎提供的全链路方案以数据为资源,构建于字节跳动的基础服务之上。这种高度整合的能力降低了企业实现智能化的门槛。
按照字节跳动的总结,这套智能增长技术体系可用四个层次概括:
在最底层是统一基础服务,火山引擎打造了统一的云原生操作系统,一方面可以屏蔽底层 IT 的差异性,支持研发敏捷的迭代,也能够提供弹性、稳定的算力支持。
在这其上是为开发者们准备的技术中台,而智能应用通过数据产品和业务工具来提升非技术人员的工作效率。最后在部分行业中,字节跳动已经打造出了一系列成型的解决方案。
一线字节工程师,向所有企业服务
火山引擎并不只是让已有内容的展示更加灵活,还能为人们带来全新的应用体验。在电商场景中,通过它的 AR 技术,人们可以在手机上试妆、试色、试鞋;通过推荐系统主动推送产品,可以改善用户体验,并提升销量。
抖音同款的 AR 试妆,可以让消费者无需去柜台试色号,在手机上就能体验商品,这项技术为一家美妆交易类客户提升了 12.6% 的购买转化率。
在「智能增长技术」的产品矩阵中,个性化推荐算法很受企业客户青睐。利用高效的信息匹配机制,不同领域的客户获得了效果显著的增长。发布会上一组数据显示,使用火山引擎提供的推荐算法后,某电商客户的人均点击率提高 48.3%,人均 GMV(成交金额)更是提高了 100% 以上,多家手机厂商客户的应用商店、浏览器、负一屏等场景的点击率也有大幅增长。
这样为企业带来实际增长的案例有很多。在合作过程中,它们得到的都是技术研发人员直接的服务:字节跳动选择的组织模式简洁明了,用技术中台直接市场化的方式来支持火山引擎,没有创建新部门。
据介绍,在最新的视频编解码国际标准贡献排在全球前三的先进视频团队,创造了大量抖音爆款特效的智能创作团队,还有推荐算法、数据等不同领域优秀的团队,都在为火山引擎的企业客户服务。
「只有这样才能保证开放出去的是字节跳动内部最好的技术,」谭待说道。
目前,火山引擎的「智能增长技术」已服务了众多客户,包括苏宁、京东、vivo、建设银行、银河证券、吉利、bilibili 和华润,并获得了人们的认可
点燃火种
为什么要做火山引擎,把技术开放出去?字节跳动认为现在到了合适的时候。
「从客户的角度来看,人们对于字节跳动的技术工具很感兴趣。作为科技公司,字节跳动的数字化应用是非常『激进』的。除了抖音和今日头条,我们的内部报表和流程,甚至 HR 系统的绩效评估也是高度数字化分析的。这些内容为公司内部决策有很好的效果,提升了效率。」杨震原表示。
对于字节跳动自身来说,将技术应用到更广泛的范围内,也能让研发团队找到更加合理的发展方向。
「我们的优势在于自身业务的规模与复杂性。在做好自身业务的过程中,我们会发现很多问题、了解大量需求。这些需求打磨出了我们服务的能力,」杨震原说道。
除了众多大公司客户,字节跳动还希望将火山引擎的能量拓展至初创团体,并开放更丰富的技术与服务能力。发布会上,火山引擎推出了火种计划。
「对于小微企业来说,火种计划可以帮助他们在人力和资源有限的情况下,用上比较好的基础服务工具。」谭待说道,火种计划将向小微企业限时免费开放多款智能应用及数据产品,首批名额一千家。而在工业智能化转型过程中,互联网公司的技术无法生搬硬套,需要针对具体场景做更深入的优化,火山引擎也在与行业领军企业合作,共同研究解决方案,促进行业的数字化转型升级。
开放自身领先技术的举动,在科技公司中并不让人陌生。推动云服务成为新时代基础设施的亚马逊 AWS,最早就是工程师们将自身运维工具、管理平台开放的一次「无心插柳」。但如今字节跳动的入局,显然会为企业服务市场带来新的冲击。
在火山引擎宣布大规模应用之后,一些声音认为字节跳动正在切入云服务市场,是要做中国「第四朵云」。不过对此这家公司的态度较为谨慎,表示:火山引擎目前还没有推出公有云产品,对市场相关猜测不做评论。
不论如何,做企业服务就需要持续而大规模的投入。字节跳动表示,自己有做好这件事情的决心和耐心。
「To B 市场行业间差异巨大,业务链条长,上下游复杂,我们需要学习的东西还有很多,」杨震原说道,「我们接下来可能需要在 30 年、50 年里一直做这件事情,才能取得更好的成功。」
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com