首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >『侧面』:走近LiveVideoStack Meet北京讲师

『侧面』:走近LiveVideoStack Meet北京讲师

作者头像
LiveVideoStack
发布2021-09-02 15:15:25
1.2K0
发布2021-09-02 15:15:25
举报
文章被收录于专栏:音视频技术音视频技术

4月22日,第一次『LiveVideoStack Meet北京:后直播时代技术』将在将在洪泰创新空间·Azure(地铁14/15号线望京站 H口)举行。(点击阅读原文,进入报名页面。

在紧张筹备内容之余,Ant与6位专家进行了访谈,畅谈了自己的成长经历、音视频技术的未来与应用前景,全文如下。

受访嘉宾

  • 唐赓 北京密境和风科技有限公司iOS技术负责人
  • 张玺辉 布卡互动创始人
  • 唐通 CC视频研发副总监
  • 张弩 百家云架构师
  • 刘文 微博算法工程师
  • 郝明非 金山云视频技术总监

Ant:请简单介绍下自己的工作经历,以及现在主要从事的工作内容。

唐赓:我的经历比较杂,1997年左右就开始在BBS论坛里玩Linux/FreeBSD,2000年开始从Windows开发工程师入行,从事音视频软件、安全软件的研发。之后很长一段时间都在从事安全相关的行业,对Linux、FreeBSD、Windows等OS内核进行过比较深入的研究和开发,后来在一家多媒体工具公司做了几年CTO,再后来自己创业又回到安全领域,做企业级移动安全产品开发。最后就进入数字公司,机缘巧合,期间花椒iOS团队严重缺人,于是我在花椒第一版上线后两个月带着团队加入花椒。

张弩:我毕业于西安电子科技大学,2006年加入北京威速科技有限公司,从事企业级软件视频会议系统开发工作。2014年开始供职于百家云,主要负责直播产品的设计研发,涉及分布式服务器架构、大数据传输、音视频编解码技术、多平台客户端支持等工作。

张玺辉:2010年我在清华研究生毕业以后,就开始进入音视频直播互动领域创业,并一直将公司的创业方向定位于教育领域。希望通过“布卡”的“不卡顿、不掉线、不延迟”的服务,去实现“让知识没有距离”。

刘文:先前服务于方正,主要从事图像处理与识别方面的研发,先后完成印刷行业图像编辑工具、文本票据识别等工作。2014年来到了微博,从事图像与视频算法研发。

唐通:曾就职于任子行网络技术股份有限公司,任研发工程师,从事互联网安全方向工作。目前就职CC视频,任研发副总监,负责公司的云直播Saa平台的研发及管理工作,对视频直播领域,大型分布式系统有较深入研究。

郝明非:2010年底加入百度,先后从事客户端、服务端、智能设备开发,亲历媒体云从无到有,支撑百度网盘、百度视频、百度文库、贴吧等内部业务和外部开发者的多媒体业务。目前在金山云视频云部门,负责视频云研发工作,包括直播CDN,视频处理,SDK和产品化。

Ant:(to唐赓)您以前搞云计算、大数据存储,从服务端转型做iOS的动力和原因?

唐赓:做云架构、云计算、大数据存储主要是为了我们的企业级移动安全产品服务。花椒当时缺iOS工程师,其实移动端界面开发并不是我强项,我主要做一些基础技术的研发,我当时带的团队还有一些iOS工程师,就一起带过来了,而且我觉得直播领域应该可以实现我一些多媒体方向的想法,就积极参与进来了。

Ant:(to唐赓)iOS开发有啥魔力,能让他通宵达旦地工作? 现在经常干活到凌晨3点以后,线报说您前两天又干到了凌晨5点。

唐赓:其实还是因为给老板承诺的发布时间太紧,功能太多,白天经常被各种事务牵绊,一会儿需要开会一会儿需要去协调,另外白天人太多网络还不好用,晚上相对来说效率要高很多。

Ant:(to刘文)机器视觉算法和音视频算法的发展现状是怎样的?已经有哪些应用场景。

刘文:随着分布计算、GPU并行运算的普及和深度神经网络的快速发展和走向应用,以往的机器视觉领域的效果得到很大的改善,例如在语音识别、人脸识别领域的识别率甚至可以达到或超过人类的识别能力。在音视频领域,AI视频内容分析与识别已经在推荐等领域得到了很好的应用,AI视频智能编码能够在保证质量的前提下节省带宽成本。智能技术与业务的结合将是趋势。

Ant:对音视频行业的未来怎么看?看好哪些技术?

唐赓:我觉得现在是一个非常激动人心的时代,技术上以前不行的现在可行了,产品上以前不敢想的现在敢想了,所以很多想法都有机会去尝试和实现。

张弩:在企业市场,传统的软件视频会议、监控产品发展了十几年,已经非常成熟,有非常多优秀的企业。随着这几年互联网的基础建设加速发展,大带宽和智能移动终端在个人消费市场逐渐普及,使得互联网各类产品中音视频的应用越来越多,比如秀场类、财经类、游戏类、网购类直播、在线教学等等。这些实践基本都是C端的应用,随着这些应用的成熟,应该会促使企业市场也互联网化。未来音视频服务的SaaS或是PaaS化应该是个趋势。 技术方面,音视频编码会继续发展。H.265对整个视觉体验的提升效果很明显,商业级别的编解码器会越来越成熟。一些能适应各种声音场景下的音频编码也有不错的前景,比如Opus,既能适应实时语音,又能适应音乐场景,在互动类型的应用(比如在线教育)上有很多优势。

唐通:就聊直播吧,未来直播领域肯定会朝着更低的延迟,更优质的互动这个方向发展。传统一人讲,多人听的广播模型将会融入多人实时互动的视频通话模型,在此基础上,即保证了广播模型的高承载能力,又实现了视频通话模型的低延迟互动。因此,我看好的技术有WebRTC,用于实现整套视频通话的框架,还有流媒体MCU(LiveVideoStack注:Multipoint Control Unit,是视频会议系统的核心部分),用于结合视频通话模型与广播模型。

郝明非:音视频作为最直观的观感来连接人与信息,人与人,人与场景,人与经验,加速信息的生产和消费。音视频会成为各类应用的标配,作为优良内容的载体和沟通交流的通道都会发挥巨大作用。技术依托场景存在,比较清晰的一个场景是用户对高画质的追求是持续的,看好能带来画质提升的技术,包括编码、传输、客户端画质增强等方向。

Ant:都说自己技术牛,到底各自技术和产品哪里牛?有何过人之处?

刘文:微博视频的重要产品包括视频流、视频推荐流等,都是采用自动播放的形式,这些都很大程度提高了用户对视频的消费。此外,围绕着视频观看,为了提供更快的视频展示,在播放端缓存策略、内核等方面做了优化,有效提升了视频的加载速度。为了提供更清晰的视频内容同时尽量保证带宽成本的节约,对已有的H.264编码策略做了优化,对H.265、VP9等也作了尝试。

张玺辉:带宽一直制约着直播质量,布卡可以做到1M带宽保证直播的流畅程度,下一步将把带宽降到600k。另外我们支持1080p高清直播,支持本地文件的打开,市面上的直播PPT展示通常是把每页内容压缩成图片,而页面呈现的效果就无法保证了,布卡甚至可以将文件中的视频和音频全部保存下来,老师在讲课的时候可以原封不动的呈现整个PPT的内容。

唐通:CC视频由于是做ToB服务的,所以所有的技术和产品都围绕着场景化这一特色来展开,除了提供直播基础的视频流和聊天之外,我们会针对不同场景的用户提供不同的解决方案。 比如,针对教育场景,我们专门提供了互动白板、问答、点名、试卷等功能。而针对金融直播场景,我们会提供桌面共享,问卷调查等功能。以视频技术为基础,针对不同的用户类型提供更多有价值的功能,是我们一直在追求的。

郝明非:在互联网公司中,金山云是最重视算法投入的,拥有十几人的算法团队,自研的H.265编码器在世界大赛中获得软件编码第一,使用时感觉不到和H.264资源占用的区别,并且完成了服务端、客户端全配套,真正在大客户中落地。金山云直播SDK是另一个特色布局,在功能演进中,快速响应行业需求,积极布局新功能并引领直播市场新玩法,引领新玩法的核心就是组件化,一周一个迭代速度,深耕每个处理环节,通过组件化方案可以无缝支持无人机直播、第三视角直播等使用场景。

张弩:百家云是一家专注教培行业的互动视频云服务厂商,提供面向教育行业的直播、点播的一站式解决方案。百家云的一些技术特点:

  1. 全平台支持、手机直播授课
  2. 海量并发、弹性扩容
  3. 多视频互动、布局灵活
  4. 本地+云端录制
  5. 加载快、延迟低
  6. SDK接口丰富、集成便捷
  7. 几千万小时在线直播经验

Ant:在4月22日的『LiveVideoStack Meet北京:后直播时代技术』上,剧透下将分享哪些有料有趣的内容?

唐赓:2015年是直播业刚开始起步的年份,映客、花椒都是2015年4月左右起步的,我在7月份加入,算是从起步阶段就参与进来了。主要还是简单介绍一下自己在这个过程中的经历,技术路线的变化,以及现在在做的一些尝试和对将来的思考。

张弩:我会分享以下内容:在低延迟的教育应用上做的一些尝试;一些新的技术尝试,比如VR接入、联麦等;针对教学场景的配套硬件,手写板、双摄像头、双师硬件等集成;海外线路建设的一些经验等。

张玺辉:我会重点介绍布卡互动如何做到减少卡顿、掉线和延迟的,包括支持大规模、高并发的网络架构,音频与视频的自适应码率调整,以及硬件适配等。

唐通:到时候将会分享如何实现16人连麦的流媒体MCU,以及如何实现互动白板等。

郝明非:很有幸经历了完整的直播元年,在2015年底受ArchSummit邀请分享了金山云在移动直播上的最佳实践,经历了2016年,架构和思路也在不断演进,希望能借这次分享做下总结,包括我们的服务端架构是什么样的?客户端架构是什么样的?背后的原因是什么?如何做好视频云服务的角色?同质化竞争的大环境下作为技术和通道提供方如何突破?

刘文:届时我想先对全景内容的生产、展示过程先做个简单的回顾。然后主要分享下我们在做全景产品上的思路,全景内容需要考虑的一些技术挑战和我们的实践经验。例如全景图尺寸一般都比较大,怎么提升加载速度、降低带宽成本,以及移动端可能遇到的问题等。

题图来自电影《十一罗汉》海报

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 LiveVideoStack 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档