前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >见良:学习多媒体主要靠实践

见良:学习多媒体主要靠实践

作者头像
LiveVideoStack
发布2021-09-01 11:20:02
2330
发布2021-09-01 11:20:02
举报
文章被收录于专栏:音视频技术

LiveVideoStack邮件采访了北京美摄网络科技有限公司CTO 见良,作为十多年的多媒体老兵,他认为学习多媒体技术主要通过实践,必须在实际的项目中锻炼自己。对于未来,机器学习结合计算机图形学可以实现智能剪辑,制作出更有趣的视频。

文 / 见良

策划 / LiveVideoStack

LiveVideoStack:见良你好,能否向LiveVideoStack的读者介绍下自己,以及目前主要的工作以及关注的技术方向?

见良:目前主要是移动端高质量的视音频技术解决方案,包括视音频的采集,编辑,特效合成,为各种视音频应用提供底层技术支持。目前主要关注视音频处理架构设计,算法设计,视音频AI处理。

LiveVideoStack:15年来一直在从事视频处理相关的研发,没有考虑过更换个技术方向吗?如何保持对技术的好奇心?

见良:视音频技术总是在不断发展的,以前用传统计算机图形学、图像处理算法难以解决的问题,现在通过卷积神经网络能解决的相当不错。同时市场用户不断提出新的要求,不再满足一般低质量、五毛特效,要求效果越来越真实,更炫酷,更简便。厂商要求技术也越来越高,更高的清晰度,更小的资源,更高的效率。

LiveVideoStack:一种观点认为,现在做多媒体开发比十年前容易很多,因为有许多强大的开源框架、工具(如WebRTC、FFmpeg、x264),您怎么看这种观点?

见良:确实是强大的开源框架能助力开发,但是视音频处理要求更高,所以开源的项目要谨慎选择,它们普适性很强,为了追求更好效果、更高的质量,我们有自有的高效率框架,在需要的地方合理的去使用这些开源技术。

LiveVideoStack:搞多媒体开发需要学习大量的基础知识,而且需要在实际工作中摸爬滚打。对于学习多媒体开发,您有哪些建议?能否推荐一些多媒体开发相关的学习资料或书籍。

见良:学习多媒体主要靠实践,比如可以阅读一些开源项目的源代码(比如FFmpeg,GStreamer等)并使用其做一些简单的项目,如果参与到其开发中那就更好了。此外再接触一些商业的多媒体框架,比如DirectShow, MediaFoudation, AVFoundation等等,这样可以比较快速地了解多媒体的基本概念以及基本处理流程。

LiveVideoStack:您认为CTO的核心职责包括哪些?是否需要写(或review)代码呢?

见良:CTO主要确定公司的技术方向,构建公司的技术体系,为公司的战略提供强有力的技术支撑。CTO在每个阶段的工作重点是不一样的,是有必要写代码的。

LiveVideoStack:您主导开发了敦煌视觉效果合成系统,能否简单介绍下这个产品。在研发的过程中,有哪些难忘的故事?

见良:敦煌视觉效果合成系统是国内第一款后期合成包装系统,这个产品主要面向电影,电视剧广告的后期合成包装,它涉及颜色校正,抠像,遮罩,跟踪,三维摄像机反求等等非常复杂的算法,它的定位是顶级的视音频合成系统,也是获得国家科技进步一等奖项目的技术核心部分。最难忘的是当时我们做算法就封闭开发了一年多,算法效果出来后我们请了国内顶尖的做后期合成的专业人士来帮我们看这些效果是否可以用于高端视音频制作了,经过专家三天的详细测评对比给了相当满意的结果,这样我们有坚定的信念去软件架构的搭建和应用软件的开发了

LiveVideoStack:能否介绍下美摄SDK这个产品,他有什么技术特点?

见良:兼容性,高效率,高质量,可扩展性。

LiveVideoStack:音视频领域还有哪些学界、工业界公认的难点?未来几年,哪些难点有可能取得突破?

见良:智能的剪辑合成是困难的,未来通过机器学习的技术结合传统计算机图形学图像处理能有效降低视频制作的难度,同时提供有趣的视频玩法出来。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 LiveVideoStack 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
媒体处理
媒体处理(Media Processing Service,MPS)是智能、强大、全面的多媒体数据处理服务,行业支持最全面的音视频编码标准,基于自研编码内核和AI算法,提供音视频转码和增强、媒体智能、质检评测等能力,帮助您提升媒体质量、降低成本,满足各类场景的音视频处理需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档