前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案 | 镁客请讲

图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案 | 镁客请讲

作者头像
镁客网
发布2018-05-29 11:33:59
7780
发布2018-05-29 11:33:59
举报
文章被收录于专栏:镁客网镁客网镁客网

图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。

我们经常会遇到这种状况,想要把图片压缩的又小又能保持图片的高清度;想要在语音聊天时保持通话流畅;想要在视频时保持视频的清晰度和流畅度……

图鸭科技就是这样一家公司,他们主要研发图片压缩、通信传输和视频分析技术与产品。

每个起点都不简单

高起点的图像压缩技术

图鸭科技的CEO是来自上海交通大学的武俊敏。武俊敏在创立图鸭科技前曾在专门做3G手机视频直播业务的掌赢科技当过首席科学家,主要研究人脸美化和表情迁移技术。

武俊敏在掌赢科技积累了许多关于人脸美化和表情迁移的技术,例如表情迁移用到小波变换、非线性TensorFlow等算法。而图像压缩是通过损失较少的比特存储空间或不损耗比特,来表示原来像素矩阵,其使用的算法种类更多也更加复杂。可以说人脸美化、表情迁移与图像压缩技术是两个完全独立的技术。武俊敏的创业基于自身的学习基础,转向一个新的技术方向。而这个新方向要困难的多。

图 | 图鸭科技CEO武俊敏

“图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。”武俊敏说道,“因此,我在一开始请教了许多师兄和前辈,一起研究图像压缩的算法。”对于创业公司来说,开始都是困难的,资金、人才、技术可能都处于一个不完善的状态。但是,这些困难必须一个个解决掉,做不下去就要死去。

必须相信技术会不断进步

升级打造完整视频解决方案

自2016年8月创建以来,接近一年半的时间,图鸭科技在图像压缩方面取得了不俗的成绩。其图像压缩与JPEG相比,压缩率提升了70% 多,和WebP相比压缩率提高了60% 多。即在保持相同图像峰值信噪比的同时,极大减少了存储空间。此技术能帮助需要大量传输、储存图片的企业节省一大笔开支。

不过,在图像压缩取得不错成绩后,武俊敏团队发现,海量和高清的图片和视频对通信的要求很高。因此,图鸭对图像和音视频的通信传输进行了研究。

在2017年年初完成千万级天使轮融资后,图鸭科技造的音视频传输解决方案延时低至50-100s。其内容主要包括保证质量的前提下,允许免费接入VoIP SDK,零成本实现实时音视频通讯功能。同时,通讯效果普遍优于Skype、微信等大众品牌。

图鸭还提供了所有涉及通讯方式的功能模块,打通了Android、iOS、Mac和Windows等平台,一站式服务,保证节约接入和成本维护,使使用其系统的厂商不再为各个模块接入SDK厂商不同而烦恼。

同时,图鸭不仅提供一站式服务,还为开发者提供了便利平台。“去年年底VolP技术的服务器源代码和客户端网络模块代码已经开源,开发者可以进行二次开发。”武俊敏表示。

为了推动压缩技术的进一步发展,武俊敏将压缩和模式识别的技术融合,相互借鉴,创造性地得到了较好的压缩效果。但是武俊敏对其技术发展还不满意。

图 | 公司视频分析项目展示

所以,图鸭科技在不断进行技术创新的同时,又更加深入的探索视频智能分析技术。视频智能分析不仅使用到了已有的表情迁移和人脸美化技术,还需要利用深度学习和人脸识别算法,对视频进行检测和分类,提取视频关键帧和关键段落。

这样,公司就形成了一套完整的视频解决方案,从视频的压缩,到通信传输,再到视频的分析。

就像社会进化论被很多理论学家质疑,“技术会不断的进步”也被许多人质疑。对于此,武俊敏认为,技术会不断的进步已经成为技术工作者的一种价值取向,“你只有相信技术会不断地进步,才会不断地去努力去实践,这样才有可能出成果。而不去实践,是永远不会出成果的。”

有道是,春江水暖鸭先知

迎接5G和AR设备的爆发点

虽然图鸭科技已经做出了一套完整的视频解决方案,但是目前的分析系统能力还不够强,其准确度和时间复杂度并没有达到令武俊敏满意的程度。

武俊敏说:“目前的分析系统要达到其基本要求,还需要1年时间,要达到满意的要求约需一年半的时间。整个2018年,要将视频解决方案上线并做好。”

目前,图鸭科技在准备下一轮pre-A的融资,并打算在今年6月份之前完成。融资将被用于技术升级和公司运营。当问到图鸭科技是否会在视频解决方案之外,开拓一些新的应用,武俊敏表示,“在公司技术发展成熟满意之前,无意向其他业务方向扩散。对于一家科技公司来说,技术就是命根子。”武俊敏说道。

图 | 图鸭科技团队

就像电影《阿甘正传》的台词一样,“未来就像一盒巧克力,你永远不知道下一颗是什么味道。”对于图鸭科技和武俊敏来说,把眼光聚焦于当前技术的发展才是重中之重

而在静心发展已有技术的同时,仍要对未来的机会保持高度的敏锐度。众所周知,当5G时代带来的时候,将会给现有的视频等数据传输带来变革性的变化。对此武俊敏说,“5G的到来将会推动公司的发展。5G时代带来的更多的视频量和更多的存储需求,而基础的光纤网络设备并没有太多的改进,因此对于整套视频解决方案的要求也会更大。”同时,AR眼镜的爆发也会为企业带来新的生机。对于这两个机会,图鸭科技会力求抓住。有道是“春江水暖鸭先知”。

结语

目前,国内做视频压缩、传输和分析的整套视频解决方案的企业并不多。国外的此类公司也大都只做其中某个方向,做出整个完整技术流程的并不多。因此,图鸭科技的压缩技术和整套视频解决方案有极大的竞争优势。而且,图鸭科技的解决方案已经部分了落地,用在了智能门禁、远程视频传输、无人店等场景。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 镁客网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图片处理
图片处理(Image Processing,IP)是由腾讯云数据万象提供的丰富的图片处理服务,广泛应用于腾讯内部各产品。支持对腾讯云对象存储 COS 或第三方源的图片进行处理,提供基础处理能力(图片裁剪、转格式、缩放、打水印等)、图片瘦身能力(Guetzli 压缩、AVIF 转码压缩)、盲水印版权保护能力,同时支持先进的图像 AI 功能(图像增强、图像标签、图像评分、图像修复、商品抠图等),满足多种业务场景下的图片处理需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档