每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。
GPT-4开发了一门编程语言
这家伙还有什么不会的?
https://lukebechtel.com/blog/gpt4-generating-code
ChatGPT与新摩尔定律 我们与清华教授、衔远科技创始人周伯文聊了聊
何恺明 MIT 最新演讲:未来工作将聚焦 AI for science
何恺明是 CV 领域的翘楚,其谷歌学术被引用次数已经突破40万次,在2022年人工智能全球最具影响力学者榜单中,何恺明获得第一名。
AI是否会让创作者们集体“失业”,甚至让“创作”本身走向衰颓,就像机械复制时代的艺术品可能失去“灵韵”那样。换言之,AIGC的流行给了我们一个重新审视“创作”是什么、是否为人所独有这些问题的机会。
3D模型在智能设计领域以其可塑性,可编辑性有着属于自己的独特优势,扩展了2D设计的上限。但是其目前存在的局限性也是显而易见的:建模的效率,模型的数量,以及3D设计的成本。
库克力排众议于今年推出新头显设备
在产品打造方面,该头显历经7年开发,时间投入是iPhone的两倍,外界普遍猜测苹果将于今年6月推出这款设备,这个时间节点是苹果CEO蒂姆·库克与公司团队成员内部博弈的结果。
https://www.vrtuoluo.cn/535553.html
AOMedia电子刊(2023第一期)
新一期AOMedia电子刊,关于AV1生态演进和技术升级的重点消息全在这里。
https://storage.googleapis.com/downloads.aomedia.org/assets/pdf/AOMedia%20Decoder%20-%20Q1%202023%20Non-Members.pdf
本次介绍关于帧间快速算法的几篇论文,目标是缓解HEVC/VVC中复杂划分和编码带来的巨大复杂度提升。
梦工厂开源OpenMoonRay
MoonRay是梦工厂开发的制作 MCRT 渲染器,已被用于故事片驯龙高手:隐藏的世界,巨魔世界巡回演唱会等,开源采用Apache License 2.0 许可证。
https://github.com/dreamworksanimation/openmoonray
从一道面试题看 TCP 的吞吐极限
分享一个 TCP 面试题:单条 TCP 流如何打满香港到旧金山的 320Gbps 专线?(补充,写成 400Gbps 更具迷惑性,但预测大多数人都会跑偏,320Gbps 也就白给了)
https://zhuanlan.zhihu.com/p/612825623
MRCP在美团语音交互中的实践和应用
要将 ASR、TTS 这些技术应用到电话系统上,还需要一些额外的工作和技术支撑,其中比较重要的技术之一也就是本文将要介绍的 MRCP。
https://tech.meituan.com/2023/03/09/practice-and-application-of-mrcp-in-voice-interaction-of-meituan.html
在本文中,我们将探讨这种采用多个声学全息图的创新方法的工作原理,并研究其潜在的应用和局限性。声学全息图是可以将声波塑造成复杂图案的设备。它们由具有特定图案的孔或凸起的3D打印板制成。
腾讯音乐天琴实验室首次发布三套开源数据集
此次发布的三套开源数据集分别是片段翻唱数据集、哼唱数据集和歌唱评价数据集。其中,片段翻唱数据集(Lyra-CoverSegment Dataset, 简称Lyra-CS Dataset)打破目前只有全曲翻唱开源数据集的局面,有助于研究解决听歌识曲难以识别翻唱改编的问题。Lyra-CS来自于QQ音乐曲库满足开源授权条件的歌曲,其中包含不同语言、流派、歌手的歌曲原唱及对应的翻唱或live版本片段,数据集总时长近400小时,包含超53万个录音片段。
https://lyracobar.y.qq.com/index.html
分秒帧是一个帮助音视频行业来解决在线生产协同的SaaS工具,它的核心价值是帮助音视频行业的从业人员去提高创作和制作的效率,节省制作成本。
活动推荐
倒计时11天:和LiveVideoStack在2023年的第一场约会
时隔15个月,再聚北京。
时间:
2023年3月31日 - 4月1日
报名:
点击【阅读原文】了解详细信息,报名参与。
本文分享自 LiveVideoStack 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!