首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8927
文章
6255449
阅读量
277
订阅数
攻陷短视频后,Sora将需要72万块H100 GPU
OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。
机器之心
2024-04-12
1130
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
prompt:Wide shot of battlefield, stormtroopers running...
机器之心
2024-04-12
820
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。
机器之心
2024-03-18
960
Runway最强竞争对手来了,一键生成短视频,限时免费开放使用
最近一段时间,AI 作画的水平正在突飞猛进。在 Midjourney、Adobe Firefly 不断布局、落地图片生成技术的同时,有创业公司已经把眼光放到了视频生成上。
机器之心
2023-09-08
2500
Sam Altman:大家如此喜爱Code Interpreter!这是结合Midjourney的神奇用例
当人们问 ChatGPT 问题时,大语言模型(LLM)会通过不断预测下一个单词的方式生成答案。
机器之心
2023-08-08
2040
像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了
那个大名鼎鼎的 AI 作画神器 Midjourney 又来给用户震撼了,继上个月推出 5.1 版本后,它又很快更新了 5.2 版本。
机器之心
2023-08-07
1430
强强联合,一场快手与高瓴人工智能学院的「双向奔赴」
机器之心报道 编辑:杜伟 一边是国民级短视频应用快手,另一边是致力于打造 AI 时代世界一流学院的高瓴人工智能学院,这对业界与学界的合作伙伴未来会擦除什么样的火花,我们拭目以待。 要说近几年 AI 领域最火的技术是什么?大模型当仁不让。从谷歌 BERT、T5 开始,到 OpenAI GPT 系列,大模型显示出了无与伦比的生成式能力和巨大的应用潜力,更让业内人士看到了实现 AGI 的希望。 以 GPT-4 为例,它是一个多模态 AI 大模型,在语言、数学、编程、视觉等多种任务上都有出色的表现。文本、图像、语音
机器之心
2023-05-01
4920
聊聊开源 | datawhale年会头脑风暴
机器之心转载 作者:田云,上海科技大学,Datawhale成员 The term open source refers to something people can modify and share because its design is publicly accessible. —Linux 中国 开源:一种生产的结构 开源最初是起源于软件开发中,指的是一种开发软件的特殊形式。但到今天,「开源」已经泛指一组概念,这些概念包括开源项目、产品,或是自发倡导并欢迎开放变化、协作参与、快速原型、公开
机器之心
2023-03-29
2020
从零开始学好深度学习,短视频免费课程上线
机器之心报道 机器之心编辑部 PyTorch Lightning 背后的初创公司推出了一套熟练掌握 PyTorch 的免费系列课程。 随着微软发布「ChatGPT 版必应」,业界在深度学习(DL)应用落地方面的进展越来越受到关注。领域内的初学者在仰望星空的同时,也要脚踏实地学好深度学习基础知识。 近期,PyTorch Lightning 背后的初创公司 Lightning AI 推出了一个名为「深度学习基础(Deep Learning Fundamentals)」的免费系列课程,课程讲师是畅销书《Machi
机器之心
2023-03-29
4490
因为一项技术的加持,我的视频画质更「香」了
机器之心原创 作者:蛋酱 回忆起一年多前那场「倒计时应战」,每一位参与的快手音视频技术团队成员都历历在目。 当时,国际巨星成龙即将在快手开通全球首个短视频社交账号。这次官宣势必会聚集全球各地的大量粉丝,这也意味着每条作品都将应对数亿用户「挑剔」的视觉诉求。如何让成龙大哥的快手首秀做到「令人惊艳」,从技术层面来说是个难题。 针对此次项目中对画质的诉求,团队彻夜奋战,「定制化」推出了高画质点播档位和策略,采用短视频特殊转码为视频画质提供了最优保障,让画面中每一处细节都能清晰、细腻地呈现出来。 从「决定要做」到「
机器之心
2023-03-29
7110
这段音频火爆外网!文字、图片一键生成逼真音效,音频界AIGC来了
机器之心专栏 机器之心编辑部 如今的 AI 技术发展堪称「神奇」,文字、图片竟能一键直接生成逼真音效,这就是浙大、北大联合火山语音推出的新模型 Make-An-Audio。 近期 AIGC 如同上了热搜一般,火热程度居高不下,当然除了名头格外响亮,突破也是绝对斐然:输入自然语言就可自动生成图像、视频甚至是 3D 模型,你说意不意外? 但在音频音效的领域,AIGC 的福利似乎还差了一些。主要由于高自由度音频生成需要依靠大量文本 - 音频对数据,同时长时波形建模还有诸多困难。为了解决上述困难,浙江大学与北京大学
机器之心
2023-02-23
5590
业界首个!快手提出亿级别多模态短视频百科体系快知
当前,越来越多的短视频用户不仅希望利用碎片化的时间来休闲娱乐,也开始希望能够在短视频平台中获取更多知识。2021 年,快手泛知识内容播放量同比增长 58.11%,平台全年有超过 3300 万场泛知识直播 [1]。为了更好地理解和组织泛知识视频,快手MMU联合哈尔滨工业大学等提出业界首个多模态短视频百科——“快知(Kuaipedia)”:通过多模态和知识图谱技术从海量短视频中挖掘大规模高质量的知识视频,并将其结构化,形成体系化的短视频百科知识库,为用户提供更好的知识获取体验,同时激发创作者创造优质知识内容,构建良性的知识分享生态。
机器之心
2022-12-15
4910
移动端部署推荐系统:快手获数据挖掘顶会CIKM 2022最佳论文
获奖论文《Real-time Short Video Recommendation on Mobile Devices》针对短视频推荐场景,传统服务端部署的推荐系统在决策时机和实时特征利用方面的不足问题,通过在移动客户端部署推荐系统来实时响应用户反馈,提高推荐结果的精准度,从而提升用户体验。论文提出的方案 100% 流量部署到了快手短视频推荐生产环境,影响了日均超过 3.4 亿用户的体验,是端上智能在大规模推荐场景落地的创新实践。
机器之心
2022-12-15
6450
KDD 2022 | 快手提出基于因果消偏的观看时长预估模型D2Q,解决短视频推荐视频时长bias难题
机器之心专栏 快手社科推荐团队 短视频(比如快手、抖音和视频号等)日益成为人们日常生活中最重要娱乐方式。短视频推荐需要解决的一个基础问题是,如何准确地预估用户对某个视频的观看时长。观看时长建模的精准度一定程度反映了推荐的质量,对提升用户粘性意义重大。 业界普遍使用的方法是由 YouTube 在 RecSys 于 2016 年提出来的方法或其变种 [1],然而该方法最开始的提出是基于「点击 - 观看」的长视频场景,在目前无显式点击 Label 的沉浸式浏览模式下并不适用, 同时短视频场景视频本身长度跨度很大,
机器之心
2022-08-25
1.5K0
SIGIR 2022 | 当多层级遇到多兴趣:快手联合武汉大学提出用于序列推荐的多粒度神经模型
机器之心专栏 机器之心编辑部 来自快手和武汉大学的研究者通过结合多兴趣学习和多层级图卷积聚合提出了一种多粒度神经模型,显著增强了精确学习用户复杂行为的能力,对用户不同层级下多种兴趣的细粒度建模为序列推荐领域的前沿研究拓宽了方向。该研究已被今年的 SIGIR 会议录取为长论文。 随着大众获取信息方式的移动化和碎片化,短视频分享平台(如快手、抖音)逐渐成为人们生活中获取信息和休闲娱乐的重要渠道。不断突破记录的 DAU 一方面伴随着巨大的商业价值,另一方面也给千人千面的推荐算法带来巨大的挑战。 在快手单列的流式推
机器之心
2022-06-02
6430
今天起,种草小红书的多模态AI技术
机器之心报道 编辑:思 在人工智能领域,存在着这样一种技术,它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样,希望充分利用文本、图像、语音和视频等多种模态,这就是「多模态学习」。多模态学习的研究时间不算太长,但应用前景非常广泛,比如电商购物平台中的以图搜图的检索技术、智能家居以及车载智能助手的语音交互等。 不过要说多模态技术真正实现了落地似乎还太早,从多模态数据标注到跨模态转化,该领域都面临着众多挑战。这就需要研究社区和业界持续探索新的发展方向和技术范式。 作为国内独特的以图文和短视频内容为主的社
机器之心
2022-04-25
1.7K0
将因果关系估计引入推荐系统、提升推荐模型效果,快手新研究被WWW22接收
基于机器学习的推荐系统逐渐成为帮助人们自动过滤信息、发掘兴趣的主要方式。现有模型通常使用 embedding 来表示推荐系统中丰富的信息,比如物品、用户和上下文信息。从因果分析的角度来看,这些向量和用户最终的反馈(比如点击、点赞、转发等)之间的关系是由因果关系和非因果关系混杂在一起组成的。
机器之心
2022-02-24
7680
「蚂蚁呀嘿」的App,国内火完七天就下架了
过去几天,你一定注意到了 AI 生成动图的这股风潮。从抖音到微博,人们齐唱「蚂蚁呀嘿」的画面不断刷屏。
机器之心
2021-03-15
7410
有内味儿了,东北话做编程语言,好使、招人稀罕
前段时间,机器之心刚介绍过以文言文为编程语言的 CMU 本科生项目。近日,圈内又惊现以东北方言词汇为基本关键字的编程语言(dongbei),此项目一出便有天雷勾地火,宝塔镇河妖之势。作者是一位 Google 的高级软件工程师/技术主管,同时也是 Google C++测试框架 googletest 以及 googlemock 的原作者。
机器之心
2020-02-24
8780
AI碰撞短视频,从推荐到直播,快手探索了这些ML新思路
在打开手机看短视频的过程中,你知道中间会有多少机器学习模型在做优化吗?点开 APP 后我们想要看到最感兴趣的视频,观看的视频的时候我们想要最流畅与清晰的体验,参与直播中我们希望有更流畅且不卡顿的视频体验。
机器之心
2019-10-24
1.1K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档