首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

中科大提出 ShareGPT4Video ,突破视频标注挑战,推动 LVLMs和 T2VMs 的发展!

作者推出了ShareGPT4Video系列,旨在通过密集且精确的标题,促进大型视频语言模型(LVLMs)的视频理解和文本到视频模型(T2VMs)的视频生成。...所有的模型、策略和标注都将开源,作者希望这个项目能够为推进LVLMs和T2VMs社区提供一个关键资源。...该模型、策略和标注将公开发布,作者希望这个项目能够为推进LVLMs和T2VMs社区的发展提供一个关键资源。...提示重新标题生成: 模型可以重新表述偏好特定视频生成区域的用户输入的提示,确保在推理过程中,基于高质量视频标题数据训练的T2VMs与训练时保持格式对齐。...为了验证高质量字幕在T2VMs领域的有效性,作者分别使用ShareCaptioner-Video和Panda-Student [12]为450万个65帧的视频和30万个221帧的视频生成高质量且简短的视频字幕

14710
领券