首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】MiraData - 包含长时间和结构化字幕的大规模视频数据集

MiraData(Mini-Sora Data)是腾讯公司针对长视频生成任务构建的一个大规模视频数据集。该数据集的特点是拥有较长的视频时长和精心设计的字幕,每个视频片段时长介于1至2分钟之间,均配有结构化字幕。当前版本的MiraData包含57,803个视频片段,累积时长达1,754小时,覆盖了游戏体验和城市/景观探索两种情景。为了收集MiraData,研究人员首先手动筛选了不同情景下的YouTube频道,然后下载并使用PySceneDetect工具对频道中的视频进行分割,最后利用GPT-4V为视频片段添加了结构化字幕。该数据集不仅为长视频生成任务提供了宝贵的资源,也为视频内容理解与生成领域的研究者提供了新的挑战与机遇。

详情请参见五号雷达:https://www.5radar.com/result?key=MiraData

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Ot5ak7MxgK0T76xgnWFxAkEQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券