首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】Sakuga-42M Dataset - 包含4200万关键帧的大规模卡通动画数据集

Sakuga-42M Dataset是阿尔伯塔大学联合四川音乐学院构建的首个大规模卡通动画数据集。该数据集包含4200万个关键帧,涵盖了不同的艺术风格、地区和年代,并提供了包括视频-文本描述对、动漫标签、内容分类等在内的全面的语义注释。数据集构建过程中,采用自动化技术从网络中挑选并处理动画视频,涉及视频分割、关键帧提取及字幕生成等环节。通过在Sakuga-42M上的微调,现有的基础模型如Video CLIP、Video Mamba和SVD在卡通相关任务上均有较大性能提升。该数据集旨在支持卡通动画的研究,通过提供大量的关键帧和详细的注释来促进卡通动画理解和生成任务的发展。

详情请参见五号雷达:https://www.5radar.com/result?key=Sakuga-42M

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oy_oBYQpfQPryugGe--_GDJg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券