首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开源训练集 LAION-5B 遭曝内含“儿童性虐待内容”

IT之家 12 月 21 日消息,据彭博社报道,斯坦福大学近日针对开源模型训练数据集 LAION-5B 展开研究,发现该数据集中存在 3000 项“可疑的儿童性虐待内容”,之后 LAION 项目维护人员紧急下架了 LAION-5B,并声称已经移除了 1008 项“确凿的相关内容”。

▲ 图源 彭博社(下同)

外媒表示,LAION-5B 训练集总共拥有 58.5 亿项图片信息,Stability AI 曾利用 LAION 数据集来训练自家 AI 模型,从而为用户提供“文生图服务”。

不过IT之家注意到,Stability AI 迅速向外媒回应,“Stable Diffusion 模型虽然使用 LAION-5B 进行训练,但采用的是‘经过筛选及微调过的’训练集版本,因此‘并不会影响模型输出结果’”。

斯坦福大学声称,从 LAION-5B 事件可以看出业界“应当还有大量数据集存在有相关不当内容”,研究人员呼吁模型训练方应当谨慎甄选“必要的训练数据集”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmSqfr-7qCz36o9xqFUcCz0g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券