首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

研究:AI 公司面临训练数据枯竭危机,高质量数据将在 2026 年前耗尽

据站长之家 11 月 14 日报道,澳大利亚麦考瑞大学的信息技术法学教授 Rita Matulionyte 在《对话》杂志的一篇文章中指出,AI 研究人员近一年来一直在敲响数据供应告急的警钟。根据去年 Epoch AI 人工智能预测组织的一项研究,AI 公司可能在 2026 年前耗尽高质量文本训练数据,而低质量文本和图像数据的枯竭时间可能介于 2030 年至 2060 年之间。

对于数据饥渴的 AI 公司来说,使用由 AI 模型生成的合成数据进行训练可能并非可行的解决方案。研究表明,训练 AI 模型使用 AI 生成的内容可能导致模型内在的畸形效应,使输出变得混乱和怪异。面对这一潜在问题,除非出现大规模人类内容农场,否则解决方法可能在于建立数据合作伙伴关系。这意味着拥有丰富高质量数据的公司或机构与 AI 公司达成协议,交换数据以换取资金。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OM743dbipKPmcnbv0cawHSDw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券