开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

陈根：马斯克用X数据训练AI，最大的困难是什么？

文章来源：企鹅号 - 陈根谈科技

文/陈根

9月4日，马斯克旗下社交平台X（前身为推特）最近更新了隐私条款，X将使用收集到的数据来训练AI模型。

X最新的隐私条款中明确表示，“我们可能会使用收集到的信息以及公开信息，来训练我们的机器学习算法、AI模型等。”对于此事，马斯克也直接承认，并补充称“只会使用公开数据，不会使用用户私信或任何私人数据”。

X的数据对于马斯克而言并不是金矿，尽管马斯克计划用X的数据来训练人工智能。因为X拥有的数据就类似于微博与微信所拥有的数据一样，大部门的数据都属于低质量的数据，或者说是属于脏数据。对于要训练高质量的人工智能模型而言，不仅没有价值，反而会成为副作用。

而马斯克要使用X的数据用于AI训练，首先要解决的一个问题就是成本的投入。也就是说马斯克需要雇佣大量的人员，对X平台的数据进行标注、清洗，并从中筛选出能使用的高质量数据。而数据的这种标注、清洗，就意味着不仅是大量人力成本的投入，同时是一种长时间的持久工作。

如果马斯克不对X平台的数据进行标注、清洗，而直接使用的话，最终训练出来的AI可能就是一个不仅有AU幻觉病，同时还会成为造谣传谣的AI模型。

发表于: 2023-09-052023-09-05 11:18:12
原文链接：https://page.om.qq.com/page/OcRztfVOzOn_gRYyFWVoRixA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯