ICML 2024 | 人类与生成式AI内容创作竞赛：共生还是冲突？

DrugAI

发布于 2024-07-16 15:08:50

810

发布于 2024-07-16 15:08:50

文章被收录于专栏：DrugAI

DRUGAI

今天为大家介绍的是来自Fan Yao等人发表的一篇论文。生成式AI（GenAI）技术的出现对内容创作领域产生了变革性的影响，提供了多样化和高质量内容的替代生产方法，从而重塑了在线生态系统，但也引发了市场过度饱和和人类创造力边缘化的担忧。作者的研究引入了一种从Tullock竞赛模型推广的竞赛模型，以分析人类创作者和GenAI之间的张力。作者的理论和模拟表明，尽管存在挑战，人类与AI生成内容之间的稳定平衡是可能的。作者的研究有助于理解内容创作行业的竞争动态，为人类创造力与GenAI技术进步之间的未来互动提供了见解。

2024年1月，一部充分利用ChatGPT撰写的小说《同情的东京塔》赢得了日本最负盛名的文学奖——芥川奖。这标志着人类与生成式AI（GenAI）之间内容创作竞争的时代来临。

除了ChatGPT所展示的令人印象深刻的文本生成能力，高质量多媒体内容（如图像和视频）的生成也通过一系列易于使用的工具（如Midjourney和Sora）变得广泛可及。这不仅改变了个人生活，也深刻影响了整个社会，特别是在在线内容分享行业中。这些AI驱动的解决方案显著改变了Instagram和TikTok等流行在线平台的内容创作格局，这些平台已经深深融入了我们的日常数字体验。具体而言，GenAI降低了缺乏技术技能或资源的个人生成高质量内容的门槛，甚至帮助他们在市场中获得竞争优势。这一转变导致了内容创作和分享量的激增，催生了在线内容生态系统的新动态。

然而，这种AI驱动的转型也带来了重大挑战和担忧。使用AI生成内容的简便性可能导致市场过度饱和，使得个体创作者更难脱颖而出，或使真正具有创造力的人类创作者不被重视。最近的一个事件是，环球音乐集团从TikTok上撤下了歌曲，并指责该平台充斥着AI生成的录音，稀释了真人音乐家的版税池。这呼应了格雷欣法则的观点，即“劣币驱逐良币”。

另一方面，GenAI模型并非全知全能。这些模型的一个关键限制——或许是其定义特征——是它们依赖于大量高质量的人类生成内容数据进行训练。如果GenAI无意中边缘化了高质量的人类内容创作者，生成的内容质量不可避免地会下降。类比于生物相互作用，基于GenAI的创作者与人类创作者之间的动态可能演变为互利共生，达到互惠的平衡，或对抗性冲突，导致持续的竞争并可能使市场不稳定。因此，一个紧迫且具有科学意义的问题是，在与AI生成内容竞争时，人类创作者是否会被驱逐出市场，还是有可能走向稳定的共生关系？

在本文中，作者提出了一个简化模型来描绘传统人类内容创作者与使用GenAI技术的创作者之间的竞争。作者的框架扩展了Tullock竞赛模型，该模型在计量经济学中广泛应用于分析竞争场景。作者首先探讨GenAI作为外部影响者对人类创作者平衡状态的影响，然后深入研究创作者在制作内容时可以自主选择是否使用GenAI工具的情景。作者的理论结果和实证发现带来了一个积极的前景：尽管GenAI可能扰乱人类内容生成市场，但一个具有良好特征的稳定平衡是可以实现的。作者的贡献体现在以下三个方面：

模型方面：作者首次正式提出一个数学模型来描述人类和生成式AI之间的竞争，包括一个GenAI作为外部来源的排他性竞争环境和一个每个创作者可以战略性地决定是否使用GenAI的包容性环境。
概念方面：作者的理论和实验为关于人类与AI竞争的重要问题提供了鼓舞人心的答案，得出了新的见解，并对未来在线内容市场做出了预测。
技术方面：作者的模型不仅概括了经典的Tullock竞赛，还导出了关于竞争平衡的若干新属性，丰富了现有文献的新理论进展。

人类与生成式AI内容创作竞争的建模

在本节中，作者正式介绍了用于描述人类与生成式AI（GenAIs）内容创作竞争的模型。作者的模型基于并严格推广了教科书中Tullock竞赛模型，该模型或许是用于建模竞赛的最广泛采用的范式，最近也被用于建模内容创作者之间的竞争和比特币矿工的竞争。

人类创作者的建模

假设有n个内容创作者在K个主题上进行竞争。作者使用符号[n] = {1, 2, ···, n}来表示任意整数n。在实践中，每个主题k ∈ [K]可以被视为一个显式的主题（例如一个热门标签）或与用户偏好群体相关的潜在主题。每个创作者通过为不同主题生成内容来争取用户注意力。

形式上，令xik ∈ [0,∞)表示创作者i在主题k上生成的经过校准的内容量，其中校准考虑了内容的质量和数量。换句话说，xik表示创作者i在主题k上的竞争力水平，被称为内容量。根据博弈论的惯例，作者将创作者i的（确定性）努力分配向量xi称为创作者i ∈ [n]的纯策略。自然地，内容创作是有成本的，作者用ci(xi)表示创作者i因其努力分配xi而产生的成本。本文中，作者假设成本函数是凸的且两次可微的，这在近期文献中被广泛采用用于建模内容创作竞争、竞赛建模的前期文献以及企业生产的一般模型中。这一假设捕捉了这样一个特点：创建一些内容可能很容易，但不断创建高质量内容会变得显著更昂贵。

GenAIs作为一种新型内容创作者

作者的模型在概念和技术上引入GenAI进入内容创作竞争的核心新颖之处在于：GenAI在每个主题k上的竞争力取决于两个主要因素：（a）人类创作者在主题k上生成的总内容量，即GenAI的训练数据来源；以及（b）GenAI模型的学习能力。形式上，给定所有人类创作者的策略与主题k上的总内容量sk。作者假设GenAI在主题k上创建的校准内容量可以用函数gk(sk) = αk · (sk)β̃k描述，其中αk表示GenAI模型的数据使用效率，而β̃k表示其收敛率。基于机器学习社区的一个经验法则，作者假设所有收敛率β̃k ∈ [0, 1]且αk > 0。作者的假设与最近大型语言模型研究中的“扩展法则”一致，即测试损失随着模型规模和数据规模呈幂律缩放。

排他性与包容性下的竞争

在排他性竞争下，作者假设GenAI是一个独立的创作者，与n个内容创作者竞争。这种情况模拟了GenAI在新市场采用的早期阶段，只有少数优秀个人/公司有能力/资源使用该技术，而大多数创作者仍然依赖于传统方法进行内容创作。根据标准的Tullock竞争模型，作者假设人类创作者i将吸引总用户流量的某一部分，从而得到以下效用：

根据博弈论文献中的惯例，作者研究这个博弈的纯纳什均衡（PNE）。如果每一个内容创作者都采用最好的对应策略，那么这组策略集合就形成了PNE，由于GenAI在每个主题下的内容量基于所有人类创作者的产出定义，所以GenAI是非策略性的。

在包容性竞争下，随着GenAI技术变得更加成熟和普及，每个创作者都可以选择使用它进行内容创作。除了创建他们自己的内容xi，每个创作者i现在还有一个额外的选择，即使用GenAI进行内容创作。作者假设GenAI内容的成本显著低于真实内容，因此简单地将前者的成本归零。形式上，包容性人类与GenAI竞争将每个创作者的动作空间扩展，创作者i的效用为：

其中sk表示为内容创作者制作，与GenAI无关。

人类与GenAI的排他性竞争

在本节中，作者研究了排他性人类与GenAI内容创作竞争的游戏是否会达到某种稳定状态，并探索这种状态的性质。

标准的Tullock竞赛已被证明是单调的，作者证明了该扩展版也保持了这一单调性。条件β∈[0,1]K意味着每个主题k的GenAI算法的收敛速率βk需要大于用户增长率γk。

微观层面的均衡性质

为了更详细地研究唯一PNE的性质，作者集中研究一维竞争游戏，以下定理说明了该一维竞争唯一PNE的多个微观均衡性质。

这些性质表明，成本较高的创作者在PNE下生成较少内容并获得较低效用；如果一个创作者成本增加，他在新均衡下的效用减少；每当一个新创作者加入并产生新的PNE时，原来的创作者内容创作量会减少。

命题1表明，在PNE下每个创作者将平衡他从用户流量中获得的收益和创作成本，使它们仅相差一个介于1/(2ρ)和1/ρ之间的乘数因子。此外，当创作的边际成本增加（即更大的ρ）时，创作者倾向于选择一个使其成本相对于收益较小的策略。

宏观层面的均衡性质

接下来的主要结果是在宏观层面上揭示了在PNE下创建的总校准内容量如何受游戏参数的影响。

从定理3可以学到几个重要的见解。首先，GenAI的学习率β没有出现在（8）中，而GenAI的数据效率参数α确实出现了，尽管它仅对下界项的分母有轻微影响。这表明即使GenAI可能在个体水平上优于任何人类创作者，但在宏观层面上它们仅通过一个常数因子影响总内容量。这表明，生成式AI和人类创作者之间存在共生关系，而不是根本性的冲突。

其次，定理3帮助理解总内容量如何随着创作者流行度或平台总用户流量的变化而变化。当创作者的创作成本降低或更多创作者加入竞争时，总内容量会增加。这显示了人类创作效率对总内容量的一个有趣的双刃效应——当有足够的用户需求时，较高的效率增加内容创作，但当用户需求不足时，反而减少内容创作。

总之，通过对排他性竞争的分析，作者发现即使生成式AI可能扰乱内容创作市场，但通过合理的策略更新规则，市场中的所有创作者最终将达到一个稳定的平衡状态。在这个平衡状态下，生成式AI和人类创作者可以共存，并在内容创作市场中实现互利共赢。

人类与GenAI的包容性竞争

在本节中，作者研究包容性竞争，在这种竞争中，GenAI不再作为具有排他性，而每个创作者都可以使用它。作者同样从研究竞争的纯纳什均衡开始。不幸的是，与排他性竞争的情况不同，如果成本函数不可分，则包容性竞争的PNE可能不存在，如下所示。

为了证明该定理，作者创作了一个实例。该实例有两个玩家A和B，他们在采用GenAI技术和使用传统内容创作方法之间不断切换。当创作者A切换到GenAI时，促使人类创作者B减少她的努力，以应对竞争的加剧。然而，当B减少她的努力时，A的GenAI可用的训练数据减少，导致A的GenAI效果恶化，最终使A放弃使用GenAI。这种转变为B提供了一个机会，使她可以单独采用GenAI，从而对A的竞争力产生不利影响。因此，A改变她的策略，这导致B放弃GenAI并恢复传统内容创作。这种循环导致无限的最佳响应循环，从而否定了任何可能的PNE的可能性。通过将上述的A和B视为人类创作者的代表群体，作者认为这种构建实例中揭示的张力也呈现了现实世界的情况。

鉴于包容性竞争游戏中PNE的不存在性，作者转向可分离成本情况下的一维竞争，希望在这种特殊情况下恢复PNE的存在性。幸运的是，正如以下定理所示，这的确是可能的。

定理5传递了几个重要信息。首先，它恢复了在一维竞争情况下纯纳什均衡的存在性，并假设那些成本较大的创作者（即在人类内容创作中效率较低的创作者）会转向使用生成式AI。尽管作者不能严格描述一维竞争的所有PNE，但作者的实验将显示一维竞争的PNE具有类似的性质：成本较高的创作者更可能在均衡时依赖生成式AI技术。

其次，定理5提供了关于生成式AI玩家何时可能主导内容市场的条件预测。很容易验证，不等式（9）的右侧相对于α, β和n是递增的。因此，当GenAI变得越来越强大或创作者数量非常庞大时，更多的创作者将从传统的人类内容创作转向简单采用GenAI内容创作。此外，不等式（9）显示了GenAI创作者比例如何受到内容市场规模（n）和容量（μ）之比的影响：当n→+∞或n的增长速度支配μ时，不等式（9）的右侧接近1。这一观察表明，当总用户流量的增长被越来越多的内容创作者数量稀释时，GenAI可能成为几乎所有创作者的更好选择。在这种情况下，只有极少数效率最高的创作者仍将生成原创内容。

实验结果

由于不同竞争下总是有一个唯一的纯纳什均衡（PNE），且多智能体镜像下降法能够证明性地实现这样的PNE，作者可以通过实验分析其性质，而这在理论上是难以做到的。在实验中，作者实例化具体的游戏并通过模拟找到它们的PNE，以观察GenAI的崛起如何影响人类内容创作者。作者考虑三种类型的游戏：排他性竞争、一维的包容性竞争以及在不可分成本下的排他性竞争。

Q1：市场规模和GenAI的能力将如何影响创建内容的数量？

图 1

文章中的图1展示了在不同的市场规模μ、创作者数量n和GenAI的数据使用效率α以及收敛速率β下，纯纳什均衡（PNE）状态下的总人类内容生成量的变化。左侧的对数对数图表明，当内容市场中GenAI的参与度固定时，总内容创作量s∗随着μ以多项式方式增长，这验证了定理3。然而，右侧图显示，如果GenAI的能力随着较大的α或β增加，人类玩家的总努力量会减少。

图 2

图 3

如果作者将社会福利定义为总创作者效用，图2和图3展示了社会福利（定义为创作者效用总和）相对于参数μ,n,α,β的变化。类似于图1所示的结果，社会福利呈现相同的趋势：随着α和β的增加而减少，而随着μ的增加而增加。这表明，更多地使用GenAI不仅会对现有人类创作者的生产力产生不利影响，还会影响他们的效用。值得注意的是，图2左侧面板显示，当其他参数固定时，福利对n并不显著依赖，这意味着当竞争环境设定（包括GenAI的能力/使用程度和总用户流量）时，所有人类创作者作为一个整体既不会从人口规模中获益也不会受其影响。

Q2：贡献者vs搭便车者：哪些人类创造者将切换到（免费的）GenAI创造？

作者通过模拟一维包容性竞争的纯纳什均衡（PNE）来回答这个问题。首先，作者固定n=100、μ=1000，研究GenAI的能力如何影响均衡状态下选择使用GenAI的创作者数量。为了求解定理5中保证的PNE，作者从一个没有人使用GenAI的均衡开始，然后利用其有序的成本结构，逐步确定GenAI创作者的集合。具体而言，作者按照成本从高到低对所有创作者进行排序，并检查当前成本最高的人类创作者是否愿意转向使用GenAI。如果是，作者通过求解结果一维排他性竞争实例来更新剩余人类创作者的策略，并开始下一轮，检查下一个人类创作者，直到找到一个没有人愿意更新其策略的状态。

图 4

从图4的结果可以看出，在PNE下，GenAI创作者的比例随着α、β、n的增加而增加，而随着μ的增加而减少，这与定理5的预测一致。

由于一维包容性竞争的PNE不是唯一的，检查其他PNE是否具有与定理5预测相似的特征也很有趣。为了获得一维包容性竞争的任意PNE，作者调整了算法2中的PNE求解器：在每次迭代中，作者随机选择一个创作者来检查她的类型，而不是总是选择成本最高的那个，并应用均衡检查器来验证是否达到了PNE。作者随机生成100个一维包容性竞争实例，其成本向量c独立采样自U[1,10]。对于每个实例，作者将100个创作者按成本分为十类，并应用修正后的算法确定任意PNE，随后分析这些组中的GenAI创作者的分布。

图 5

图5所示验证了作者的预期趋势，即成本较高的创作者更倾向于采用GenAI。这表明成本依赖的阈值影响创作者的策略选择。然而，在成本范围的中间选择变得不那么可预测，这取决于特定条件和达到均衡的随机性。

Q3: GenAI创作者的崛起会不会降低人类创作者的生产力和效用？

图 6

作者通过对一维包容性竞争的纯纳什均衡（PNE）进行比较，来回答这个问题。首先，作者比较了在PNE下人类和GenAI创作者的总内容创作量和效用。图6的左侧面板展示了一个明显的趋势：随着GenAI能力（较大的β）的增加，人类创作者的总效用和内容生成量减少，而GenAI创作者的总效用和内容生成量则增加。

有趣的是，随着β接近1，每个人类创作者的平均效用和内容输出实际上有所提高，甚至可能超过GenAI创作者的。这是因为更强大的GenAI将成本较高的人类创作者推挤出市场，只留下一个高效的人类创作者群体，他们由于竞争减少而得以蓬勃发展。这种情况表明，GenAI的广泛应用可能会取代效率较低的内容创作者，占据大量观众的关注。然而，一小部分专业人类创作者不仅将继续存在，而且会蓬勃发展，生产更多更高质量的内容。这一情景突显了GenAI的双重影响：它消除了人类执行单调任务的需要，同时为剩余的高技能创作者营造了一个更具活力和回报的生态系统。

Q4: 创作者如何在不可分成本函数下在不同主题间分配努力？

现在作者研究GenAI如何影响创作者在不同领域间战略性地平衡他们的努力。作者使用排他性竞争并设定K=5和算法1，在不同的α和β下模拟其纯纳什均衡（PNE），假设μ=(200, 100, 50, 20, 10)。这里可以将较大的μk看作是流量较高的热门领域，而较小的μk则表示一个利基主题。为了衡量每个人类创作者对不同主题的倾向，作者引入了“占用比例”的概念，以量化人类创作者在某个主题上的参与度相对于其受欢迎程度，同时作者还分析了创作者从每个主题中获得的平均效用。

图 7

作者的研究结果如图7所示，揭示了人类创作者在GenAI变得更强大时策略的显著变化。最初，人类倾向于更多地关注流量高的热门领域，因为这些领域的潜在流量（因此效用）更高。然而，随着GenAI的实力增强，这种偏好发生了变化。超过某个β值后，人类创作者转向利基主题，从而获得更大的相对收益。这种战略转变归因于GenAI在热门领域的竞争优势（由于人类创作内容的增加），促使人类在竞争较少的领域寻找更好的机会。

图 8

图 9

图 10

这种趋势表明，在未来，GenAI将在易于获取的内容领域占据主导地位，鼓励人类创作者专注于GenAI较难处理的利基主题。这样的转变不仅缓解了人类创作者的竞争压力，还通过专注于他们可以提供独特价值的领域，潜在地提高了他们的平均效用。不同α和创作者成本设置下的详细结果进一步支持了这一观察，如图8、9和10所示。结果可以看到β的阈值效应仍然存在：超过某个临界点，人类创作者对主题的偏好从热门转向利基。比较图7和图8、9、10，可以看到当α变小时和成本变大时，β的临界阈值增加。这个结果突显了一种积极的动态：GenAI在一般内容领域的扩展可能导致一个更加多样化和专业化的内容生态系统，人类创意将被引导到GenAI难以复制的挑战中。

编译 | 于洲

审稿 | 曾全晨

参考资料

Yao F, Li C, Nekipelov D, et al. Human vs. Generative AI in Content Creation Competition: Symbiosis or Conflict?[J]. arXiv preprint arXiv:2402.15467, 2024.

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-07-12，如有侵权请联系 cloudcommunity@tencent.com 删除

模型