首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

V's comments on X's Community Notes

除去最后一段,都是 Vitalik 的内容。

Elon 总 $44 billion 购入了 Twitter,马斯克除了带了技术理念以及文化上的一系列变革。贯穿于这一系列变革中,有一项重要功能 Community Notes(这项功能尤其被政界所喜爱?)。

Community Notes 是一个真实性校验工具,如上图所示。主要用于引导用户对内容的真实、是否包含误导内容做出判断。该功能最早发布于 2021年1月,代号为 Birdwatch, 随 E总 完全接管 X 后,被大规模应用。对热门 twitter 内容增加 Rate It 这一入口,涵盖有争议性的政治话题等。在 V 和 V 接触到的政界人士中,Community Notes 对内容真实性判断,是极具价值的。

V 关注的是 Community Notes 是怎么做的,即便这本身不是一个 "crypto project",但其基于去中心化的多人评价的模式是具备 "crypto value" 的。因为,这些 notes 可以被任何人添加,而并非仅由一些被挑选的专家人士主导。哪些 notes 被展示,哪些不会,则由一开源算法决策。X 官网给出了详细描述,以及对应数据,可以拖到本地运行验证。即便算法本身还不够完美,但其理念满足可信中立性(Credible Neutrality),即便在充满争议的场景,仍然能 work。

Community Notes rating algorithm

任意满足活跃6个月以上、没有违规,具备有效手机验证的 Twitter 使用者都可以参与到 Community Notes 中。参与者进入后分两个阶段,第一阶段以 rate(vote) 为主,第二阶段可以参与写 notes,能否进入第二阶段取决于在第一阶段你的评分能力与真实结果之间的近似程度。

当你对一条信息写 notes 时,将由社区的其余成员,从评审角度来评分,分为3档评分:(举例 +3)、(举例 +1)和(举例 -1,-2),当然评审员还可以采用其余包含在算法定义中的标签来标注。如果整个标注的质量分>0.4,便会在该信息下展示 notes,否则不予展示。

评分算法的特殊性在于,Community Notes rating algorithm 目标是从多方面来收集对于当前 notes 的评价,即:如果有人经常不同意别人的 notes(那些挑剔的信息收集者),但却对某一条 note 深表赞同,那么这条 note 就会被标记一个特别高的分数。

以下,我们将从数学逻辑的角度,展开描述该方法论。cell[i,j] 表示 meber i 对第 j 条的 community note 打分。如同传统的 User-Based Collaborative Filtering,这个矩阵将是非常稀疏的。算法目的,在于通过已知的用户和 note 矩阵,来建模用户应该是“友好度”还是“极端程度”(左翼还是右翼),同样的每一条 note 将被评价为是“有用性”还是“极端程度”。比如,我们可以通过协同过滤的逻辑,通过对于稀疏矩阵的分解学习,可以预测每一个用户对于每一条 note 的评价。

以下是 Community Notes rating algorithm 对具体的 M[u,n] 的计算公式:

其中 M[u,n] 表示用户 u 对于 note n 的整体评价,u 表示整体的评分, i[u] 表示当前用户的友好度,i[n] 表示 note 的有用性, f[u] 表示用户的极端程度,f[n] 表示 note 的极端程度。这里已知的 matrix 是 rating 的真实结果, 上述公式右边都是随机初始化的,并且经过 n 轮 gradient decent 使得公式计算的结果与已知 rating 的结果最为近似。

比较 ** 有意思的是 **,对于 5 个变量的参数,都是通过 gradient decent 来逼近真实矩阵的,所以也想要多次随机和多选几次来预测剩余的 M[u,n]。可以见 V 的代码 。照理,可以有更加优雅的方式来解这个线性代数的问题。那么是不是用这四个逼近的维度值,就真的可以描述预先赋予语义的变量呢?通过以下一些示例,大致看还是可以的。

即便没有事先去标定,所谓的左翼、右翼,通过 f[n] 的数值,还是能比较好的区分出来内容的倾向性。从信息 note 的帮助作用看,以下两个 case 都比较好地呈现了其作用。

V's comments

首先 V 认为这种算法很复杂,算得上一个学术论文的方法了,即便用学术论文写出来,其中还隐藏了很多处理的 trick。对比与类似二次资金算法(pairwise-bounded quadratic funding)之间的区别,就像是经济学算法工程师算法之间的区别。经济学算法,在其最佳状态下,重视简洁性,相对容易分析,并具有明确的数学特性,这些特性显示出为什么它对于尝试解决的任务来说是最优(或最不差的),并且在最理想情况下会证明能够限制某人试图利用它作恶。工程师算法是经过反复试验和错误修正的结果,看看哪些方法奏效,哪些不奏效。工程师算法是务实的,能够胜任工作,而经济学算法在面对意外情况时不会变得完全混乱。

简单而言,"Pairwise-bounded quadratic funding" 是一种筹款机制,它结合了二次资金(quadratic funding)和“成对有界”(pairwise-bounded)的概念。这个名词组合表示一种在资金筹集过程中对项目之间的相对评估进行限制的方法。最终可以把理论边界,形成一个简单的公式:

即使少于百分之一的错误信息推文得到了提供背景或纠正的 notes,community notes 仍然作为教育工具提供了非常有价值的服务。它的目标不是纠正一切错误;相反,目标是提醒人们存在多种观点,某些种类的帖子在孤立状态下看起来很有说服力和吸引力,但实际上是相当错误的,而且经常可以进行基本的互联网搜索来验证它是错误的。

Community Notes 整体而言,是一种有趣的新兴机制设计实例:有意识地试图识别极端化,倾向于促进跨越分歧而不是延续分歧的事物。

个人评价

这玩意很神,对于 5 个变量的参数,都是通过 gradient decent 来逼近真实矩阵的,所以也需要多次随机和多选几次来预测剩余的 M[u,n],也顺道来表达了事先赋予语义的 5 个向量(有 case)。反向拟合,拟合后还有语义是真的骚。此外,照理可以有更加优雅的解法。

少看这些没营养的,七夕快乐,早点洗洗睡。

learn、think deeply,then write.

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oo55gZLU3KFAgSoixS5mQ2Dg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券