首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Twitter 算法开源究竟会是什么样

因此,让我们看看能否从工程角度增进对这个对话了解。 Twitter如何工作时间线视图 Twitter 为用户提供了两个版本时间线视图:默认算法推送“主页”以及 “最新”。...静音(Mutes) —— 将一个账户静音,让你可以从自己时间线上删除一个账户,而不需要取消关注屏蔽该账户。被静音账户不会知道你把他静音了,你可以在任何时候取消静音。...排名信息 摘自“在 Twitter 时间线上使用大规模深度学习(2017)”:为了预测某条是否会吸引你,我们模型考虑了以下特征(要点): 文本身:它新近度,存在媒体卡(图像视频),总互动数...,同时考虑最新原始时间线, * 以及包含潜在相关网络图时间线子集。...是否有可能抽象出运行像 Twitter 这样全球性生产系统所需所有工程复杂性,并制定一份真正有用开源软件规范 API

99440

Twitter推荐算法正式开源,GitHub Star飙升至 42.9K !

来源:InfoQ 3 月 31 日,正如马斯克一再承诺那样,Twitter 已将其部分源代码正式开源,其中包括在用户时间线中推荐算法。...Twitter 官网博客详细介绍了算法在确定 For You 时间线所显示时,会具体参考哪些内容并如何对其进行排名和过滤。 用于构建时间线主要组件 从博来看,推荐管线由三个主要阶段组成。...首先,它会收集“来自不同推来源最佳”,之后使用“机器学习模型”对各进行排名。最后,它会过滤掉来自已屏蔽用户、已经看过或者在工作时间不宜观看内容,最后将结果显示在时间线上。...例如,第一步大约会查看 1500 条,目标是让 For You 时间线中约 50% 来自已关注用户(即「人际网络内」),50% 来自“尚未关注「人际网络外」账户”。...文本身:它新近度,存在媒体卡(图像视频),总互动数(如转发和喜欢数量)。

73220
您找到你想要的搜索结果了吗?
是的
没有找到

特开源了,马斯克说到做到

机器之心报道 机器之心编辑部 如何振兴特,马斯克选择「流量最大」打法。 马斯克曾把特斯拉专利开源,现在算法也被他开源了。...对此,特在今天下午 Spaces 会议上也有回应,一位特工程师表示,这些标签仅用于衡量指标。而马斯克说自己在今天之前不知道这些标签,并表示「它们不应该在那里」。 特是如何选择?...下面这张图说明了用于构建时间线主要组件: 接下来探讨一下这个系统关键部分,大致按照在一次时间线请求中调用顺序,从检索候选源开始。...候选Twitter 有几个候选源,他们用这些候选源来为用户检索最近相关。对于每个请求,他们试图通过这些来源从数以亿计池中提取最好 1500 条。...下一步计划包括: 为创作者提供更好特分析平台,提供更多关于影响力和参与度信息; 提高应用到用户帐户任何安全标签透明度; 更好地了解出现在时间线原因。

1.4K10

系统设计:社交网络服务

需求 让我们设计一个类似Twitter社交网络服务。该服务用户将能够发布、关注他人以及喜爱。 难度:中等 1.什么是Twitter?...用户通过其网站界面、短信移动应用程序访问Twitter。 2.系统要求和目标 我们将设计一个更简单Twitter版本,并满足以下要求: 功能要求 1.用户应该能够发布新。...3.用户应该能够将标记为收藏夹。 4.该服务应该能够创建和显示用户时间线包括来自用户跟随所有人。 5.可以包含照片和视频。 非功能性需求 1.我们服务需要高度可用。...3.用户看到刷新时间线平均延迟。 通过监视这些计数器,我们将了解是否需要更多复制、负载平衡缓存。 13、扩展要求 我们如何提供物料?...搜索:搜索包括索引、排名和检索。 参考资料 grok_system_design_interview.pdf

4.3K30

马斯克开源Twitter算法,GitHub Star数已破万

马斯克开源 Twitter 推荐算法 3 月 31 日,正如马斯克一再承诺那样,Twitter 已将其部分源代码正式开源,其中包括在用户时间线中推荐算法。...Twitter 官网博客详细介绍了算法在确定 For You 时间线所显示时,会具体参考哪些内容并如何对其进行排名和过滤。 用于构建时间线主要组件 从博来看,推荐管线由三个主要阶段组成。...首先,它会收集“来自不同推来源最佳”,之后使用“机器学习模型”对各进行排名。最后,它会过滤掉来自已屏蔽用户、已经看过或者在工作时间不宜观看内容,最后将结果显示在时间线上。...例如,第一步大约会查看 1500 条,目标是让 For You 时间线中约 50% 来自已关注用户(即「人际网络内」),50% 来自“尚未关注「人际网络外」账户”。...文本身:它新近度,存在媒体卡(图像视频),总互动数(如转发和喜欢数量)。

56520

马斯克被Twitter脆弱代码“逼疯”,要求全部重写!网友:重构是空降领导了解当前系统最快方式?

首先是单击链接无法跳转,反而弹出了一条神秘错误消息,称“您当前 API 计划不包括对此端点访问权限”。...有网友指出是“对 Twitter API 传入和传出访问被破坏了”,底下有网友抱着“看热闹不嫌事大”心态称:“这个应用程序坏了会更有趣”。...本周一错误配置变更,已经是 Twitter 今年以来第六次造成广泛影响服务宕机: · 1 月 23 日,Androiod 用户暂时无法加载发布新。...· 2 月 8 日,一条错误消息提醒用户“您已超过每日发送上限”,导致其无法正常发帖。 · 2 月 15 日,无法加载。 · 2 月 18 日,时间线中断,回复消失。...· 3 月 1 日,时间线无法正常工作。 以上提到还只是服务宕机。此外,马斯克时间线上比其他用户更显眼等问题,也扰乱了用户正常体验。

79820

Twitter新政:变革140字限定背后,Twitter有何新目标?

此外,该公司将改变显示方式,用户包含艾特对象也将即时出现在用户时间线内。 这一改变对用户习惯和互联网世界又意味着什么呢?...我们听听Twitter产品经理Todd Sherman如何讲述?...以下为Todd Sherman致Twitter用户公开通知全文: 2006年,当我们介绍API时候,只能发送140个字符文本信息,并且常常是通过短消息发送。...这个区域被限制为只能包含一个URL标识为一个数据源:目前包括1到4张照片、GIF、投票、引用DM深度链接。...为了支持这些变化,在API Endpoint方面会有新API选项用于创建使用。如需获取详细信息,请查阅我们已经发布初期技术文档。

1.8K60

面试问题:如何设计一个微博

设计一个像微博这样系统是软件工程面试中常见问题,特别是用于评估候选人对系统设计原则、可扩展性和处理高流量网络应用理解。以下是设计像Twitter这样系统高层次方法: 1....服务:处理发布、删除和检索。 关注服务:管理关注和取消关注操作以及粉丝列表。 信息流服务:为用户时间线聚合。 通知服务:为各种活动发送通知。...关注者数据:存储用户之间关系(谁关注了谁)。 索引:有效地搜索和检索和用户。 4. 可扩展性和性能 微服务架构:将功能划分为微服务,以实现可扩展性和可维护性。...数据库分片:根据用户IDID进行数据库分片,实现负载分布。 缓存:为频繁访问数据实现缓存,减少数据库负载。 负载均衡:使用负载均衡器在服务器之间分配流量。 5....实时信息流生成 模型:当用户发布时,将其推送到关注者信息流中。 拉模型:用户定期拉取/刷新他们时间线。 混合方法:推拉模型结合,优化性能。 6.

14810

常见分布式应用系统设计图解(二):Feed 流系统

,它取决于用户所关注用户列表,再结合时间线(有时还包括优先级)将这些用户最新 feed 聚合,并以流方式展示出来。...这里提给 push 和 pull 各提一个经典问题: 第一个问题是 push 模型下,由于粉丝众多,占用容量过大问题,一种解决思路是在粉丝时间线中只存储 id,但是这样的话在聚合时候需要一次额外根据...一种方式是根据时间范围来划分,这也是 Twitter 早期做法,这种做法有一个严重问题,就是老没有人看,而新文则火得不得了,因此机器 load 严重不均。...第二种方式是根据 id 来做简单 hash,这种方式最大问题是一个人可能分散到任何一台机器上,为了找这个人要去所有的机器上查询并聚合(既包括网络 I/O,也包括磁盘 I/O),这无疑是过于浪费了...用户时候,根据用户所应对策略,如果需要 fan out id 到粉丝时间线中,就要把这个事件进 queue,由于它是异步模型,这一步可能会有不同程度延迟。

81431

设计 Twitter:合并 k 个有序链表和面向对象设计

一、题目及应用场景简介 Twitter 和微博功能差不多,我们主要要实现这样几个 API: ? 举个具体例子,方便大家理解 API 具体用法: ? 这个场景在我们现实生活中非常常见。...个用户,我们就可以用合并 k 个有序链表算法合并出有序列表,正确地 getNewsFeed 了!...具体算法等会讲解。不过,就算我们掌握了算法,应该如何编程表示用户 user 和动态 tweet 才能把算法流畅地用出来呢?这就涉及简单面向对象设计了,下面我们来由浅入深,一步一步进行设计。...之所以要把 Tweet 和 User 类放到 Twitter 类里面,是因为 Tweet 类必须要用到一个全局时间戳 timestamp,而 User 类又需要用到 Tweet 类记录用户发送,所以它们都作为内部类...注意图中链表节点中数字是 time 属性,不是 id 属性: ? 至此,一个简化 Twitter 时间线功能就设计完毕了。

90320

一位付费API工程师如何制造了特今年第七次崩溃?

“当前API计划不包括对此端点访问权限”。 除此之外,也有不少用户称,无法加载图片,甚至无法访问特账号管理工具TweetDeck。...偌大特却只有一位付费API工程师 Platformer表示,特这次“小小API变化”是关闭API免费访问项目所引起。...特故障频出,马斯克却称公司将在第二季度实现正现金流 正如这位前雇员所说,这已经是特今年第六次服务中断了。 1月23日,安卓用户无法加载新发布。...2月8日,错误提醒告知用户,他们“超过了发送每日限额”,无法再发布。 2月15日,无法加载。 2月18日,时间线中断了,回复也消失了。 3月1日,时间线再次停止工作。...他补充到,成本预计为每年约30亿美元,其中包括用于收购130亿美元债务15亿美元利息支付。

68310

我暗恋了6周帅哥,竟然是一个AI机器人...

哦,对了,他有一次发布,CNN赞助人Jason Kander还点赞了,好几百人转发点赞。我也转发了。虽然他上线不久,但6个星期已经获得了13.1万次浏览量。...他睡觉很规律,工作忙时候也不太上Twitter。有时候,他更新频繁些,有时候又好久不更,真是个随性懒家伙。 他还很萌。有时候,干脆直接更一条咿呀学语,笑死我了。...为了简化原创内容制作,Kevin只制作两种内容:基本和对热门话题评论。 每次Kevin检查Twitter时,他会分析数百条,并建立起常用词统计模型。...其他互动则更加积极一些: 仍有改进空间 Kevin离真正成功还有很远距离。他存在着一些缺陷,由于我技能限制着时间限制,无法进行完善。 低质量 有时,Kevin真的不擅长发。...最糟糕是,这条并不符合他网络定位。 不完整想法 如果Kevin查看了一些包含链接照片引用,他有时会发出不附有相关内容

1K110

系统架构设计(3)-可扩展性

比如Twitter两个典型业务操作: 发:用户可快速推送新消息到所有粉丝,平均大约4.6k request/s, 峰值约12k requests/sec 页时间线(Home timeline)浏览:...对此有如下 处理方案 方案一:关系型数据模型 将发送插入全局文集合。当用户查看时间线,首先找所有的关注对象,列出这些人所有,以时间为序来排序合并。...当用户推送新,查询其关注者,将插入到每个关注者时间线缓存中。因为已预先将结果取出,之后访问时间就是线性性能,很快。...Twitter最初使用方案一,但发现主页时间线读负载压力与日俱增,系统优化之路曲折,于是转向方案二,实践证明更好,因为时间线浏览压力几乎比发布要高出两个数量级,基此,在发布时多完成一些事情可加速读性能...大多数用户在发布时继续以一对多写入时间线,但少数大V用户除外,对这些用户采用类似方案一,其被单独提取,在读取时才和用户时间线主表合井。这种混合方案能提供始终良好表现。

88020

系统设计面试:保姆指南

这里有一些问题对于设计在进入下一步之前应该回答问题: •我们服务用户是否能够发布特并跟踪其他人? •我们是否也应该设计来创建和显示用户时间线? •特会包含照片和视频吗?...•用户是否能够搜索? •我们是否需要展示热门话题? •是否会有推送新(重要)推送通知? 所有这些问题都将决定我们最终设计。 第二步:系统接口定义 定义系统需要哪些api。...如果我们假设我们会如果有更多读流量(与写流量相比),我们可以决定使用单独服务器来处理这些场景。在后端,我们需要一个高效数据库,可以存储所有的和可以 支持大量读取。...(分布式数据库,分库分表,数据一致性) •我们将如何处理那些经常发关注很多人热门用户?...(热数据问题) •由于用户时间线将包含最新(和相关),我们是否应该尝试存储我们数据在这样一种方式,是优化扫描最新特?

1.5K231

加密货币量化交易机器人:自动交易,智能洞察 | 开源日报 No.172

该项目的主要功能、关键特性、核心优势包括: 提供完整 Fuel v2 协议实现 支持 GraphQL 服务端点 通过事务执行器执行即时区块生产 提供 Docker 和 Kubernetes 支持 可以通过...主要功能和优势包括: 无 JavaScript 广告 所有请求通过后端处理,客户端不与 Twitter 直接通信 防止 Twitter 跟踪 IP JavaScript 指纹 使用 Twitter...非官方 API(无速率限制开发者账户要求) 轻量级 RSS 订阅 主题定制 移动设备支持(响应式设计) 此外还提供了 Liberapay 和 Patreon 支持,并计划增加嵌入、带时间线支持账号系统...、/个人资料归档以及开发者 API 等功能。...它能让用户以肉眼、双筒望远镜小型望远镜所见到一样来观测天空。

33010

寒气遍布硅谷:特员工公开指出马斯克错误遭解雇,亚马逊启动万人大裁员

twitter@debarghya_das 员工公开指出马斯克错误,马斯克:「He’s fired」 与动不动裁撤几千人不同,特最新一次的人事变动似乎是针对个人,马斯克刚刚解雇了在特上公开指出他错误员工...procedure calls)来加载主页时间线。...看到老员工这么一番解释,似乎是为了澄清最初,马斯克随后回应道,「你没有意识到当有人使用 Twitter 应用程序时会调用多达 1200 个微服务,这样并不好。」...自称为 Twitter 技术负责人 Sasha Solomon 引用了马斯克原始,指出马斯克不了解 GraphQL 是如何工作,也不知道 Twitter 基础设施是如何运作。...随即在不到一天时间里,Solomon 表示自己被解雇了。她没有提及是否被马斯克直接解雇,而且马斯克也没有像对待 Frohnhoefer 那样回应她

31230

如何一步一步设计一个大规模复杂系统

以设计一个类 Twitter 服务为例,在开始设计之前应先回答以下问题: 我们服务用户能否发布并关注其他人? 我们是否还应该设计来创建和显示用户时间轴? 文中是否包含照片和视频?...用户将能够搜索吗? 我们需要显示热门话题吗? 是否有关于新(重要)推送通知? 这些问题将决定最终设计系统长什么样。...第二步:系统接口定义 定义系统期望接口(API)不仅可以帮助建立预期接口协议 ,也可以确保我们没有弄错需求。...系统预期规模,例如,新数量,阅读量,每秒产生时间线? 我们需要多少存储空间?如果用户可以拍摄照片和视频,又需要多少存储空间。 我们期望多大带宽?...如何处理发大量关注很多人热门用户? 由于用户时间轴将包含最新,为了获取最新是否需要优化数据存取方式? 我们应该在多少层引入缓存以加快处理速度? 哪些组件需要更好负载平衡?

93420

Github项目推荐 | 被昨天股票吓哆嗦了吗,试试用Trump2Cash帮你赶紧脱坑

每当特朗普发时,它都会使用Twitter Streaming API得到通知。...main模块定义了一个回调函数,处理传入并开始将特朗普分析结果传输出去: def twitter_callback(tweet): companies = analysis.find_companies...前者在特朗普文本中检索对公司提及,寻找它们股票代码,并给打情绪分。后者则选择一种交易策略,即要么现在买进,然后在收盘时卖出;要么现在卖空,然后在收盘时买进以回补。...设置身份验证 从shell环境变量中读取不同API身份验证密钥。每项服务都有不同步骤来获取它们。 Twitter 登录你Twitter帐户并创建一个新应用程序。...>" 如果你希望来自拥有该应用程序同一帐户,只需在同一页面上使用访问令牌和访问令牌密钥即可。

2.4K50

一个技术人原地爆炸,并反撸不懂GraphQL马斯克

刚刚正式掌管 Twitter 不久马斯克对公司进行了大刀阔斧裁员,从他近日发表来看,很显然他对此决策颇为满意,直言 “Twitter 越来越充满活力”。...Twitter 技术主管转发了马斯克这则,并回击道:“你不仅裁掉了几乎所有负责 Twitter 基础设施员工,现在还粗鲁无礼地评价我们批处理工作。”...最后还质问马斯克是否有去了解过 GraphQL 工作原理。 事实上,这位女性主管早已表达过对马斯克不满,且看她置顶。...她特名字更是在内涵马斯克掌管下 Twitter 是一个 "hell site"。...正如官网所说,GraphQL是一款专门为前端查询而生语言,它本身就是用来解放前后端接口联调工作提效工具,那当然也包括APP,也可以利用它来提高开发效率,也就是说Twitter技术主管已经在自己项目中落地了

61320
领券