首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开发工具推荐:一个开源的灰度发布、AB 实验平台功能发布管理平台

二、项目背景 这个项目是基于 feature flags 技术开源项目,feature flags 坦白说也不算什么新技术了,在公司内也已经实践好几年了,当前互联网公司大厂都在使用这项技术做 AB 实验...、功能灰度等。...三、项目所解决的问题 1 、复杂功能的逐步发布 当开发一个复杂的功能时,传统的开发方式可能需要等到功能完全开发完成后才能进行发布。这可能导致较长的开发周期和较高的风险。...使用 feature flags ,可以将功能分成较小的模块,并逐步在应用程序中启用。这样可以减少开发风险,更快地将功能交付给用户。...3 、A/B 测试和功能评估 通过使用 feature flags ,可以将不同的功能变体分配给不同的用户群体,进行 A/B 测试。这样可以评估不同功能的表现和用户反馈,以确定最佳方案。

1.2K10
您找到你想要的搜索结果了吗?
是的
没有找到

AB测试:一个互联网公司的标配,一切皆可AB测试

01 什么是A/B测试? A/B测试,也称为A/B实验、分桶实验或对照实验。指当个变量具有两个版本A和B的随机试验。...一般用来测试产品的新特性或新功能。善用实验,通过数据驱动产品,可以帮助我们降低验证成本和决策风险,快速达成共识,提升创新效率。...用AB测试的应用场景: 产品侧: 功能迭代 用户路径设计 UI&交互优化 运营侧: 活动页面优化 推送方案择优 投放落地页优化 研发侧: 推荐算法优化 灰度发布 03 如何进行A/B测试 1、提出问题...如发现某一个功能的用户留存率很低,我们需要查看这个功能并假设什么样的产品策略可能会增加留存率?更换一套推荐系统的算法模型? 3、定义成功指标 我们需要修改功能的哪些参数?...或者推荐系统不同模型推荐内容曝光、点击和进入内容页面的流量统计。在此还需要计算测试的运营成本,并将其与成功改进功能的潜在收益进行比较。

53430

论文阅读:《Improving Content-based and Hybrid Music Recommendation using Deep Learning》

因此,传统的功能可能无法考虑到与音乐推荐相关的信息。...手工制作这样的功能是可能的,但费时费力。一种更好的方法是将现有的两阶段方法结合到一个统一的自动化过程中:从音频内容中自动和直接学习特性,以最大化推荐性能。...实验结果表明,学习功能互补的CF也优于传统特征的混合方法。 本文的其余部分组织如下。2节简要回顾了流行音乐的记录方法推荐和简要介绍了深信念网络以及在音乐任务中的应用。...第3节描述了我们的基于内容和混合推荐模型,并讨论了我们实验中使用的基线内容模型。第4节描述了我们广泛的实验评估。第5节总结了这项工作,并讨论了未来的研究方向。...例如,如果用户A和B具有相似的音乐首选项,那么B推荐的歌曲,但尚未被B所考虑,B的最新方法是基于矩阵分解(MF)的,这一点很好地总结了[ 11 ]。

66530

Nat. Biotechnol. | 从通用蛋白质语言模型中高效演化人类抗体

基于随机猜测或蛮力搜索的人工进化通常需要大量的努力来探测活性较弱或非功能性的蛋白质,需要高实验通量来识别具有改进适应性的变体。...在给定单个起始序列的情况下,作者使用这些语言模型推荐可能的氨基酸替换,并对其进行实验筛选以改善适应性。...作者使用了ESM-1b语言模型和ESM-1v集合(总共六个语言模型)进行了进化实验。...图 3 亲和力增强替换的独特性 尽管能够找到任何亲和力的改进对于工程应用本身就是有用的,但作者也对算法推荐的一些变化是否表现出“独特性”感兴趣虽然确实在模型的训练数据和抗体序列数据库中观察到许多亲和力增强的替换...然后,作者使用高通量扫描突变实验实验测量结果来验证语言模型推荐的预测(需要强调的是,这些测量结果并没有提供给模型)。

20230

Booking.com的AB测试实践

A/B测试是一种通过比较某个指定特性不同版本的差异,以理解哪一个版本的效果更好的一种行为。但要正确地实践A/B测试,需要满足一些前提条件。 每个特性都需要进行完整的测试,但这种测试必须是原子性的。...在实践中,Frisby并不推荐这种类型的A/B测试,他相信改变颜色不是一种解决用户问题的正确方式。...但这一场景能够简单地表现出整个流程,这个实验的假设场景是这样的: 由于在网站中使用了一些较高对比度的元素,使得我们的业务中一个主要的行为功能(即“立即预定”按钮)显得不够突出。...用于对此次实验的结果进行分析的衡量标准: 如果有更多的用户选择单击某个对比度较高的按钮,并最终下了订单,我们就知道这个假设是正确的。...Frisby提出了一种层次型的可信赖数据源(按可信赖度从高到低排列):你自己的实验数据;你个人的观点,因为你最了解你自己的产品;他人的观点;他人的实验数据,因为它会为你造成一种假象,让你错误地确信它的结果

724110

ChatGPT的博弈:一场猫捉老鼠的游戏画上句号

前言 上周日我在B站发了个视频(https://www.bilibili.com/video/BV1Ud4y1e7BP),本来想水一期的(毕竟一个半月没更新了),不过借着ChatGPT的热度,播放量突破...12.12 - CloudFlare5秒盾 可能是周末官方服务被机器人频繁调用,这天周一官方一上班就新增了一道CloudFlare5秒盾,即访问ChatGPT网页时,需要先等待五秒。...优点 1.调用速度快,毕竟是官方API,没有那么多限制,速度嗖嗖的 2.可以联网,因此可以用它进行一些网页聚合搜索和推荐 缺点 1.输入长度限制,davinci的最大接受输入是4000个token...,这就意味着太长的语言无法回答 2.性能比ChatGPT明显要低一些,不过作为陪聊机器人,基本该有的功能都有

1.6K20

终于有人把AB测试讲明白了

这就是一个A/B测试的例子:一种简单的用于比较A和B两组变体的对照实验。A和B也分别称为对照组和实验组。 该测试开始后的几个小时,“营收过高”的警报被触发,提示实验有异常。...你决定引入一个新功能,观察到使用这个新功能的用户的流失率仅为一半:X%/2。 你可能据此推断出因果关系:该新功能使得流失率减半。...由此得出结论:如果我们能让更多的用户发现这一功能并使用它,订阅数将会激增。错了!根据这个数据,我们无法得出该功能降低或增加用户流失率的结论,两个方向皆有可能。...谷歌、领英和微软的实验平台每年可以运行成千上万个线上对照实验,并提供可信赖的实验结果。我们相信线上对照实验有以下特性: 它是以高概率确立因果关系的最佳科学方法。...延伸阅读《关键迭代:可信赖的线上对照实验》 点击上图了解及购买 转载请联系微信:DoctorData 推荐语:爱彼迎、谷歌、领英A/B测试领军人物撰写,亚马逊、谷歌、微软和领英等公司互联网产品成功的秘诀

76120

浅谈工业级推荐系统

实际上,研究人员和实践工作者很快意识到了把推荐系统研究如此简化带来的一个直接问题,那就是推荐系统性能的提高,或者说是对用户评分预测的精准与否,与我们期望推荐系统所承载的功能有不小的偏差。...也就是说,Netflix所有产品,包括上面林林种种的搜索推荐功能都是为这同一目的而服务的。...产品的业务指标需要长期观测这一特性为优化这些指标,特别是利用机器学习系统来优化这些指标,带来了巨大的困难。 现代互联网产品迭代往往利用在线可控实验,或者简称的A/B测试,来对产品特性进行实验。...一般来说,A/B测试运行一两周,有时候会有两三周,然后根据一些容易观测的指标,例如“点击率”来判断特性的新版本是不是比当前版本要有明显的优势(包括我们说的统计意义上的要更好)。...如果我们希望利用A/B测试来对产品的特性进行迭代,那势必就需要观测的指标能够在测试的时长中被有效得观测到其大小的变化。

65130

轮子系列:一款能用易用好用的Android图片轮播轮子

---- 前言 Banner功能在Android开发中实在是太常见了,主要用于广告轮播、商品照片轮播等等,如下图: ?...实现轮播功能为什么要选择轮子? 主要原因是自己实现的话功能实现和性能优化会耗费太多工期,包括; 耗费原因1:功能实现 常见的Banner的功能主要有: 1. 实现图片 & 标语展示 2....选择标准: 实现上述所有功能 什么动画那些其实暂时我们并不需要,所以只需要能实现上述基本的功能就能满足现在市面上大多数的功能了。...community/01c8dc56e1428e6ac72531cbaa5f2c.jpg", "http://img.zcool.cn/community/01fda356640b706ac725b2c8b99b08...自动对应 String[] titles=new String[]{"十大星级品牌联盟,全场2折起","全场2折起","十大星级品牌联盟","嗨购5折不要停","12趁现在","嗨购5折不要停,12.12

1.5K20

剑桥计算机博士推荐,毕业之前,我需要掌握这9个工具

因此,实际上,你将进行许多不同的实验,并且将越来越难以整理结果。...在这一方面,Aliaksei Mikhailiuk 向我们展示了如何正确方便地管理和记录自己的 ML 和 DL 实验工具,主要推荐了 Weights & Biases,MLFlow,Screen 工具。...W&B(Weights & Biases) 是一个平台,可以帮助数据科学家跟踪他们的模型、数据集、系统信息等。只需几行代码,用户就可以开始跟踪有关这些功能的所有内容。...W&B 提供了以下 4 个有用的工具: Dashboard:实验跟踪; Artifacts:数据集版本控制、模型版本控制; Sweeps:超参数优化; Reports 保存和共享可重现的结果。...本次分享摘要如下: NVIDIA TAO Toolkit的独到特性 TensorRT 8.0的最新特性 利用TAO Toolkit快速训练人脸口罩检测模型 利用TensorRT 快速部署人脸口罩检测模型

82510

安卓Chrome使用技巧合辑

三.实验特性:   在这里小苏只列出一些实用且安全的"功能特性",考虑到数据安全和设备差异,一些可能引起浏览器不稳定的实验特性小苏暂未列出,大家可以在:   chrome://flags...  中自行体验,值得说明的是,一些实验特性可能导致浏览器不稳定,所以在更改实验特性之前## 请仔细阅读实验特性页面上方的警告并提前备份好数据## 。...以下内容在发文时的最新版Chrome Dev(59.0.3068.4)上测试通过,由于各版本(Stable/Beta/Dev/Canary)中支持的实验特性存在差异,并且某一实验特性有可能随着版本更迭被更改...小苏推荐的值为:流畅(Smooth)。   2....停用(disable)此项后,最常访问的网址/最近使用过的书签/推荐内容将会被隐藏,还你一个简洁的起始页(有兴趣的话你可以试试这个特性中的其他选项)。   4.

9.4K30
领券