Stitch Fix玩转时尚算法,年销7.3亿

Stitch Fix(简称SF)由Katrina Lake 创办于2011年,总部旧金山。其模式最大的特点是:私人造型师为顾客搭配衣服。

订购卖服装的模式,在中国还没有特别好的案例。相比之下Stitch Fix做的相当出色,成立7年,员工超5000人,还盈利了!

Stitch Fix的制胜之道在于其商业模型采用了前所未有的数据科学,不仅仅是推荐系统,还有基于人的计算建模、资源管理、库存管理、算法化时尚设计和其他多种功能领域,发展迅猛。

许多人都有选择困难症,买衣服就是其中之一。Stitch Fix公司创始人Katrina Lake结合自己的专业背景,组织了一群数据科学家、IT工程师、时尚造型师和零售业精英,开创了这一家公司,为大众寻找自己喜欢的服饰。那么这家公司是怎么解决消费群体这样的不确定性需求的呢?又如何管理仓库的进货出货?如何匹配合适造型师給到消费客户意见?小编将在接下来的章节一一为大家讲解。

总体介绍

在进入正题前,我们需要了解Stitch Fix如何給客户服务。具体步骤如下:

第1步:顾客填写风格偏好问卷

第2步:选择订购周期:从两周一次到每季度一次不等

第3步:造型师挑款,收取造型费20元

第4步:顾客按时收到盒子(Fix),里面有5件衣服,和搭配方法

第5步:试穿,确定购买或退回。造型费可冲抵服装费用。

以上是客户的视角所能看到的,那么下面将介绍的是Stitch Fix所运行的主要环节和技术。

选定送货仓库

在给客户送货之前,Stitch Fix中心首先会选定一个仓库送货,目前Stitch Fix在美国总部一共有五个仓库,在选定仓库过程是由一个算法所决断,这个算法计算了一个代价公式,基于每个仓库与客户的位置关系以及库存与客户所需的匹配度计算。

对每一个客户都计算一遍后就会生成一个代价矩阵,这样,选定送货仓库的问题就变成了一个最优化问题,这样就只需要运用数学理论里最优化的解决方法就可以求得全局最优解(当然也会参考客户的特殊需求)。

评分排序

选定仓库后,Stitch Fix后台系统会上罗列出该仓库的所有库存清单,首先会经过一个过滤算法(基于客户所填信息)先去除掉客户已经购买过的或者已经咨询过不需要的库存。针对淘汰后留存的每一款服饰,机器会尝试评估这个客户喜欢这款商品的相关概率。这是一个非常困难的问题,Stitch Fix尝试过很多种方法来实现,下面介绍了其中几种,但总的来说,他们是从不同算法上对每一款商品进行多次打分后排序。

这个问题是经典的协同过滤问题:在基于之前所收集的不同客户对不同风格商品的回馈历史数据,他们填充一个稀疏矩阵(横列是所有客户,竖列是仓库里的所有商品,每个单元格填写的是客户对商品的相关系数,大部分还是未知,所以称之为稀疏矩阵),之后他们将根据一些明确的数据(可以在注册或者历史购买中所填写的偏好以及这款商品受到其他与该客户相似的其他客户的历史反馈)来预测一款与从没收到过这款商品的客户之间的相关系数。更多的,他们采用了一些标准的协同过滤算法(例如根据和你有同样喜欢其他款商品的人对这款商品的喜欢程度去推算)。

从而,他们设计了混合效应模型,在数据科学里这是非常有用的,因为该问题的纵向因素是:它让公司能够既从个体又从整体上学习(与追踪)到客户随着时间的兴趣爱好变化。同时,他们也利用第三方源的相关特征,从(结构化/非结构化)数据获取并使用,进而提高算法效率。

有时候通过文字很难去描述一个客户的风格喜好,但当客户看到商品的时候就会知道到底喜不喜欢它,所以Stitch Fix也关注客户喜欢看的图片(例如从Pinterest),也在他们库存里搜索视觉类似的商品。借此训练一个神经网络去生成向量来描述这些图片,然后在之前库存的每一款商品上提前计算出来向量与这些向量之间求它们的余弦相似度作为分数。

同时也适用自然语言处理技术来根据客户的购买需求文字对产品打分。

最后根据以上多种打分机制,综合考虑,选择出满足一定分数的商品出来并排序输出商品图片和客户资料到Stitch Fix时尚造型师团队去。

匹配时尚造型师

时尚造型师的选择也是一个类似之前的最优化问题。当然人类更为复杂,机器只会选择一样,但是时尚造型师会根据客户具体需求再次进行多种选择,所以他们对这个匹配也进行了优化。

为了完成这点,他们首先计算了在当前时期每一个时尚造型师和那些有需求的客户之间的匹配分数,这个匹配分是一个复杂的函数,根据的是客户和时尚造型师之间的历史数据、客户状态及喜好还有时尚造型师的设计风格之间的相似度。

此时,时尚造型师指定优化问题接近于之前提到的仓库指定问题,期望能做到:

(a)需要只考虑那些等待发货的客户(b)我们必须频繁优化该问题从而解释造型师工作队列的多样化。

因此,Stitch Fix也给这些时尚造型师打造了一个基于客户构建的计算平台去更快更深刻地理解客户。这个平台会记录一些重要的数据,例如时尚造型师都给那些客户选择了那些服装搭配,决策时所采用的服装的共同点和不同点,最后再追踪结果返回数据等等,这些测试和记录,都会帮助我们理解时装造型师怎么决策。

最终,时装造型师拍板从库存里做的选项,写一份私信给客户在具体的场景或者只是试衣间里描述如何去搭配这次包装里的各种服装,于是这样就确定好了需要派发的衣服。

仓库取货路径问题

在确定好应该挑选的商品后,因为仓库比较大,还需要规划取货路径。这是一个经典的算法问题,是一个NP-hard旅行商问题,已有方法求得这类问题的次优解。现实里,Stitch Fix还会进一步考虑这个问题,去尽可能先计算出可以最轻易提取产品的路径。

形成体系

当然,Stitch Fix的货品就这样从仓库派送到对应的客户,而这也才是Stitch Fix所做的步骤中刚刚起步的一小节而已。

客户打开盒子后看到很高兴的会保留,发送回不喜欢的衣服,然后告诉Stitch Fix对每件服装的看法。她和Stitch Fix有一个共生的关系,她给了非常有见地的反馈,使得Stitch Fix不仅能以此反馈更好的服务下一次,也提供了数据去让Stitch Fix更好地服务于其他相似客户。

以此生意开始流转,数据也在其中不断迭代增加及使用。抽象着看,Stitch Fix将系统作为一个整体考虑。 站在这样的一个层面,业务的另外两个方面变得清晰:

(1)Stitch Fix必须通过为客户购买和/或设计新服装来持续补充库存,这丰富的数据提供了极好的机会;

(2)Stitch Fix必须预测客户的需求,以确保在适当的时间有足够的适当资源。

库存管理

如果你觉得完成以上后台及系统Stitch Fix就觉得完成整个运营那你就大错特错了。Stitch Fix还考虑了其他两个重要的问题:库存管理和新风格发展。在库存管理这一块,他们采用了状态机的理论知识来支撑。

像这类给客户选货供货送货的买卖,会涉及到公司应当考虑给仓库入什么货、入多少货这类需求预期问题,其中的解决方法之一是考虑每个时间点的每个客户的“状态”。他们是新客户吗?他们是通过转介还是自己到达?他们的衣柜几乎满了吗?他们是否在生活改变后建立他们的衣柜?还是只想尝试新的东西?根据他们的状态,他们可能会有差异的装运需求,不同时间和类型的电子邮件保持联系的渴望等等。

因此Stitch Fix跟踪每个客户的每个接触点 - 发送的每一次包裹,每一个收到的反馈,每个提交,每封电子邮件等等这些信息数据记录在案。

使用这些数据,可以试图去了解客户的状态及其在这些不同时期的需求。然后可以检测状态的变化,并考虑可能的触发器。这个过程本身可以导致洞察,从而帮助公司去保持客户的快乐消费体验。

一旦定义和理解这些状态,并检测和理解客户之间的过渡,就可以开发状态转换矩阵和马尔可夫链模型,使Stitch Fix能够达到研究系统级的效果。

这些马尔可夫链模型的许多用途之一是预测未来的需求,这是很重要的。因为公司往往需要在购买库存月份前维持库存量,还必须确保我们在正确的时间拥有适当数量的资源。

通过客户需求的库存损耗最终必须通过购买新库存来抵消,其中还有一个挑战是如何确保购买时机,以便为时装造型师保持足够的库存可用性,同时最小化订购成本和承载成本(与库存曲线下面积相关的运营成本和机会成本)。

满足未来需求只是库存管理挑战之一:还必须适当地将库存分配给不同的仓库,偶尔捐赠旧库存,为新风格商品腾出空间。这里Stitch Fix使用新的算法来帮助进行这些过程。请注意,现实情况比这个简单的例子更复杂,因为必须深入了解每个仓库中不同类型和样式的服装的可用性,但仍旧会遵循一些简单的规则来指导清货。

有多少样式要购买?哪些物品应该去哪个仓库?什么时候应该捐赠什么库存?通过使用系统动力学模型来回答这些问题,将其与历史数据进行拟合,在给定的量化后的不确定性里,用上述结果来进行鲁棒性优化。

新风格发展

容量挑战不是库存更换的唯一考虑因素:Stitch Fix还想以不断改进库存的方式购买和开发新服装,这样可以有机会帮助时装造型师为广泛的客户群带来更大的乐趣,为独家品牌设计新款式提供发展基础,也为特定客户群定制了新设计,因为这些客户群往往不满足其他品牌。

而Stitch Fix通过遗传算法的灵感来把握住这个机会:使用了重组和突变以及适应性测量,“物竞天择,适者生存”的核心思想。他们是这么做的:

第一步是将每种服装的各类基本属性分解看待,每种商品的一组属性视为其“基因”,商品就成为了一类有”基因“的”生物“。然后,以这种方式考虑庞大的样式集,并考虑为每个“生物”提供的客户反馈(即是该“生物”在这样的环境下的“适应性”)。继而考虑通过重组现有样式的属性并可能稍微改变它们来创建新样式。 注意,可能的组合的数量非常大(Πki)。

在下一步中,Stitch Fix偏离了一个规范的遗传算法:不是简单地选择基于适应性,然后释放随机重组和突变作为下一代风格,而是再有点更挑剔出究竟是什么理由使它能进入库存中。开发一个给定的属性集合可能适合目标客户的模型,然后使用这个模型来突出具有高的可能性的各种属性集。最后时装造型师一起审查和完善这个集合,并最终生产下一代风格。

以上就是Stitch Fix所做的创新和突破,这些成果脱离不了他们对一个数据平台的建设打磨。

数据平台

数据平台团队提供数据和计算基础设施以及一系列内部SaaS产品,允许垂直领域中的数据科学家工作,高效地进行分析,编写算法并将其投入生产。 该平台很好地封装了数据分布,并行化,自动扩展,故障转移等属性。这允许数据科学家主要集中在科学方面,但仍然享受可扩展系统的好处。 而且,数据平台工程师专注于构建平台。 也就是说,他们没有负担的业务逻辑和要求,他们没有上下文。 这是全栈数据科学家的工作, 其核心思想是“工程师不应该写ETL”,Stitch Fix的数据平台团队使数据科学家能够从概念到生产一整条路线上进行算法开发。

以上就是关于Stitch Fix主要的介绍了,你对哪部分技术感兴趣呢?请在文后留言,告知我们吧

原文发布于微信公众号 - IT派(transfer_3255716726)

原文发表时间:2018-06-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

实测华为Mate 20 Pro:配备麒麟980芯片后AI到底有多强

前不久,华为发布了新一代旗舰手机Mate 20系列。配备AI芯片麒麟980,双NPU,号称六项业界第一。

13430
来自专栏量子位

通过图灵测试!Google掌舵人说“打电话AI”是一次非凡突破

今天凌晨,Google I/O 2018大会最后一日,前不久刚刚获得年度图灵奖的Alphabet新任董事长John Hennessy登上舞台。

13130
来自专栏新智元

生成算法让机器人在真实世界中演化,全程无需人类介入(视频)

【新智元导读】挪威奥斯陆大学研究者让机器人使用“生成设计”算法和3D打印机,自我设计、发展和制造,全程无需人类输入。在生成设计中,具有创造力并且能够创造的机器设...

32960
来自专栏腾讯研究院的专栏

设计中的“信噪比”平衡

image.png 推荐语: “信噪比”(Signal-to-Noise Ratio)原本是用在声音和图像领域的概念。比如,音响设备播放声音时,机...

30280
来自专栏MixLab科技+设计实验室

幼师虐童,用人工智能灭了她!

这应该是第二篇,站在技术的角度,解决社会问题的文章。 第一篇,查阅:如何技术地识别双十一的“骗”局 这次围绕的是人工智能,我们探索下解决方案: 1 背景 幼儿...

32650
来自专栏新智元

谷歌验证系统玩儿隐身,用机器学习判断你是人还是机器

【新智元导读】 谷歌新的reCAPTCHA验证系统,没有挑战也没有复选框,通过结合“机器学习和针对最新威胁的先进风险分析”,就能无形中判断网站登录者是否人类。 ...

28280
来自专栏VRPinea

《谷歌地球VR》迎来全新更新,新增大量街景图像

43470
来自专栏黄成甲

怎样成为解决问题的高手(连载五)

在上一篇我们讲了构建框架——自下而上提炼框架的问题思考方法。通过使用自下而上提炼框架的四个步骤,你可以构造出一个结构完整、逻辑清晰的框架。但这种自下而上提炼框架...

27210
来自专栏PPV课数据科学社区

【推荐】从设计到数据——写给非数据人的数据入门

一. 一段经历,一点心得 ? 一直追我博客的人想必是清楚我之前做交互设计,然后去轮岗过行业运营,然后突然就开始做产品经理了。我也觉得奇怪的是,上次发了一个招聘启...

38570
来自专栏FreeBuf

机器学习来了,安全行业准备好了吗?

信息安全一直以来都是一个“猫捉老鼠”的游戏。好人建起防御的围墙,坏人想方设法通过或者绕过它。然而最近我们发现坏人似乎越来越容易绕过我们建立的高墙。想要阻止他们就...

222100

扫码关注云+社区

领取腾讯云代金券