【编者按】本文编译自”Data rights are the new IP rights”,作者为Mark Gorenberg和Ivy Nguyen两人。
Mark Gorenberg是Zetta Venture Partners的董事总经理。他拥有26年的风险投资经验,资助并在众多初创公司的董事会任职。在创业之前,他曾担任过Sun Microsystems的第一个SparcStation团队的软件执行官。
Ivy Nguyen是Zetta Venture Partners的投资者。 她曾在NewGen Capital担任高级助理,并在Imagine H2O管理启动加速程序。
以下为正文:
现在,很多开发者将其开发的代码、算法等资源公开,导致科技领域很多算法服务类的仿制品可以在数小时之内做出来。软件专利为这方面的原创产品提供了一定的保护,但是雷同产品之争仍然很激烈。
不过,值得注意的是,没有数据的软件本质上就是商品。
随着人工智能的发展,AI和数据的支持显得越来越重要。但如果没有数据,AI也没有太大作用,如每一款AI类的产品都先需要数据来训练出算法的最基本性能(MAP),然后再向潜在客户展示算法的性能表现,这样新客户带来更多数据,用于提高算法性能,吸引更多新客户等。
这种反馈循环的每一次迭代都会造成更多的竞争,因为继续获取可用数据对于保持此反馈循环的发展至关重要。因此,我们应当认识到,数据权限已经成为新的知识产权。同时,这为新兴创业公司带来了机遇和挑战。
此前,当很多用户毫不犹豫的将自己的数据存储在云盘等云平台上,却有多家公司因为数据存储和维护的成本之高,而选择放弃了管理用户数据的权利。许多类似的协议在今天仍然存在,因此造成了许多企业获取的数据并不全面,从而阻碍他们将人工智能应用于其云产品的尝试。
现在,我们步入了人工智能时代,更多的用户让第三方管理他们的数据,以确保其可以将更多的精力放在他们的领域。
人工智能的具体应用过程需要公司不间断的获取数据,然后对数据进行清理、设置标签、查询和分析,以实现预测功能等。因而如今很多创业公司在已有的数据基础上尝试获取更多的数据权限和资源。
并且许多将数据存储到云供应商的企业认为初创公司构不成威胁,会共享其深入的数据访问权限,因此相对而言,初创类公司拥有更多的自由和选择。
对于AI类初创企业,在最初与客户谈判数据权限方面问题时应当抢占先机,抛出反馈循环带来的数据需求问题,利用其价值来要求尽可能多的数据权限。
在许多产品应用中,初创公司最初可以通过寻找优质的数据源来训练学习算法,以此让算法从一开始就进入一种良性循环。以下是一些可以尝试的方法:
1.针对中小企业和中端市场的客户,因为他们往往对数据权限持开放态度,可以低价的优质产品来交换数据,此外,将这些小客户的数据拿来训练所花费的代价,可以作为后期谈判大客户的参考。
2.雇用专人来负责对算法的训练事宜。
3.找外部来源的数据,如来自政府机构的公开数据集,或从Clearbit等第三方供应商处购买数据,还可以看看相关网站和社交媒体。
4.提供旗舰产品的免费增值版本,以捕获用户参与度数据。
5.以成本价出售优质的产品,以此获得数据。如特斯拉,他采用的策略就是为了建立一个庞大的数据集来训练自动驾驶汽车。
事实证明,这些外部数据源中的数据,很多都可以将学习算法训练到足够高的性能水平,来让初创公司向其客户展示算法的价值,以吸引更多的客户来使用。
但是,在人工智能的大背景下,创业公司拥有专有数据管道是必要的。因为这样,公司的算法产品就可以从客户网络中的汇集学习中获得复合效应,从而使新进入该领域的公司和新兴模拟者难以追赶。
虽然初创公司在获得更多数据权限方面比个人有优势,但想要达到目标并不容易。以下是一个典型案例:
一家初创公司具有令人难以置信的新型AI动力工作流程演示,与传统企业相比,这套系统可以节省企业数千个员工的工作时间。据该公司的演示,利用历史销售数据训练了该算法,该系统可以帮助公司预测新的销售潮流,并给出最佳的销售时间点的建议。
但这个华丽的演示最终还是让客户企业离开了,这笔交易就这样不了了之。因为当企业已经准备好购买并在全公司范围内推出解决方案的时候,交易的审查过程中,因为数据安全等问题,律师等人是不同意采用的。他们表示没有办法允许该初创公司访问他们的数据,以免数据落入竞争对手的手中。因此一旦没有相关数据来进行训练,该产品对企业用户来说就不那么有价值。
所以交易开始前,初创公司需明确表明,他们的兴趣在于从数据和数据流中学习(如用户参与度、交互数据、元数据、数据流量信息等),而不是聚合客户的数据,然后将其转售给第三方。开始阶段,数据权限的谈判是最困难的,但随着时间的推移,随着大家对此方面认知的加深,这一过程会变得更加容易些。
在云数据时代,公司通过发布新功能来进行竞争,这些功能很容易复制,因此,绝对的市场占有率更难实现。从一开始就进入数据积累的良性循环,这将为企业成为最后的赢家提供一个保障。为了实现这一点,初创公司的目标应该是获得数据的独家权利,积累客户数据,形成合作伙伴关系。
大家需要明白的是,在积累了大量数据之后,现任和新兴的竞争对手都无法通过其他方面来弥补这一方面的差距。数据使科技公司在历史上第一次有机会建立强大的保护,防止传统的老牌企业和新兴的模仿者超越自身,并且这样的保护能力也远远超出了传统的知识产权战略所能提供的保护。