机器之心原创
作者:藤子
毫无疑问,个人短信已经过时,但是,随着移动互联网的发展,企业短信却有增无减。小源科技,就抓住这个商机,用人工智能打造短信上的场景服务。
2017 年的锤子手机春季发布会让小源科技成为了网红,锤子科技产品总监朱萧木介绍手机的新增功能时,小源科技提供的「短信退订」第一个出场。
朱萧木介绍,系统会基于语义分析,对短信内容进行文本识别,如果检测出「回复 TD 即可退订」的垃圾短信,就会拦截短信发送方,将其「关进小黑屋」,并不会真的发送退订短信,这样的处理,既可以使垃圾短信发送方不再继续骚扰用户,还可以避免用户因为退订行为被识别成活跃用户,带来后续麻烦。
尽管这是小源科技首次登上锤子手机的发布会,但其创始人段雨洛告诉机器之能的记者,这并非与锤子手机第一次合作,在过往的合作中,双方沟通很密切,很多新功能都会放在锤子手机试用,也会和锤子科技共同探讨下一个版本的产品功能。
而基于语义分析和对短信内容的识别,小源科技能做的事情也不只是短信退订,这家来自珠海,创立于 2011 年的公司,正凭借旗下基于语义精准识别技术的 SDK 智能短信平台信析宝,与任何获取手机短信的应用结合,通过识别短信内容,使其通过不同场景为用户提供第三方服务,成为距离用户最近的服务分发入口。
如今,信析宝覆盖的场景包括酒店、餐饮、物流、航空、金融、通讯、电商等大量场景,客户包括三星、华为,锤子等几乎所有一二线安卓手机厂商。
只要手机号码存在,基于短信提供场景服务的业务模式就有价值
在微信的冲击下,短信似乎是上一个世纪的应用。为何小源科技却能抓住短信入口,使其成为几乎所有一二线手机厂商的标配呢?
段雨洛分析,随着移动互联网的快速发展,尽管个人短信式微,企业短信却有增无减。比如你在携程买飞机票,它会给你发短信;你在 App 上买电影票,它会给你发短信。即便有企业在微信公众平台搭建服务号,但企业与用户的互动依旧是通过短信。
「短信的本质是手机号码,除非在未来,大量企业和它的消费者沟通,不用手机号码标示用户,而是用微信号。」但段雨洛认为这一天,很长一段时间内不会到来,他举例,用户到银行开户,一定是留下手机号,而不是微信号。
在《即将到来的场景时代》一书中,作者认为,互联网争夺的是流量和入口,而移动互联网时代争夺的是场景,了解场景,就能占据未来。段雨洛推崇这本书,也赞同这个观点,他认为「只要手机号码存在,信析宝提供场景服务的业务模式就一定有价值。」
举例而言,通过 App 购买电影票,在收到的票务短信中,信析宝会提取关键信息,做成电影票的样式,上有电影名、剧场名、放映时间等。电影放映前 3 小时,会提醒用户观影时间,放映前 1 小时,会根据用户的用车习惯,推荐专车、滴滴或租车服务。
如果在网上预定机票,收到的航班信息则是机票样式,上有往返航班号、登机时间、航站楼之类的信息。除此之外,还有值机按钮,一键值机。
在段雨洛看来,这就是场景服务,因为「用户收到航班信息时,第一个动作肯定是值机。」实际上,多年前,段雨洛就认识到了这一点。
你的客户是企业,你要帮助企业服务他们的用户
2011 年,受《乔布斯传》感召,段雨洛离开从研究生毕业一呆就是十年的金山,在母校武汉大学为首次创业开发的产品——基于手机通讯录真实好友的职场社交产品——进行调研时,收到妻子网购商品的物流短信,段雨洛想查看包裹的实际情况,却怎么都选不中包裹号。
「这不是弱智吗?」段雨洛在心中暗骂,看到包裹号肯定是查询包裹,而不是做别的。就如收到航班短信,必然是值机。
此后,发现职场社交产品走不通的段雨洛决定改弦更张,从基于通讯录最高频的应用之一短信下手,他决定基于语义分析,对短信内容进行文本识别,再提供相应的服务。而他将语义解析短信分成两个阶段,第一阶段,读取个人短信,等技术成熟之后,再进入第二阶段,读取商业短信,提供更多的服务。
2012 年,小源科技推出一款名为多趣短信的 App,根据内容和情景,自动配备表情,让枯燥的短信更生动。很快,多趣就成为各大安卓平台的爆款。但是,作为 App,多趣的用户是 C 端,小源科技的目标客户却是企业。「你的客户是企业,你要帮助企业服务他们的用户。」段雨洛开始怀疑这个模式,尽管多趣已有大量用户基数,但多趣的用户与企业的用户能有多少重合度呢?
2014 年,小源科技推出信析宝第二款产品,与多趣的 App 形态不同,这是一款 SDK 产品,能嵌入任何获取手机短信的应用,提供场景式服务。而这正是小源科技今日业务模式的来源。在与 360 手机通讯录等大型 App 取得合作后,2014 年底,小源科技开始与手机厂商广泛合作。
100% 准确率的来源:提高算法 + 人工标注
然而,在三四年前,人工智能并不像今日这般火热,自然语言处理技术也不先进,在今日,语音识别、人脸识别取得了巨大进步,但因为自然语言的复杂,自然语言处理依然没有太大突破。
而在那时,基于语义分析最普遍的商业应用是帮助企业分析舆情,但语义很难判断,通常的做法是通过标注正面词汇与负面词汇进行分析,因而错误率很高。
信析宝在商业短信的基础上,提供场景服务,难以想象,如果给予用户错误的信息,对用户体验将会造成什么困扰,对企业客户又将造成什么影响。
「既然计算机无法识别大段文字中蕴含的信息,如果是一段话,或者十来个,数十个模板化文字呢?」段雨洛认为,语义分析的难度就会降低。因此,小源科技先写出语言的文本结构,比如搭建好主谓宾,再通过语言结构,把很多样本归为一类,处理这类样本即可。而规模的复杂度则会少 3-4 个数量级。
但是,段雨洛认为,再好的算法也只能提升 80%-90% 的准确率,小源科技要达到 99% 甚至 100% 的准确率,不能有任何误报。
既然不能有误报,那就将语义分析的算法放在服务器而非手机,进行样本的训练,并人工决策,从中选择正确的语言识别结果,将该语言模式生成 pattern,放进手机,手机不做语义分析,只是简单的模式匹配。
准确率 100%,代价却是巨大的人工标注量,因为每一个样本,都需要人工决策。如今,小源科技有三四十人的团队专做人工标注。
「人工标注是个脏活、累活,没有人愿意做脏活累活吧?那我们就去做。」段雨洛很自豪,在多年前,就敢于去做人工标注。「我们的核心竞争力不是技术,而是勤奋。」段雨洛一半玩笑,一半认真地说。
给客户提供的是产品和解决方案,而非技术
尽管小源科技是一家技术公司,但段雨洛认为给客户提供的是产品和解决方案,技术要蕴含在解决方案中。「人工智能不是业务,帮助客户解决问题,才是公司赖以生存的根本。」段雨洛说。
正因如此,小源科技在每家客户都派驻了团队,与客户共同进行产品的研发。而与企业的合作,段雨洛认为,一定要摆正心态,出了 Bug,要真诚地想着如何解决。因为,厂商花费巨资研制手机,一部手机才卖数千元,OS 中嵌入新应用,他们会非常谨慎。
小源科技的首家手机客户是三星,此前,谷歌凭借 Google Now 占据了海外的大额市场,在中国却无法开展业务,三星总部希望在中国填上这个坑,三星中国借此取得了产品开发权。从与三星建立合作,到如今,小源科技对三星科技的合作已经非常深入,新产品的规划,直接上报韩国,批准之后,快速执行。
与三星的合作很顺利,与华为的合作则让段雨洛近乎「崩溃」。将短信做成卡夹样式,首先要进行文本识别,其次要将文字做成界面,计算量很大。
但是,对供应商要求严格的华为对小源科技同样提出了严苛的要求:添加这个功能后,手机的 CPU 指标和内存占用都不能上升,滚动还要非常流畅。比如,企业发送了 1000 条短信,做成 1000 个卡夹之后,用高速相机拍,每秒钟要有 60 帧,1 桢都不能差。
当时的段雨洛认为,要达到这样的标准,简直是天方夜谭。但最终在华为的帮助下,解决一个关键性问题之后,三个指标都已达成。
有了三星和华为的客户经验,小源科技打开市场容易了很多。
段雨洛将厂商比喻成大船,「实际上他是拿一艘大船换你这一辆小汽车。」因为供应商做得再好,对手机厂商而言,也是锦上添花,厂商的核心还是自己这艘大船。「创业者不能认为自己很了不起,而是要有多方共赢的格局,」段雨洛说,「如果你做的事情,能使产业上下游都能获益,那你就能做成。」
本文为机器之心原创,转载请联系本公众号获得授权。