海马轻帆如何以技术驱动内容创作,探索精准IP开发的工业化

为提高IP的孵化效率,自我定位为“技术+内容”型公司的海马轻帆利用机器学习对小说进行质量预测,在海量网络小说中筛选出文本质量更高、改编可能性更大的具有爆款属性的IP,让IP开发走上更精准、高效、经济、可靠的工业化道路。

作者|李浏

这是三声报道的第339家创业公司

作为影视行业链条的第一步,IP开发的重要性不言而喻。但面对海量的小说文本,制作方想找到一个好IP犹如大海捞针。而且在头部IP越来越贵的现实情况下,制作方还需要承担着购买头部IP后可能面临的无法改编或改编难度过大、无法通过审查等巨大风险。那么如何解决行业痛点,精准找出易于改编、具有爆点的优先级IP呢?

2017年成立的海马轻帆希望以技术算法为驱动,实现IP开发的工业化和编剧工业化,高效挖掘腰部IP的遗珠,提供更精准的解决方案,提高IP改编效率,为行业赋能。

海马轻帆对于叙事性文学文本内容有其自己定义的结构化数据标准。在对数百万本海量网络小说进行特征验证后,归纳推演出对叙事性文学作品进行早期文本质量评估的机器学习算法。在此算法基础上,进行全网的早期优质IP挖掘。

目前,海马轻帆已应用此技术从全网筛选出了三百多本优质小说,放在了去年九月份上线的在线阅读平台上进行付费阅读。

在计划中,海马轻帆还将开放一个前端平台,运用此系统为多家影视公司、制作方及平台发行公司提供IP分析评测报告和后续的影视作品改编开发方案,实现IP的工业化孵化。

2017年初,海马轻帆获得光源创投的天使投资800万元。

三声:海马轻帆想解决行业的什么痛点?

刘笑逸:目前市场的发展态势依旧是文学与影视的加速结合,尤其是与网络影视的结合,越来越多特征鲜明的文学作品需要无缝过渡到影视作品,融为一体的网络文学和影视文学价值也会变得最大。

我们解决行业痛点是如何精准找到IP。一个行业的现状是 IP越来越贵。因为这些大价钱的IP其实是前十年的互联网红利的结果,它积累了十年的流量,自然价格高涨,现在的内容公司购买起来会相当吃力。

其次,就算买下了这个IP,但很多都是无法进行影视改编的。我自己做编剧的时候就经常会遇到这样的案例:除了保留原IP里主要人物的名字外,其余基本都是编剧原创。制作方本来购买IP是为了缩短生产周期,结果花那么多的钱买了这个IP,还要找编剧重写,这样的IP就没有价值。可以说影视公司和平台吃够了这样的苦头。

海马轻帆产品报告

三声:海马轻帆怎样有效帮助影视公司和平台解决这个问题?

刘笑逸:我们是一家“内容+科技”的公司,强调以科技作为驱动力,利用机器学习对小说进行质量评估。我们首先会利用该套算法模型对全网搜索作品进行评估,根据模型的测评得分判断每部作品是否是一个合格的线上作品。

我们将筛选的这个流程交给算法来做的话,有更高的效率和命中率。另外,相对于人工筛选,机器是没有主观情绪的,一切都是根据爆款模板推算出的数据进行筛选,因此也更加客观,偏差概率减少到最小,出爆款的几率就更高。

所以,通过这个技术,我们可以迅速地在全网范围内抓到好的内容,保证了优质IP持续产出性,相当于降低了开发剧本的人工成本以及时间成本开支。

海马签约小说《一世专宠:冻龄男友已上线》、《重生王妃好难追》等一批精品多是以AI为基础筛选、签约以及创作,最终成品的理想状态是以“文学驱动影视”,同时“生态赋能文学”。结合AI的挖掘和分析,并通过与市场需求变化相印证。

三声:这套模型怎样被研发出来的?

刘笑逸:这和我之前跨界的工作经历有很大关系。我本科是中国戏曲学院文学学士,后来又读了北京电影学院的研究生,师从于知名编剧、导演薛晓路老师。由于我一直在编剧行业里,对行业非常了解。2017年湖南卫视《不一样的男子2》,中央八套播的张纪中版的《侠客行》也是我写的。我还在创新工场和百度分别有一年和三年的产品运营工作经验,所以我一直想要做一个以技术为驱动力加上内容为核心的公司。

在这个基础上,我们确定做IP开发的工业化这个切入口之后,遇到的一个很大的技术难题就是确定文本判断的那几个变量。到底什么特征可以抽象出来评判一个文本的质量呢?

我、产品及技术的负责人、文学总监关起来讨论了一个月,试过想过情节、人物、主题等变量,最后确定推动故事发展的核心关键就是事件的冲突,因为你把其他的元素剥离了,(小说)还可以(发展),冲突是实质上在推动小说进展的。伴随冲突情节的出场,一定涉及到文本情绪总量的变化,而技术原理中刚好可以计算文本情绪,因而就对冲突情节完成了结构化数据定义。

我们用《盗墓笔记》做了个试验,绘制剧情曲线,并通过验证高度还原剧情发展。于是就跑了数百万本(大概量级是220万本左右)网络小说,有大量的这个数据来做机器学习算法,并继续完善更多的维度特诊,用于初步的作品筛选。

海马轻帆产品报告

三声:大众会不会比较难理解算法是可以判定一个内容的好坏这种思路,导致您教育市场的难度比较大?

刘笑逸:对。可能很多从事互联网行业的人比较能理解,但是传统影视公司的人会有疑问。因为他会觉得编剧这个行业依靠更多的是经验。

你说经验是不是我们做出这个产品的必要元素的呢?肯定是。这个事情光靠技术不行,再厉害的技术在12到16个月内都会被追上。但我们正因为具有很多年的编剧经验,很了解一个剧本的核心要素和特征到底是什么,才能知道你应该抽什么样的特征出来,这是最核心的东西,所以这是一个天然的跨界结合改变行业固态的技术创新。

所有的创作都是有规律的,例如创作剧本肯定会有规则。你可以看出情节的节奏,剧情拖沓程度。一个现实的案例是,在影视工业化程度较高的国外,他们都遵循这些创作的规律,因此作品就算再烂,也是有底线,有逻辑可循的,但国内就会有特别多叙事逻辑都不成立的作品,令人堪忧。

当然随着算法技术不断的快速迭代跟演进,我相信在很快的时间内,我们的产品可以实现90%全自动化数据算法模式来替代人工筛选与重构,可以最有效地减少人工成本以及时间成本,这将是一个改变整个行业的变革性的创新企业,也符合我们“精准,高效,专业创作”的愿景核心。

三声:怎么保证算法挑出来好作品的准确率?

刘笑逸:我们的资深编辑团队和算法一直在不停地磨合,修正这个数据模型。从去年2月绘制剧情曲线切入后,我们逐步实现了角色识别、剧情绘制、角色命运走势识别、甚至是关键性剧情搜索等更多的算法。

更新到今年1月份的时候,我们已经研究出了人物关系网络算法,可以计算人物命运走势以及情感对象输出,绘制复杂人物关系网。

我们做了一个测试,在付费榜上找了213本书,又抓了903本4个月以上没有被签约的书,一共一千本左右的书扔给算法自己选。我们默认的是被签约的书在质量上是更被肯定的。然后算法挑出来了132书,其中114本是榜单中的作品。所以它的命中率非常高,可以达到90%。我们现在也跟许多家头部影视公司及视频平台达成合作,他们就是通过我们这套算法在一周内快速挖掘出好IP并快速决策购买。

©三声原创内容 转载请联系授权

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180308B1R0B000?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券