学习
实践
活动
专区
工具
TVP
写文章

如何在网络文学IP中找到AI落脚点?(下)

上篇文章中,我们介绍了网络文学IP在市场中的商业价值以及人工审核IP的现状。针对当下产业中的瓶颈,语忆科技将尝试通过自主研发的自然语言处理技术对网络文学IP进行智能解析,试图在未来,基于人工智能为文学IP的挑选及审阅提供更高效的解决方案。

本篇中,我们将以周德东先生的作品《罗布泊之咒》为例,主要依靠语忆科技文本情绪解析专利算法对《罗布泊之咒》进行多角度分析,抛砖引玉,试图为文学IP的智能解析开辟一条蹊径。《罗布泊之咒》全书超105 万字,以下所有的分析图表为语忆分析平台自动生成,无人工成分参与,展示方式上也由计算机算法直接完成。与传统的人工阅读、审核的工作方法相比,我们相信利用这种创新的可视化方法,将会为审阅人员带来更直接的视觉冲击。

文本情绪解析算法

首先,我们先简单的介绍一下语忆科技的核心文本情绪解析专利算法:

图一:语忆算法功能展示图

如图一,针对任意输入的中文文本,可从情感分布、情感得分以及情感浓度三个角度进行分析。情感分布是指文字中表达的具体情绪种类(正/负/中立各六种具体情绪)的概率;情感得分判断的是文字中表达情感的正负面倾向;情感浓度表达的则是文字的情绪反馈浓烈程度(例“我爱你”浓度高于“我喜欢你”)。

在了解功能的基础上,下面就是针对《罗布泊之咒》全书进行简单分析。

章节间情绪得分分析

以章节为单位,《罗布泊之咒》全文共 303 个章节,我们以 0-100分作为情感极值评分,50分以上为正面情感,反之为负面,分值越高,情感趋向越正面。将全书的303个章节按每个章节投放到文本分析器中,我们可以看到每章节情感极值的高低起伏可以想象到对应的文章内容节奏的变化。(这里我们将选取正面情绪最高的前30%的章节标注为高潮章节)

图二:各章节的情感极值变化图

取303章中情感得分最高的前10%的章节和情感得分最低的后10%的章节,得到54.17和48.49的阈值。针对最高值和最低值情感波峰与波谷分别出现在 105 章与 89 章,我们回溯到原文内容中发现,第 105 章《异类之恋》讲述季风与令狐山的人类与“类人”之间的故事,文中令狐山作为类人却向季风屡次说出诸如“如果他来害死别的人,我不会管,但是我不会让他害你”、“我希望你把我当成一个普通人类,去一个没人知道的地方,静悄悄地过日子”之类的话语,能感受到该章人物因周围事物的变故而情绪高涨;第 89 章《马然而的奇遇》讲述的是马然而重伤回到营地讲述其在沙漠中被类似僵尸的怪人袭击的内容,场面惊悚、血腥,且最后马然而重伤不治,伴随着恐怖怪诞的气氛是的人物的情感恐惧低落。

段落间主流情绪分析

语忆的情绪解析技术,除了可对文字内容进行正负面的判断外,还可针对文字内容的细节情绪出现概率进行分析。例如一句简单的“我爱你”,语忆的算法在给出 90分的情感极值的同时,还能给出喜爱、害羞与乐观三类细节情绪并存的分析结果。依靠该能力,我们分别从“正负面细节情绪”与“中立细节情绪”两个角度,对《罗布泊之咒》中的主流细节情绪进行了识别,结果如下图:

图三:18种细节情绪分布图

通过图三可以看到,在正负面细节情绪的 12 维分布中,“兴奋”与“焦虑”两类情绪的出现概率最高;在中立情绪的 6 维分布中,“紧张”与“胆怯”二者出现概率明显较高。

基于以上的分析结果,我们选取这四种较高概率的主流情绪作为基本维度,对全文303 个章节再次用这四种情感进行波动性描绘。(在这里我们对这四种高频细节情绪,选取情绪值最高的前10%的章节,标注为高潮章节)

图四:四大类主流情绪浓度在章节间波动图

并在生成结果的基础上,我们分别对情绪较高的“焦虑”和“紧张”章节进行文章回溯。在“焦虑”值最高的第54 章《诡异的电视在播放我们的一举一动》中,所有人都在盯着电视中的画面观察着这段时间奇怪现象的蛛丝马迹,不断出现的“雪花..”,以及反复出现的令人震惊的画面渲染了非常紧张的情绪;在 “紧张”值最高的第135 章《令狐山来还我刀子》中,主人公在深夜发现房里有具死尸,躲进卧室听死尸的动静却发现死尸在不断向其靠近。整个章节描述的十分恐怖,随着死尸的每一次靠近,主人公焦虑害怕的情绪逐渐放大,最后跳楼逃生。

图五:四类主流情绪出现概率最高的章节及其前后章节情绪极值得分图

通过细节情绪对章节内内容的分析,在文章审核的中可以用这种方法试图去挖掘网络文学作品更具特色的一面。然而这些细节情绪较高的章节,也可以被作为潜在的高潮章节。(从左至右:兴奋、焦虑、紧张、胆怯)

不仅如此,优秀小说作家在高潮章节的分布以及承上启下上也有着自己的安排和门道,故基于情感极值得分观察到高潮章节前后章节的情感分值,也能从一定角度上给到我们一些洞察。

章节内情绪变化

基于整章节内容的情绪分析外,我们选取303章中的第105章,算法将第105章的内容按句号切割成了 119 个单元,并根据每个单元的文字内容贴上了最大概率的细节情绪标签。通过该方法,我们成功地绘制出了第105章的情绪走势:

图六:第105章细节情绪分布图

该章绝大部分内容都是处于暖色描述的积极情绪,并在其中穿插了部分的负面情绪,如惊讶与焦虑情绪等。其中,在 40-60 章内,负面情绪出现得较为集中,回溯到原文内容是:令狐山向季风解释他们“类人”如何躲避人类耳目,在暗中个观察人类的描述,因此基调较为阴郁。

章内情绪变化的分析旨为IP审阅人员开拓章节评价思路,我们尝试通过这种量化文本的方式,为文学章节的智能评估抛砖引玉。

小说节奏分析

根据上面所标注的高潮章节,我们对 303 个章节的情节起伏进行了重构。纵轴为 1代表该章节为情节高潮章节,反之则为内容较为平淡的章节。根据高潮章节形成的疏密程度,我们能够很快识别出全书的情绪爆点集中在哪个部分。

图七:高潮章节节奏分析图

我们以连续 10 章以上“留白”为非高潮,根据我们分析其他类型网络小说的经验,超过 10 章的留白章节,对于网络小说这类内容更新速度快、读者脱离度高的文学类型,可能会给读者带来明显的阅读疲劳感。

“留白”章节的删选能在一定程度上帮助审阅人在时间有限的情形下,对候审章节建立优先度。同时,对于连载小说,审阅人或作者是否也能基于留白章节的判定,从而重新把握写作节奏。

主要人物情绪分析

除了可以针对所输入的文字内容进行分析外,对于文本内的部分碎片式信息也可以进行有针对性地判断。例如针对一句简单的文本“酒店整体不错,但是隔音效果不好”,其实这句话表达出了两种意思。语忆算法能在给出整体的情感得分的基础上,对于“酒店”/“隔音”这两个关键词分析出具体正面/负面的判断。

利用该功能,语忆关键词算法对《罗布泊之咒》中的各主人公名字在全文进行定向分析。分析出小说中最受欢迎的四位人物:周老大、令狐山、季风和章回,根据这四个人物名字关键词,系统生成了他们在 303 个章节间的情绪走势。

图八:周老大情绪走向

图八:令狐山情绪走向

图八:季风情绪走向

图八:章回情绪走向

通过分析上述图表,我们是否可得出以下结论:

贯穿全文主人公周老大的“戏份”,其情绪起伏非常频繁,整体走势呈鲜明的锯齿状;

令狐山、季风以及章回三位高人气人物在前 60 章的出场“戏份”较少,与之前的高低潮分析图进行比对后不难发现,随着几位高人气人物的稳定出场,小说也迎来了情绪爆点区域;

令狐山与季风作为小说中的一对恋人,其情绪反馈也呈现出明显的趋同性。在 97-136 章的区间内,二者的情绪反馈非常类似地稳定维持在 50 以上;

基于主要人物的情绪分析是否同样能让读者在阅读之前更明了地掌握小说主体脉络、人物情感走势,从而为文学IP审阅带来便利......这还需要行业中的人士和语忆一起进一步探索。

类似题材小说对比

在如今的网络文学环境下,优秀的小说基本都会满足一定的“套路”,所以在对新小说的 IP 潜力评估时我们可以将新的网文IP和已完成的优秀网文IP做细节对比。因此我们将悬疑探险类型的《罗布泊之咒》与名声显赫的《鬼吹灯》作为对比参照,比较二者在情绪表达以及起伏状态上是否存在类似之处,试来判断是否具有 IP 的潜力。

鉴于篇幅有限,我们在这里仅对两本小说的前30万字作为样本进行情绪解析。

图九:《罗布泊之咒》与《鬼吹灯》情感得分对比图

通过对比可见,两者在情绪走向上存在一定的类似程度,尤其是在 15-30万字的区间内,二者的情感得分均在50-55分区间内,且相对平稳。但《鬼吹灯》在前 30 章的情感得分跨度明显大于《罗布泊之咒》,因此我们可以理解为,在小说的起始阶段《鬼吹灯》给读者带来很大情绪起伏波动。

通过与已完成的优秀IP作品的对比,我们尝试着为IP审阅人提供更宽阔的视野,去发现真正蕴含潜在改编价值的新文学IP。

除了上述所说到的分析外,语忆的算法同时也可以根据网上读者的留言进行语义分析,利用关键词抓取能力从读者们的留言中提炼有价值的意见,及时向文章评论审阅人和作者进行反馈,使作品不断迎合读者兴趣。但是鉴于该部小说在公开运营的网络小说平台上的讨论度有限,我们并没有针对该功能进行效果展示。

简短的总结:

最为一个旁观者,网络文学IP市场是有待被挖掘的,网文IP可以从很多方面促进市场发展;

对于网络文学分析技术,语忆科技在自然语言处理技术方面有独立研发中文情绪解析引擎;

对于自然语言处理技术对网络小说的应用,可以说是用人工智能的角度帮助审核人员更多面的剖析文章;

除上述对文章分析的一些功能外,我们一直有待开发和尝试能在未来通过自然语言处理技术帮助到网文IP的审核;

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181211A193RZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券