“公式相声”来了,人工智能说相声还会远吗?

前不久在一档相声相关的综艺节目上,一对自称来自上海交大的博士配偶推出了自己的新创意:公式相声。听说,经过自创的相声公式,他们可以核算观众的笑点,乃至笑声能继续多久都能尽在把握之中,然后可以写出笑果更佳的段子。

成果他们硬生生把自己给整成了段子。

这也从另一个视点标明,尽管相声也考究移风易俗,但作为言语艺术的一种,想要对其进行数理化改造,恐怕难度极高。博士配偶的过错在于,其太顽固而自我地企图将影响相声自身的全部要素都数据化。但无论是相声内容仍是观众反响,数据化自身就是很难的;更何况他给出的公式朴实出于自己的臆想。

尽管“公式相声”在现在看来是失利的测验,但也并不意味着相声就真的就不能换换方式了。比方风头正盛的人工智能:假如让人工智能来段相声,作用会不会要比博士配偶好得多?

其实让人工智能说相声也并不是多么别致的主意,它现已有过相似的舞台经历,而且作用还挺好。但据笔者猜想,那只机器人的全部台词应该是提早设定好的,与其说它是在“说相声”,倒不如说是披个人工智能的外衣播映台词。

那么有人就说了:就是艺人说相声不也是背的台词吗?这话不错,但除了背台词之外,相声艺人还必须要有灵敏的现场反响才能,同一个段子不同的人说出来作用就不相同,相同的现场不同的人互动也不相同。

那么,咱们今日就来看看,人工智能学相声到底有哪些可能。

背一段话简略,想说好听难

先从“说”说起。

“说”的内容有许多,包含说、批、念、讲等。比方说个绕口令,或许说个贯口。要说相声字都咬不清楚,观众就什么也甭听了;说个贯口的时分卡壳了,那观众得闹退票,自己也下不来台。

咱们就从贯口的视点来说说“说”。

说贯口的第一步,就是得会背。相声艺人背是基本功,上台扮演的时分一口气把报菜名给说完,功底就显出来了。尽管许多贯口是老段子,但对观众而言百听百新,而且还过瘾。

人要背个百十个乃至上千个段子,那可真是要了命了。人工智能表明:哈?这能可贵倒我?找个U盘,把古往今来全部的“说”的内容全给我装进去,你要什么,我张嘴就来。

要这么简略,估量机器人早就打遍天下无敌手了。由于贯口还有第二个要求:心情。

贯口一般说得很快,比方报菜名,要的就是个吐字明晰、连接,速度再快点儿,带给观众一种淋漓尽致之感。但并不是全部的贯口只需快就够了。八扇屏有故事、有情节、有爱情,尽管内容简略,但你要像倒豆子相同给说完了,作用反而欠好;将自己的特色融入其间,也是贯口常演常新的诀窍地点。相同的贯口,北京二赵名扬四方,就是这个道理。

这对人工智能来说就不那么简略了。这触及人工智能的声响组成技能在协助其脱节典型机器音的前提下,能否带有必定的艺术神韵,比方二赵的京剧腔;一同,如何故速度控制心情,体现出机器人对贯口内容的个性化了解,也是其基本功打造的难点。

假如在“说”上人工智能仍然是典型呆板的机器音,把生动的贯口给硬生生说得毫无生趣,那人工智能进入相声界的第一步还没迈出去,估量就夭亡了。

从学习方言开端

人工智能面对的第二个根底问题,就是“学”。

学什么?说相声的什么都得能学,街头巷尾小贩挑着担子呼喊、贩子之中男女老少的音容笑貌、各种专业人士扮演的戏剧歌曲等,简略来说就是得口技了得。这其间有一项重要的内容就是学方言。

在相声里,仿照方言被称为“倒口”或许“怯口”,哪儿的话都能说。从一开端仿照北方话,到后来扩展到南边的吴语和粤语,乃至还仿照说英语、到后来开端仿照外国人说普通话。

那么,人工智能在学方言这块能有什么神通?

语音辨认是人工智能言语学习的一个重要分支,而且现已在实际场景中完成了广泛的使用。手机智能语音帮手、智能音箱、语音翻译机等,都离不开语音辨认。可以说,语音辨认技能将带来一种全新的人机沟通方式,对解放人的双手具有重要意义。

现在的语音辨认对各国“官话”的辨认仍是十分到位的。比方现在随意一个语音帮手,可以轻松辨认出讲的普通话内容。但人工智能学习方言的使命明显要深重得多。国内做语音辨认输入的公司在这方面提出了一些处理方案,比方在原有普通话库的根底上,对方言进行音标标示,然后辅以方言词典。这其间的要点使命,就是要有满足的方言词库或许语句来作比照标示,在许多数据堆集的状况下才可能完成对每个字词的精准辨认。

简略说的话,已然普通话可以辨认,那么只需有满足的词库、满足的时刻时刻进行练习,人工智能的方言学习也不会是什么大问题。

那么至少在学方言这块儿,人工智能敷衍起来仍是没有太大的问题的。在自身特有特点的加持下,人工智能在台上说方言想必也是一件十分风趣的工作。

但方言仅仅是一方面。有的人把“唱”也列为“学”的一部分,比方唱京剧、梆子、评戏或许流行歌曲等,或许也就是触及语音组成的问题。本文就不再独自把“唱”单列。但除了发音、动作之外,咱们上文说到“音容笑貌”,这个“貌”可怎样学?

要处理这个问题,或许只能从人工皮肤的视点下手。辅以各种传感器,在做指定表情的时分调集脸部指定的肌肉。现在有触觉的人工皮肤现已被开始研制出来,日后机器人能做出像人相同的表情或许并不悠远。

当然有人可能会说:搞那么杂乱干嘛?装个屏幕不就行了?

我只想说:你高兴就好。

段子要讲好,现场气氛也要搞起来

假如说“说”和“学”还仅仅个皮裘罢了的话,“逗”恐怕将是人工智能在学相声的过程中遇到的最大应战。

“逗”就是抖一些包袱给观众,说白了就是讲段子。咱们日常所见的,大多为对口相声,一个逗哏,一个捧哏。在这一逗一捧之中,把段子给有条有理地撂出来,可以说既逗了捧哏者,又逗了观众。

如咱们上文所说,许多相声就是在老段子的根底上讲出新作用,所以许多扮演都是依照既定的台词和流程进行的。但只会背台词的艺人终究也混不出来个一二三,要想把“逗”给学透了,就必须要具有极强的现场反响才能,俗称现挂。

其实细心想想,咱们为什么会常常以为人工智能是智障?很大的原因在于跟它沟通的时分实在太令人心烦了。答非所问的状况举目皆是,再就是撒娇卖萌,其实很可贵到自己真实想要的对话成果。那么关于相声这一对言语表达要求极高的艺术方式来说,这天然是需求直面的致命伤。

要处理人工智能在相声扮演的临场反响问题,背面天然离不开天然言语处理技能的进步。比方要能了解特定场景下观众喊话蕴藏的意思。岳云鹏的扮演现场曾呈现过各种设备意外,或许被观众“骂”,这个时分观众会一同喊“退票”。当然这就是我们图个乐。但对机器人来说,就不能仅仅从“退票”的字面来了解了,它要能结合现场气氛、观众表情来读懂“退票”背面的真实意义,而且给出诙谐、奇妙而不失为难的回应。

简略来说就是,在扮演节目的过程中,人工智能要能做到不拘泥于剧本,构成天然、流通而又不至于打乱既定的扮演剧本的才能。也就是说,人工智能不只得会背段子,还得能开打趣。要不然你逗谁呢?

当然,要想说好相声,人工智能需求学习的还有许多。现在人工智能也只能靠得上其每一个方面的一个分支罢了。背几个段子不在话下,学几个方言也不是问题,乃至全部需求学的东西都可以直接以数据的方式存储在人工智能的大脑里。但这些东西说白了都是死的,要想扮扮演有生命感的相声,关键在于艺人怎样把它们给盘活了。

或许,这才是人工智能成为相声扮演艺术家的关键地点。当人工智能连相声都能说了,也就意味着人类在天然言语处理方面获得了高度成功。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180901A0WPSQ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券