Google 人工智慧(AI)技术再进化,该公司宣布能让机器人说话语调不再生硬,听来和人类难辨真假。
PhoneArena、Quartz、每日邮报报导,Google部宣称,开发出第二代文字转语音系统「Tacotron 2」,能让机器说话声音没有怪异、不自然之处,听来几乎和人类一模一样。机器会依据语意学决定正确发音,文章略有拼写错误也能顺利读出,而且就连绕口令都难不倒。
Google 人员表示,外界认为Tacotron 2 表现类似专业人员。民众给Tacotron 2 的平均意见分数(Mean Opinion Score)是4.53 分,只略低于专业人员录制声音的4.58 分。
Tacotron 2包括两个深度类神经网路,第一个网路会把文字转成声谱图,用图像表达音频,接着把声谱图输入WaveNet系统中,机器会照图发出相应声音。
不过Google 表示,Tacotron 2 仍有许多地方需要改进,包括无法读出部分难字,无法即时合成音频;机器声音没有情绪,不能传达快乐或悲伤的感觉。
尽管如此,此一技术仍大有可为,目前Google 虚拟语音助理已用WaveNet 技术发声,若能进一步采用Tacotron 2,可让Google 助理如虎添翼。
领取专属 10元无门槛券
私享最新 技术干货