动态丨情人节降至,百度推出基于 AI 的魅力值测评和诗歌自动生成主题功能

百度搜索在近日推出了基于人工智能技术的“情人节用脸撩,开启桃花运”功能,迎接情人节。

用户在百度搜索 App 中需用语音说一句“开启桃花运”即可进入主题页面。该页面包含两大核心功能,一个是“自拍撩汉/妹指数”,另一个则是输入姓名和地名自动生成专属诗歌。

自拍撩汉/妹指数原理

该功能本质上属于颜值打分,在市场上该类型的产品较为常见。虽然百度尚未对其进行详细介绍,但 AI 科技评论了解到常见的基于监督学习颜值算法大致原理如下:

首先选择一组人脸特征:如眼间距、肤色、眼睛、鼻子、嘴巴尺寸等等,随后建立人脸识别算法,给定一张人像可自动计算上述人脸特征。采集大量人脸样本,人肉标记每张脸的颜值得分,然后向量化用 SVM 等方法建立模型。

随后需将带有颜值得分的人脸样本随机分成 1、2 两组,用 1 组图片经过特征提取来训练机器学习算法,进行调参,使得算法输出的分值尽量接近人工打分的结果。并用 2 组图片进行验证,看看算法对不包含在 1 组中的图片是否能正确计算出结果。

训练结束后即可用来给人像打分。

诗歌生成原理

目前市场上不少 AI 文学创作产品自于预设的文本模板。百度则是将大量诗歌作品数据进行训练,通过主题规划模型弥补诗句与主题关联性偏移等问题。

那么何为主题规划模型?根据百度官方介绍,主题规划模型是在理解用户 query 意图的基础上,对每一句诗的子主题进行规划,从而实现了对整首诗主题的把控。例如,用户 query 为“西湖”,模型规划的子主题可能是“断桥”、“烟雨”、“江南”等等。

百度诗歌生成系统把写诗以模拟写对联的方式去进行文本输出,根据前一句诗生成下一句诗。这种用联诗方式生成的诗歌,容易发生词藻堆砌的情况。但利用主题规划模型,能在一定程度上避免这种情况。经过测试后发现,AI 生成的诗歌前后句的关联性表现确实不错。

上周,AI 科技评论在现场跟进百度副总裁王海峰 AAAI 的演讲时,他提到百度两步生成中国诗歌的方法:

首先对每一行诗的主题进行规划,然后进行具体诗句的生成。

举个例子,如果用户想要写一首和春天有关的诗,那么诗歌规划模型就会首先生成一个内容概要,包括春天,桃花,燕和柳这四个主题,然后由 RNN 模型根据这四个主题生成四句诗,来完成整首诗歌的创作。

在下面展示的这三首诗中,中间这首是由 AI 诗人完成的,而其他两首的作者都是中国古代诗人(白居易,刘因)。王海峰说到,多数人都无法分辨出这三首诗中到底哪一首出自 AI 诗人之手。历史学者和《中国诗词大会》嘉宾蒙曼教授也说到“这个人工智能诗人是诗坛小超人,能和人类诗人一样在诗中表达感情色彩。”

随着 AI 技术的门槛逐渐减低,可以预见未来越来越多的企业可以通过人工智能技术策划相关的主题活动供用户娱乐和互动。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-02-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

6月机器学习热文TOP10,精选自1400篇文章

731
来自专栏数据订阅

数据库和AI的一次火花

我们生活中很多数据是有时间维度的。比如说天气或者股票价格。对于这种带有时序的数据,有一种基于时间序列的预测模型---Prophet。

2.4K107
来自专栏AI科技评论

前沿 | IBM发明世界首个人造神经元,离人脑模拟更近一步

受人类大脑运行方式的启发,IBM苏黎世研究中心制成了世界上第一个人造纳米级的随机相变神经元。并在其基础上构建了由500个该神经元组成的阵列,让该阵列模拟人类大脑...

2818
来自专栏加米谷大数据

技术分享 | 数据可视化5种方法

数据可视化是指以饼状图等图形的方式展示数据,可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等...

2867
来自专栏大数据文摘

为什么说GANs是一个绝妙的艺术创作工具?

我是一个艺术家,同时也是一位开发者。艺术和软件在我的生活中曾经是两个平行的轨道,直到我发现了GANs(Generative Adversarial Networ...

972
来自专栏AI科技评论

资源 | AI Challenger 2018 即将进入决赛,八大数据集抢先看

AI 研习社消息,由创新工场、搜狗、美团点评、美图联合主办的 AI Challenger 2018 即将进入第二阶段比赛。今年的大赛主题是「用 AI 挑战真实...

1312
来自专栏网络

Arxiv网络科学论文摘要14篇

祝大家新年快乐! 意见动态中的交叉问题团结与真相收敛; 普查与第二定律:美国众议院最优分摊的熵权法; 基于主体的模型的特征; Power Plexus:基于网络...

1858
来自专栏人工智能头条

上海联通大数据与机器学习驱动的离网预测模型

1394
来自专栏新智元

论文造假被AI抓:机器学习检测出4000多论文造假,一年损失高达10亿美元

今年6月,斯坦福大学微生物学家分析了2009-2016年发表在分子与细胞生物学(MCB)上的960篇论文,发现其中59篇(6.1%)含有“不适当的”重复图像,约...

833
来自专栏机器之心

学界 | DeepMind论文三连发:如何在仿真环境中生成灵活行为

选自DeepMind 机器之心编译 参与:smith、黄小天、路雪 一只猴子在树林之间敏捷而灵活地跳跃穿梭,或者一名足球运动员快速带球过人、劲射得分,这些表现皆...

3226

扫码关注云+社区