当AI学会了咪蒙的文风之后……

不小心训练了一个AI学习了咪蒙的文章风格,获取了她的世界观,本文演示下此AI的能力。

1

预测

可以预测2个内容。一个是基于咪蒙以往对各种事物/人的描述,提炼出其对事对人的态度/看法,用于预测。

另一个应用是针对全网热门事件(通过爬虫监测提取),取一个有咪蒙风格的标题。

1.1 针对人/事,咪蒙是如何看待的?

这里针对:

离婚、男朋友、女朋友、开学、滴滴、延禧攻略

从数据上,挖掘下咪蒙是如何看待这些人或事的。

说明:

后面的数字是每个答案的准确率,准确越高,结果越可信;

基于公众号文章的历史数据的预测,并非本文作者的主观看法。

咪蒙觉得 离婚 :
1 好 0.6432416439056396
2 重要 0.5582666993141174
3 穷 0.532257080078125
4 成功 0.47986114025115967
5 胖 0.4722142815589905

这里让AI稍微多透露一些内容:

咪蒙觉得 离婚 对下面的人/事影响最大:
1 父母 0.6931270956993103
2 孩子 0.6799288392066956
3 爱情 0.6668329238891602

继续其他预测:

咪蒙觉得 男朋友 :
1 好 0.9179385900497437
2 有趣 0.7728292346000671
3 小 0.7394572496414185
4 成功 0.7342433929443359
5 重要 0.7158277034759521
咪蒙觉得 女朋友 :
1 好 0.5734760165214539
2 有趣 0.5382117033004761
3 最大 0.4727887511253357
4 成功 0.44332340359687805
5 贫穷 0.44006460905075073
咪蒙觉得 开学 :
1 最苦 0.3340543508529663
2 均匀 0.3158642053604126
3 显赫 0.31271547079086304
4 轻松 0.31070709228515625
5 和谐 0.29741978645324707
咪蒙觉得 滴滴 :
1 好用 0.4044570326805115
2 强韧 0.37111154198646545
3 不愧 0.3322722911834717
4 拗神馁 0.3318832516670227
5 意外 0.3258388042449951
咪蒙觉得 延禧攻略 :
1 愚蠢 0.42433181405067444
2 很嫩 0.3688957393169403
3 很重 0.35487544536590576
4 具体 0.34537771344184875
5 赤贫 0.3256300091743469

1.2 如何为热点事件,取一个有咪蒙风格的标题?

针对最近几天的全网热点事件:

军训后走路都不自然了

mh370写给2014的一封信

晒被大军五点起床占位

微信交学费摇一摇免单

不想上幼儿园用袋子背去

一生都离不开的调味料

个人税后月薪一万在上海是什么样的体验?

员工是否要对公司忠诚?

自如甲醛房数据

预测咪蒙会如何取文章的标题。

说明:

后面的数字是每个答案的准确率,准确越高,结果越可信

基于公众号文章的历史数据的预测,并非本文作者的主观看法。

咪蒙对热点《 军训后走路都不自然了 》,会这么取标题:
1 挨了两刀后 我妈都不认识我了
0.9960410125402304
2 一年一度的虐狗节 我却笑了一整夜 
0.994565437928774
3 你减肥失败的9条原因 被我找到了  
0.9941999835387336
4 男朋友睡着了 我发现惊天秘密  
0.9903317725409249
5 深夜 男友收到了兄弟的暧昧消息  
0.9873264754027148
咪蒙对热点《 mh370写给2014的一封信 》,会这么取标题:
1 选择属于你的好时光  
0.9880194391798749
2 我受过最大的伤 就是看见你的自拍  
0.9870251718257081
3 多希望当初的你 能遇到现在的我 
0.9864768062876318
4 100万对你不算什么 够我一天生活费了  
0.9864741666916997
5 因为我高考失败 我的下属才是清华的  
0.9862017510367604
6 你减肥失败的9条原因 被我找到了  
0.9860994891322602
7 深夜 男友收到了兄弟的暧昧消息  
0.980533180615231
咪蒙对热点《 晒被大军五点起床占位 》,会这么取标题:
1 女人到底想要什么样的惊喜  
0.925551525228115
2 人是被自己的学习和经历所塑造的  
0.9221484994625054
3  没有人告诉过我 被摸胸就要报警  
0.9212221807729991
4 什么时候最自卑 身边人被夸的时候  
0.9209637281842609
咪蒙对热点《 微信交学费摇一摇免单 》,会这么取标题:
1 为什么微信只能点赞 不能点呸  
0.3683953390826499
2 愣着干吗 玩啊  
0.31701523463969544
3 新型父母 热爱工作 佛系养娃  
0.3085720502552626
4 颜值这种事 和体重毫 无 关 系  
0.30741803751788505
5 人生最紧张的时刻 对方正在输入  
0.30529733299885387
6 男女之间有纯友谊 笑skr人  
0.29669763892851436
咪蒙对热点《 不想上幼儿园用袋子背去 》,会这么取标题:
1 如果可以 我希望那天没让儿子去上幼儿园  
0.9496883811698567
2 有一种好看 叫前任看了想复合
0.9412041099447421
3 毕业那天 我老板 做了这种事...... 
0.9391465899523104
咪蒙对热点《 一生都离不开的调味料 》,会这么取标题:
1 我的一生 是被父母嫌弃的一生 
0.9931509518871393
2 不在乎的才谦让 喜欢的都去抢  
0.9930373915537687
3 你的每次逃避 都要双倍偿还 
0.9917651679020135
4 去年的衣服配不上我了 去年的老公也是 
0.9916948849512304
咪蒙对热点《 个人税后月薪一万在上海是什么样的体验? 》,会这么取标题:
1 一个地方就能看清 你是在生活 还是在凑合 
0.9921539472114738
2 我听过的最大谎言是 你还年轻 
0.9913330316026332
咪蒙对热点《 员工是否要对公司忠诚? 》,会这么取标题:
1 我无数次想删掉那段傻逼回忆 
0.9707440035338921
2 我对所有人都很好 唯独想对你使坏
0.9706181356680429
3 我不仅脸皮厚 我还不知道天高地厚
0.9689343925191874
咪蒙对热点《 自如甲醛房数据 》,会这么取标题:
1 我暴瘦30斤的秘籍 今日大公开海量照片 慎入
0.3413323852521377
2 我们欺骗自己的时候 不择手段
0.281670669272558
3 这三个字 胜过自由 胜过生命 胜过甜言蜜语...... 
0.24869003831935418
4 这个刺激的问题 你敢问男友吗
0.24810450875665513
5 太刺激了 你租过房 那你租过床吗
0.2475747827252351

2

技术原理

本文的AI是如何训练的?先了解下核心的技术原理:

点击下图get知识卡片

技能要求:机器学习、python、分词

3

AI训练目标:

符合全网用户阅读喜好

提取咪蒙文风中所使用的形容性的短句

为了达成这个目标,对评论数高的文章提高其权重

4

AI训练步骤:

4.1 数据收集

爬取868篇公众号文章,包括标题+简介+正文。

4.2 数据处理与提取

从数据中根据词性、常用的短句、常用的形容词等,提取出属于咪蒙文风的词典。

4.3 词向量的训练

利用word2vec进行词向量的训练,并对评论数高的文章提高权重

以上为全文,再次强调,本文是AI基于大数据预测出来的结果,仅供参考。

原文发布于微信公众号 - 无界社区mixlab(Design-AI-Lab)

原文发表时间:2018-09-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

今年最好的数据可视化作品,看了就赚了!

今年,评委们重新设计了作品分类方式——根据作品的表现主题进行分类,大体上分为艺术、时政、环境、人文、科学、体育等。下面,让我们一同目睹这些美轮美奂的数据可视化作...

1702
来自专栏BestSDK

做了六百万字歌词分析,告诉你为何“freestyle”火遍全网

HipHop到底在唱些什么? 各个国家和地区的 Rapper 们想要说的聊的唱的都有哪些特色? 如果想当一个Rapper,我应该怎样写词才能紧跟潮流又不会离题太...

4535
来自专栏新智元

机器人也有触感了!斯坦福大学开发人工感觉神经系统让蟑螂抽搐

1353
来自专栏AI科技大本营的专栏

全网首发 | 你以为你是高高在上的人类?别傻了,你的脑子已经被机器侵蚀很久了…(Neuralink系列编译之三)

这两天,我们以全网最快的速度、最完整的编译,为读者带来了科技人气王Tim Urban的长篇文章《Neuralink》前两章。 其中,第一篇作为开胃汤,从历史的...

34812
来自专栏ATYUN订阅号

谁是下一个库里?搭载AI技术的APP助你炼成神射手

想要像斯蒂芬·库里(Stephen Curry)或凯文·杜兰特(Kevin Durant)一样投篮得分?AI可以提供帮助。HomeCourt是一款篮球训练应用程...

1424
来自专栏镁客网

这款APP可取代超声测量法,两分钟即可诊断心脏健康 | 黑科技

1910
来自专栏Python专栏

IG夺冠那晚,全世界都在祝贺,你呢?

我已经很久没玩游戏了,了解我的读者也知道,玩游戏的时候也只玩DOTA和FS,所以那个时候脑子转不过弯来,「LOL是什么?那么菜的游戏,跟小学生玩有什么意思?一点...

1172
来自专栏大数据文摘

可视化经典:10幅精妙绝伦的科学视图

1192
来自专栏数据的力量

用工程师的思维加上 3D 建模,熬出一碗浓浓的鸡汤

1673
来自专栏架构说

程序员练级攻略(2018):技术资源集散地

其实还有很多不错的博客,不过,现在国外不错的博客都在一个叫 Medium 的网站,我也发现我 Google 很多东西时都会到这个网站上。这个网站上的内容不只有技...

1.1K2

扫码关注云+社区

领取腾讯云代金券