专栏首页量子位用机器学习来概括《哈利波特》,视频也可以有“太长不看版”

用机器学习来概括《哈利波特》,视频也可以有“太长不看版”

毒栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI

文章太长读不下去的时候,就想有个TL;DR按钮,用最短的时间,看最关键的部分。

要是视频很长不想看,该怎么挑重点食用?

一位叫做Sagi Shaier的程序猿,用机器学习给《哈利·波特》电影片段,做了一份太长不看的概括版

(至于是哪个片段,读下去就会知道。)

他的AI还用四句话,总结了一段11分钟的有声故事。

并且,程序猿已经把算法放上了GitHub。

那么,一起来观察一下,那些没时间看但又必须看的长视频,要怎样用AI概括出要点:

语音转文本:多种工具选择

首先,做好准备工作,就是把音频转换成文本

语音转文本的工具有很多。

该选什么工具?

程序猿先用了Pocketsphinx,免费且易用,只是准确度感人。

然后,少年又想试试谷歌云的语音转文本服务。这应该是最好的工具之一,不过少年因为不想填信用卡,就放弃了。

谷歌云

最终,他选择了免费且准确率高的IBM沃森语音转文本,注册流程也简单。

沃森

在Python里面用沃森

一开始你可能会感觉有点复杂,熟悉了就简单了。

只要用这一段代码:

1IBM_USERNAME = “apikey”
2IBM_PASSWORD = ‘Pass’ #Put your API key here
3stt = SpeechToTextV1(username=IBM_USERNAME, password=IBM_PASSWORD)
4audio_file = open(“new_story.wav”, “rb”) #audio file's name
5with open(‘new_story.json’, ‘w’) as fp: 
6 result = stt.recognize(audio_file, content_type=”audio/wav”,
7 continuous=True, timestamps=False,
8 max_alternatives=1).get_result()
9 json.dump(result, fp, indent=2)

把你IBM网站的密码填进去。

把要转换的音频文件名填进去。

(可以给.json文件起个名字,也可以用默认的new_story。)

然后,音频就转换成文本啦:

哈利波特的一个段落

当然,语音识别还是有一些错误,后面会讲到怎样处理。

AI是怎么概括的?

有了文本,要让AI来读一读。先写这段代码,让文本变成字符串:

1with open(‘new_story.json’) as file:
2 distros_dict = json.load(file)
3for item in distros_dict[‘results’]:
4 print(item[‘alternatives’][0][‘transcript’] +’.’)

这样,就可以用NLP算法来解读了。

程序猿并没有用很复杂的算法,只需要六步:

1、把段落转换成句子。 2、文本预处理:删掉所有特殊字符、停用词 (Stop Words) 以及数字。 3、给句子做标记:获取句子里出现的所有单词。 4、给每个单词算好它出现的加权频率。

第4步得出的加权频率长这样:

后面还有关键的两步:

5、把原始句子里的单词,都替换成加权频率。 6、给每个句子算出加权频率之和,按降序排列。

效果还不错

然后,AI对一场戏的总结就做好了:

程序猿对这个结果还是很满意的:他说自己看电影的时候,本来就有些字听不太清。所以,这场戏的总结已经算是友好了。

谷歌翻译长这样:

不过,不知道你能不能看出,这是哪一场戏 (答案在文末) 。

另外,程序猿也用同样的方法,四句话概括了一个11分钟的有声故事:

故事的名字叫The Boarded Window,AI的总结和维基百科的情节描述,已经有些接近了。

你也来试试

程序猿已经把算法上传到了GitHub。

如果你也有太长不想看的视频,或者太长不想听的音频,让AI帮你总结一下吧。

GitHub传送门: https://github.com/Shaier/Movie-Summarizer

教程原文传送门: https://towardsdatascience.com/summarizing-harry-potter-with-ml-e724c024e2a2

以及,如果你还不知道,AI总结的是哪一场戏:

本文分享自微信公众号 - 量子位(QbitAI),作者:关注前沿科技

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 技术流玩家入局AI+教育,他曾是浙江高考状元、搜狗COO

    要说中国科技创新20年来突飞猛进,以至能有中美平行宇宙格局,得感谢创投和IPO上市机制。

    量子位
  • 技术流玩家入局AI+教育,他曾是浙江高考状元、搜狗COO

    要说中国科技创新20年来突飞猛进,以至能有中美平行宇宙格局,得感谢创投和IPO上市机制。

    量子位
  • 一周AI要闻回顾 | 5G+AI在医疗展露锋芒;P视频技术完全产品化

    量子位筛选整理出过去一周Top 10,从技术新突破、政策新风向和产业新动态3大方面,为你提供最新趋势参考。

    量子位
  • 麦肯锡全球调研160个AI案例,发布5大行业34个应用场景

    作者:麦肯锡 ? “我觉得不行!”;“我觉得可以!” 这正是现在大家看待AI的两种态度。有人觉得现在去谈人工智能的商业化为时尚早,但也有人觉得人工智能已经在企...

    钱塘数据
  • AI科技评论周刊:你有没有想过,要成为一个AI领域的大神?

    未来是一个AI的时代吗?很有可能是的,几乎每天都能看到AI相关的新闻,你会不会也有一种想要钻研AI,制造下一个AlphaGo的冲动? 可是学习AI说难不算特别难...

    AI科技评论
  • 响铃:人工智能热潮袭来,谁在薅羊毛,谁会享红利?

    根据Garnter的预测,2018年超过300万人要向机器人老板汇报工作。未来会有很多机械工作可能会被机器替代,甚至是更加复杂的劳动,包括CEO工作的20%都有...

    曾响铃
  • 麦肯锡全球调研160个案例,发布5个行业34个AI应用场景

    这正是现在大家看待AI的两种态度。有人觉得现在去谈人工智能的商业化为时尚早,但也有人觉得人工智能已经在企业的许多业务场景中发挥至关重要的作用。无论如何,作为一个...

    华章科技
  • 中科大吴锋:多智能体的分布式在线决策 | 腾讯AI Lab学术论坛演讲

    腾讯高校合作
  • Facebook、微软、谷歌三大研究巨头齐聚首,共同探讨人工智能发展现状和趋势

    AI 研习社消息,日前 AAAS 在 reddit 上组织了一场问答,Facebook 人工智能研究院 Yann LeCun,微软研究院院长 Eric Horv...

    AI研习社
  • 杨强用联邦学习打破「数据孤岛」,吴恩达谈企业AI转型五要素 | 市北·GMIS 2019

    在前沿技术方面,杨强教授分享了如何用联邦学习打破数据割裂,吴恩达谈到小数据、无监督学习对未来人工智能发展的重要性,俞凯也抛出认知智能的技术演进路线。

    机器之心

扫码关注云+社区

领取腾讯云代金券