前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >利用Python来教你通过英语四六级!成功率95%!太牛了!

利用Python来教你通过英语四六级!成功率95%!太牛了!

原创
作者头像
诸葛青云
修改2019-05-08 10:18:59
1.1K0
修改2019-05-08 10:18:59
举报

现在是考试季吧,风华正茂的青年才俊们应该已经在图书馆占好了座位,开始备战 12 月份的英语四六级考试了吧!想当年,pk 哥四级考试前也在图书馆待了一阵子,后来四级考了 450 分惊险过关,六级考试第一次考了 400 分没过,第二次准备去考时找不到准考证,考完第二天才发现夹在了纸质的笔记本里,大写的尷尬啊,后来也就不了了之。我们知道,四六级考试中,单词的词汇量是重点,阅读时如果单词都不认识的话,影响我们对语句的理解,这样也会降低答题的正确率。

怎么去高效的记单词也是一件头疼的事情,可能今天记住了,明天又忘了。

今天我用 Python 分析了最近 10 年的四六级考试的真题,把里面的单词进行统计,按照降序排序,并做成可视化的图形。

项目环境

语言:Python 3

编辑器:Pycharm

我从网上下载了最近 10 年的四六级考试的真题,都为纯文本 txt 格式的文件。我先把四六级真题单独建了文件夹保存。

合并文本

以四级真题为例,为了便于统计,我先把近 10 年所有的纯文本真题合并成一个纯文本文件。遍历读取给定路径下的所有文件的内容,保存到新文本中。

单词统计

再对合并的文本中的词汇进行统计。这里我用列表生成式处理掉不是英文的字符,并剔除掉 1 个 或者 2 个英文字母组成的单词,因为这些是一些量词和常见的连接词。我还把一些非常常见的单词也给去掉了。通过 sorted 对单词进行排序。

四级真题单词统计结果按单词出现次数降序排列后保存在新的纯文本文件中。

可视化图形

然后把这些统计结果生成可视化的图表。关于生成可视化图形,之前有一篇文章专门讲过,没看过的戳这里 Python让你的数据生成可视化图形 ,这篇文章里讲到了 10 种可视化图形的制作方法。今天这篇文章只用柱形图和词云图两种方法。不知道怎么生成可视化图形的或者想看其他可视化图形生成方法的,大家点击上面链接查看。

我们先把四级真题词汇统计数据做成柱形图,我只取了前 20 名的数据。

我们再加一点数据做成词云图看看。

我们用同样的方法我统计下六级真题词汇,同样,我们先把所有的文本合并成一个文本,然后统计词汇的出现的次数并降序排列保存在文本中。

做成柱形图,这次取了前 24 个单词。

把六级真题的高频单词做成词云图。

我们可以看到,六级的真题高频词汇和四级的真题高频词汇排名靠前的都差不多。

通过历年真题中单词次数的统计并可视化展示后,我们需要做的不仅仅是记住这些单词,而是在这些单词的基础上举一反三,把可能出现的语法和用法都列出来,这样,这些高频单词的用法熟记于心后,你的通过率就更高了!

话说如果当年我考试前用了强大的 Python 去分析,也许我的六级考试一次就过了呢,哈哈。

鉴于本文的思路,你如果有更多的四六级真题数据也可以加进去,你也可以分析专业八级英语考试出现的高频单词排名。其他的,什么日语,法语,德语,也是可以统计并做成可视化图形。

希望本文能对你的考试有那么一丢丢的帮助,最后,祝准备参加英语四六级考试和其他各种考试的同学逢考必过,永不挂科。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云图数据可视化
腾讯云图数据可视化(Tencent Cloud Visualization) 是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,全图形化编辑,快速可视化制作。腾讯云图数据可视化支持多种数据来源配置,支持数据实时同步更新,同时基于 Web 页面渲染,可灵活投屏多种屏幕终端。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档