专栏首页云时之间基于百度翻译的简单爬虫翻译-- coding:utf-8 --访问网址模拟浏览器创建文件夹用一个text文件保存,文件名用单词名字

基于百度翻译的简单爬虫翻译-- coding:utf-8 --访问网址模拟浏览器创建文件夹用一个text文件保存,文件名用单词名字

因为最近有数据需求,自己写了一个简单的小爬虫,但是这是第一版还是比较简陋,慢慢更新吧.


能够实现的功能是查询英语单词和中文单词并且能够找出读音来,希望以后学习下图形界面再去完善下,整的好看点.

屏幕快照 2017-12-06 下午10.15.22.png


代码如下:

-- coding:utf-8 --

import requests
 import os
 url= 'https://fanyi.baidu.com/v2transapi' #网址

访问网址

模拟浏览器

print("请输入你想翻译的语言,英文请输入1,中文请输入2")
 translat_Word= input()
 if(translat_Word==1):
 word = input("请输入你想翻译的英语\n")
 data = {
 'from': 'en',
 'to': 'zh',
 'query': word,
 'transtype': 'realtime',
 'simple_means_flag': 3
 }
 else:
 word = input("请输入你想翻译的中文\n")
 data = {
 'from': 'zh',
 'to': 'en',
 'query': word,
 'transtype': 'realtime',
 'simple_means_flag': 3
 }
response = requests.post(url, data=data)
 data = response.json()
means = data['dict_result']['simple_means']['symbols'][0]['parts']

创建文件夹

if not os.path.exists("my_%s" % word):
 os.makedirs("my_%s" % word)
 dir_name = "my_%s" % word

用一个text文件保存,文件名用单词名字

'''
 flie_handler = open('%s.txt'%word,'w',encoding='utf-8')
 for item in means:
 flie_handler.write(item['part'] + ' '.join(item['means']) +'\n')
 flie_handler.close()
 with可以省略open
 '''
 mp3_url = 'https://fanyi.baidu.com/gettts?lan=en&text=%s&spd=3&source=web' %word
 mp3_response = requests.get(mp3_url)
 mp3_data = mp3_response.content #二进制 字节数据
 with open('%s/%s.mp3'%(dir_name, word), 'wb') as f:
 f.write(mp3_data)
 with open('%s/%s.txt'%(dir_name,word),'w',encoding='utf-8') as f:
 for item in means:
 f.write(item['part'] + ' '.join(item['means']) +'\n')

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 恋爱模型的简单构架

    前言: 感谢微信群的各位大牛们和忆臻学长的帮助,让我能够完成这个文章。这个文章的开始是这一段时间看到我周围的小伙伴在跟很多的妹子聊天后总是无疾而终,过程虽然有...

    云时之间
  • 网易面试题-间隔分类器

    为什么选择最大间隔分类器,请从数学的角度说明? ? ?

    云时之间
  • python爬虫学习:电商数据分析

    通常我们在使用爬虫的时候会爬取很多数据,而这些数据里边什么是有用的数据,什么是没用的数据这个是值得我们关注的,在这一篇文章里,我们将通过一个简单的爬虫,来去简单...

    云时之间
  • 98-简单的TCP客户端

    凯茜的老爸
  • 【go】剑指offer:3种方法寻找二进制1的个数

    对于该题很容易有思路,我们将整数进行二进制的转换的过程中记录余数为1的个数即可。需要注意的是传入的负数和循环的终止条件,代码如下,因为循环的终止条件为商为0时停...

    陌无崖
  • 机器学习(二) 如何做到Kaggle排名前2%

    Jason Guo
  • 手把手搭建一个聊天机器人(二)

          这里,我们要去网上申请一个API,我们使用的是图灵聊天机器人。,网址是:http://www.tuling123.com/申请步骤就不说了,如果不会...

    钱塘小甲子
  • 数据挖掘之聚类算法K-Means总结

    序   由于项目需要,需要对数据进行处理,故而又要滚回来看看paper,做点小功课,这篇文章只是简单的总结一下基础的Kmeans算法思想以及实现; 正文:   ...

    Gxjun
  • zookeeper入门

    Apache ZooKeeper是Apache软件基金会的一个软件项目,他为大型分布式计算提供开源的分布式配置服务、同步服务和命名注册。ZooKeeper曾经是...

    LiosWong
  • Leaflet在线地图进阶宝典——json素材操纵与图层面板控制

    这篇教程憋了很久,其实算是3个月前leaflet在线地图系列的进阶篇,但是因为当时对于leaflet地图的数据源结构理解有限,技能勉强操控shp数据源,对于js...

    数据小磨坊

扫码关注云+社区

领取腾讯云代金券