首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于百度翻译的简单爬虫翻译-- coding:utf-8 --访问网址模拟浏览器创建文件夹用一个text文件保存,文件名用单词名字

基于百度翻译的简单爬虫翻译-- coding:utf-8 --访问网址模拟浏览器创建文件夹用一个text文件保存,文件名用单词名字

作者头像
云时之间
发布2018-04-11 09:54:57
7610
发布2018-04-11 09:54:57
举报
文章被收录于专栏:云时之间云时之间

因为最近有数据需求,自己写了一个简单的小爬虫,但是这是第一版还是比较简陋,慢慢更新吧.


能够实现的功能是查询英语单词和中文单词并且能够找出读音来,希望以后学习下图形界面再去完善下,整的好看点.

屏幕快照 2017-12-06 下午10.15.22.png


代码如下:

-- coding:utf-8 --

import requests
 import os
 url= 'https://fanyi.baidu.com/v2transapi' #网址

访问网址

模拟浏览器

print("请输入你想翻译的语言,英文请输入1,中文请输入2")
 translat_Word= input()
 if(translat_Word==1):
 word = input("请输入你想翻译的英语\n")
 data = {
 'from': 'en',
 'to': 'zh',
 'query': word,
 'transtype': 'realtime',
 'simple_means_flag': 3
 }
 else:
 word = input("请输入你想翻译的中文\n")
 data = {
 'from': 'zh',
 'to': 'en',
 'query': word,
 'transtype': 'realtime',
 'simple_means_flag': 3
 }
response = requests.post(url, data=data)
 data = response.json()
means = data['dict_result']['simple_means']['symbols'][0]['parts']

创建文件夹

if not os.path.exists("my_%s" % word):
 os.makedirs("my_%s" % word)
 dir_name = "my_%s" % word

用一个text文件保存,文件名用单词名字

'''
 flie_handler = open('%s.txt'%word,'w',encoding='utf-8')
 for item in means:
 flie_handler.write(item['part'] + ' '.join(item['means']) +'\n')
 flie_handler.close()
 with可以省略open
 '''
 mp3_url = 'https://fanyi.baidu.com/gettts?lan=en&text=%s&spd=3&source=web' %word
 mp3_response = requests.get(mp3_url)
 mp3_data = mp3_response.content #二进制 字节数据
 with open('%s/%s.mp3'%(dir_name, word), 'wb') as f:
 f.write(mp3_data)
 with open('%s/%s.txt'%(dir_name,word),'w',encoding='utf-8') as f:
 for item in means:
 f.write(item['part'] + ' '.join(item['means']) +'\n')
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.12.06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • -- coding:utf-8 --
  • 访问网址
  • 模拟浏览器
  • 创建文件夹
  • 用一个text文件保存,文件名用单词名字
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档