前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 调用Google Tran

python 调用Google Tran

作者头像
py3study
发布2020-01-09 11:23:58
1.1K0
发布2020-01-09 11:23:58
举报
文章被收录于专栏:python3

调用Google 翻译API进行翻译

代码语言:javascript
复制
#!/usr/bin/python
#coding: UTF-8
import sys  
reload(sys)  
sys.setdefaultencoding('utf8')   

from xml.etree import ElementTree as ET  #引入解析xml文件的模块
import re  
import urllib,urllib2  #引入接入网络接口API的模块

from socket import error as SocketError
import errno
import os
import string


#调用google translator API,进行翻译
def translate(text, f, t):  
      
    '''''模拟浏览器的行为,向Google Translate的主页发送数据,然后抓取翻译结果 '''  
      
    #text 输入要翻译的英文句子  
    text_1=text  
    #'langpair':'en'|'zh-CN'从英语到简体中文
    values = {'hl':'zh-CN','ie':'UTF-8','text':text,'langpair':"%s|%s"%(f, t)}     
    #values={'hl':'zh-CN','ie':'UTF-8','text':text_1,'langpair':"'en'|'zh-CN'"}  
    #values={'hl':'en','ie':'UTF-8','text':text_1,'langpair':"'zh'|'en'"} 
    url='http://translate.google.cn'  #这个地址至关重要,写错了没有输出。网上好多 url = 'http://translate.google.cn/translate_t',行不通
    data = urllib.urlencode(values) 

    req = urllib2.Request(url,data)
  
    #模拟一个浏览器  
    browser='Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)'  
    req.add_header('User-Agent',browser)  
  
    #向谷歌翻译发送请求  
    response = urllib2.urlopen(req) 
    #读取返回页面  
    html=response.read()  
    #print(html)
    #从返回页面中过滤出翻译后的文本  
    #使用正则表达式匹配  
    #翻译后的文本是'TRANSLATED_TEXT='等号后面的内容  
    #.*? non-greedy or minimal fashion  
    #(?<=...)Matches if the current position in the string is preceded  
    #by a match for ... that ends at the current position  
    p=re.compile(r"(?<=TRANSLATED_TEXT=).*?;")  
    m=p.search(html)  
    #print m
    text_2=m.group(0).strip(';')  
    return text_2  
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档