我已经编写了使用yandex转换一些英文外文字符的脚本,下面是代码:
for pre in soup.select('body'):
pree= pre.text
print (pree)
HTML是:
<body>
onComplete_10([{"Alignment":"0:1-0:4 2:2-6:9 3:3-6:9","From":"zh-CHS","OriginalTextSentenceLengths":[4],"TranslatedText":"Drama Arts","TranslatedTextSentenceLengths":[10]}]);
</body>
返回的结果(当然)是:
onComplete_10([{"Alignment":"0:1-0:4 2:2-6:9 3:3-6:9","From":"zh-CHS","OriginalTextSentenceLengths":[4],"TranslatedText":"Drama Arts","TranslatedTextSentenceLengths":[10]}]);
我只需要得到“戏剧艺术”的翻译文本。
注意:我已经更新了for循环。现在使用regex过滤我所需的数据,但仍然没有结果。
for pre in soup.select('body'):
p = re.compile(ur'"TranslatedText":"(.*?)"')
strr = pre.text
pree = re.findall(p, strr)
print (pree)
发布于 2015-10-10 12:29:33
只是稍微改变了一下,这是个小小的错误。不过,由于某种原因,上述方法适用于regex101。
for pre in soup.select('body'):
p = re.compile(u'"TranslatedText":"(.*?)"')
strr = pre.text
pree = re.findall(p, strr)
print (pree)
https://stackoverflow.com/questions/33053839
复制相似问题