首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在Python 3中使用美丽的汤修改Subelement

如何在Python 3中使用美丽的汤修改Subelement
EN

Stack Overflow用户
提问于 2018-09-10 00:11:39
回答 1查看 0关注 0票数 0

我需要拉SRC和HREF子元素离开IMG一个分别的标签,更改的内容,并有更改保存到原来的文件。我正在使用Python 3和Beautiful Soup。对于上下文,我需要能够在目录中的一系列文件上实现这一点,因此简单的查找和替换不会成功。这是我目前的代码:

代码语言:javascript
复制
from bs4 import BeautifulSoup

with open("file.html") as fp:
    soup = BeautifulSoup(fp, "lxml")

atags = soup.find_all("a", href=True)
imgtags = soup.find_all("img", src=True)

for a in atags:
    link = a.get("href")
    if link.find("http"):
        link = link.split("/")[-1]

        tmp = link.replace("%20", " ")
        link = tmp

        link = link.split("?")[0]

        a.get("href").replace_with(link)

        print(a)

for img in imgtags:
    pic = img.get("src")
    pic = pic.split("/")[-1]

    tmp = pic.replace("%20", " ")
    pic = tmp

    pic = pic.split("?")[0]

    img.get("src").replace_with(pic)

    print(img)

with open("file.html", "wb") as f_output:
    f_output.write(soup.prettify("utf-8"))

我怎么能以实际节省的方式做到这一点?

EN

Stack Overflow用户

发布于 2018-09-10 09:28:09

经过进一步的研究,我能够通过改变线条来修改我需要的子元素

代码语言:javascript
复制
a.get("href").replace_with(link)
img.get("src").replace_with(pic)

代码语言:javascript
复制
a['href'] = link
img['src'] = pic
票数 0
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/-100008850

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档