首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在python中保存处理后的文件?

如何在python中保存处理后的文件?
EN

Stack Overflow用户
提问于 2018-08-18 00:29:49
回答 2查看 223关注 0票数 0

我是python新手。我开始用Beautiful Soup编写一个处理HTML文件的脚本。一切都在正常处理,但我现在想将文章保存在一个名为nowe的新文件夹中,而不是打印它。我需要在处理后将所有文章放到同一个文件夹中,或者创建一个CSV文件。

代码语言:javascript
复制
from bs4 import BeautifulSoup
import glob
import os, os.path


path = '/home/darek/Dokumenty/pliki/'
path_out = '/home/darek/Dokumenty/pliki/nowe'
for filename in glob.glob(os.path.join(path, '*.html',)):
    f = filename
    tresc = open(f)
    soup = BeautifulSoup(tresc, 'html.parser') 
    article = soup.find('div',class_='post')
    tagi = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')

    fout = open( +filename, "w")
    fout.close()

print(article)

我的错误日志:

代码语言:javascript
复制
File "/home/darek/Dokumenty/parser.py", line 21, in <module>
    fout = open( +filename, "w")

TypeError: bad operand type for unary +: 'str'

这是印刷品的作品

从bs4导入BeautifulSoup导入glob导入os,os.path

代码语言:javascript
复制
path = '/home/darek/Dokumenty/pliki/'
path_out = '/home/darek/Dokumenty/pliki/nowe'
for filename in glob.glob(os.path.join(path, '*.html',)):
    f = filename
    content = open(f)
    soup = BeautifulSoup(content, 'html.parser') 
    article = soup.find('div',class_='post')
    tags = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')


print(article)

那是我不能写到文件的作品的想法?

EN

回答 2

Stack Overflow用户

发布于 2018-08-18 00:33:44

删除此行中的"+“:fout = open( +filename, "w")

"w“的意思是:”以写入模式打开文件“。如果你给它加一个"+“,比如"w+",它会在文件打开时从头开始写入文件。所以这行应该是

fout = open(filename, "w+")

票数 0
EN

Stack Overflow用户

发布于 2018-08-18 00:49:55

更改以下代码块:

代码语言:javascript
复制
fout = open( +filename, "w")
fout.close()

要做到这点:

代码语言:javascript
复制
fout = open( filename, "w")
fout.write(article) # I assume here that article is what you want to be writing
fout.close()

tresc.close() # You never closed this, so it was a memory leak
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51899594

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档