我正在尝试从zip文件夹中提取一个csv文件,并选择它的名称,因为它保存在新目录中。下面的代码可以很好地提取文件: import zipfile
with zipfile.ZipFile(f'C:\\Users\\user\\Downloads\\{nombre_solar_zip}', 'r') as zip_ref:
zip_ref.extractall('C:\\Users\\user\\\\work') 但是zip文件夹中的文件名是不断变化的,所以我想要更改它的名称,以便我可以阅读它。有没有办法做到这一点?
我正在尝试读取csv文件,该文件包含在我从web提取的文件中。问题是压缩后的文件有多个级联文件夹。我必须为几个不同的单元这样做,所以我正在执行一个循环。循环没有问题,文件名是正确的,我可以下载文件。但是,我收到一条错误消息(我认为是因为R找不到我要求它查找的确切文件)。错误是:
Error in open.connection(file, "rt") : cannot open the connection
In addition: Warning message:
In open.connection(file, "rt") :
cannot locate
我有一个批处理文件,从文件夹中提取所有压缩文件的文件名和修改时间,并将其保存为.csv文件。
有没有办法在源代码中添加文件夹的路径?那么,如果.bat文件在桌面上,那么它也会从提到的文件夹路径中获得所有的文件名,并在桌面上创建一个.csv文件?
>"File_names.csv" ( for /r %%a in (*.zip) do @echo %%~ta,"%%~nxa" )
我正在尝试以下操作: import pandas as pd
loc = r'T:\Analysis\calibraer19.zip\col1\profiles\myfile.csv'
pd.read_csv(loc) 但我一直收到文件不存在的错误。我不确定如何读取这个文件,因为压缩文件夹很大,里面有100个文件,所以解压缩不是一个好的选择。
我使用python处理熊猫数据帧已经有一段时间了。我想将我正在使用的相同代码切换到R。然而,我没有太多使用R的经验,我也不确定我有什么选择来做同样的事情。我有一个包含许多csv文件的文件夹,并且我有一个文件名列表,我希望遍历这些文件并对这些文件进行完整的外连接。 在pandas中,我会运行以下命令, import pandas as pd
filelist = pd.read_excel("/Users/XXX/Documents/test/data/list.xlsx") #contains a list of filenames in the File column ar
path = r'D:/PYTHON/My codes/Frequency envelopes/test'
all_files = glob.glob(os.path.join(path, "*.csv"))
names = [os.path.basename(x) for x in all_files]
df = pd.DataFrame()
for file_, name in zip(all_files, names):
file_df = pd.read_csv(file_,index_col=False)
file_df[&
我有一份数据
dfio
Name Age Zip
Good 22 03764
Bad 22 98765
从xlsx文件中读取df
dfio = pd.read_excel(r'//i-data-share/jobs/Member Lists/x/Output.xlsx', dtype=str,engine='openpyxl')
这个df中的zip5是zip5格式的。但是,当我将df转换为csv时
folder_to_export_path = "//i-data-share/jobs/Member Lists"
我有一个包含许多zip文件的文件夹,在这些zip文件中有多个csv文件。在python中,有没有办法把所有的.csv文件放在一个数据帧中?或者任何我可以传递zip文件列表的方法?
我目前正在尝试的代码是:
import glob
import zipfile
import pandas as pd
for zip_file in glob.glob(r"C:\Users\harsh\Desktop\Temp\data_00-01.zip"):
# This is just one file. There are multiple zip files in the fo
我们可以使用python确定zip归档的文件夹结构,如下所示(我们也可以在Java中执行相同的操作):
with zipfile.ZipFile('path to file', 'r') as zipobj:
for item in zipobj.infolist():
print(item.filename)
但是,是否可以确定zip存档中特定文件夹的文件夹结构,并仅迭代该文件夹中的所有文件/文件夹(类似于path对象)?(而不是迭代zip存档中的所有文件/文件夹,如前面的代码示例所示)
从肖恩·拉赫曼的棒球数据库中加载这些CSV文件。对于此赋值,我们将使用'Salaries.csv‘和'Teams.csv’表。将这些表格读取到pandas DataFrame中,并显示每个表格的标题。
#Here's the code I have so far:
import requests
import io
import zipfile
url = 'http://seanlahman.com/files/database/lahman-csv_2014-02-14.zip
r = requests.get(url,auth=('us
我正在使用Julia的ZipFile包来提取和处理csv文件。没问题,但是当我在zip文件中遇到zip文件时,我也想处理它,但是遇到了一个错误。
Julia ZipFile文档在这里:
代码如下:
using ZipFile
using DataFrames
function process_zip(zip::ZipFile.ReadableFile)
if split(zip.name,".")[end] == "zip"
r = ZipFile.Reader(zip) #error: MethodError: no method
我想从另一个.csv文件的列中更新一个或多个.csv文件的特定列。但是,当我执行以下脚本时,经过多次试验,输出的.csv文件要么删除了旧字段,要么复制了旧字段。当脚本再次运行时,我也不希望从输入文件中添加已经添加的字段。
with open('Shop Export File.csv', 'r', encoding='utf-8-sig') as shop_file:
with open('Shipping CSV.csv', 'a', encoding='utf-8-sig', newli
我有一个Python脚本和pandas来组合多个ZIP文件。我在这里使用托管在GitHub存储库中的数据:
该脚本应获取文件夹结构中的所有压缩文件,在压缩文件中找到" Bezirke.csv“文件,并将所有Bezirke.csv文件合并为一个大的CSV文件。但是,代码只从文件夹中抓取了一个ZIP文件。
对于为什么不从文件夹中的其他ZIP文件中获取数据,有什么建议吗?
import glob
from zipfile import ZipFile
path = r'/Users/matt/test/' # use your path
#load all zip fil
我的文件夹里有200个CSV文件。我要做的是读取每个文件的第一行,并在新的csv中写入。在最上面,我想写文件,field1,field2,...fieldn n是最大的字段数。
import csv
import glob
list=[]
hel=[]
files=glob.glob('C:/dataset/*.csv')
with open('test.csv', 'w',newline='') as testfile:
csv_writer = csv.writer(testfile)
for file in
我正在尝试从与我的Python脚本不同的目录中读取CSV文件。
此外,CSV文件存储在具有完全相同名称的ZIP文件夹中(唯一的区别是一个以.zip结尾,另一个以.csv结尾)。
目前,我正在使用Python的zipfile和csv库打开并从文件中获取数据,但是我得到了错误:
Traceback (most recent call last): File "write_pricing_data.py", line 13, in <module>
for row in reader:
_csv.Error: iterator should return st