我正在从一个网站上抓取ods数据,并分析这些数据。我曾经使用pandas和odfpy来读取来自在线资源的数据,但是这种方式(由于未知的原因)导致了非常长的计算时间。因此,在本地驱动器上保存样本后,我尝试使用pandas-ods-reader读取数据,这样读取数据的效率更高。然而,pandas-ods-reader似乎不能像pandas一样读取互联网上存在的数据,它只能处理保存在本地驱动器上的实际数据。
这在使用pandas时工作得很好
url= 'https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'
data_range=pd.read_excel(url)当我将相同的URL与pandas-ods- read一起使用时,数据无法读取
from pandas_ods_reader import read_ods
url='https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'
data_range=read_ods(url)当我运行后面的脚本时,我得到以下错误:“未知的文件类型。”
我想知道是否有一种方法可以将数据保存在内存中,并在使用read_ods时从那里调用它。
发布于 2021-10-11 13:35:59
您可以通过在计算机上保存ods文件来解决此问题。
import requests
from pandas_ods_reader import read_ods
url = "your_url"
response = requests.get(url)
with open("file_name.ods", "wb") as f:
f.write(response.content)
data_range=read_ods("file_name.ods")https://stackoverflow.com/questions/69526874
复制相似问题