文章/答案/技术大牛

发布

社区首页 >问答首页 >将抓取的数据保存在内存中

问将抓取的数据保存在内存中
EN

Stack Overflow用户

提问于 2021-10-11 13:16:43

回答 1查看 26关注 0票数 0

我正在从一个网站上抓取ods数据，并分析这些数据。我曾经使用pandas和odfpy来读取来自在线资源的数据，但是这种方式(由于未知的原因)导致了非常长的计算时间。因此，在本地驱动器上保存样本后，我尝试使用pandas-ods-reader读取数据，这样读取数据的效率更高。然而，pandas-ods-reader似乎不能像pandas一样读取互联网上存在的数据，它只能处理保存在本地驱动器上的实际数据。

这在使用pandas时工作得很好

url= 'https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'

data_range=pd.read_excel(url)

当我将相同的URL与pandas-ods- read一起使用时，数据无法读取

from pandas_ods_reader import read_ods

url='https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'

data_range=read_ods(url)

当我运行后面的脚本时，我得到以下错误：“未知的文件类型。”

我想知道是否有一种方法可以将数据保存在内存中，并在使用read_ods时从那里调用它。

ods

python

pandas

回答 1

Stack Overflow用户

发布于 2021-10-11 13:35:59

您可以通过在计算机上保存ods文件来解决此问题。

import requests
from pandas_ods_reader import read_ods


url = "your_url"

response = requests.get(url)

with open("file_name.ods", "wb") as f:
    f.write(response.content)

data_range=read_ods("file_name.ods")

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69526874

复制

相似问题

问将抓取的数据保存在内存中
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将抓取的数据保存在内存中EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将抓取的数据保存在内存中
EN