首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将抓取的数据保存在内存中

将抓取的数据保存在内存中
EN

Stack Overflow用户
提问于 2021-10-11 13:16:43
回答 1查看 26关注 0票数 0

我正在从一个网站上抓取ods数据,并分析这些数据。我曾经使用pandas和odfpy来读取来自在线资源的数据,但是这种方式(由于未知的原因)导致了非常长的计算时间。因此,在本地驱动器上保存样本后,我尝试使用pandas-ods-reader读取数据,这样读取数据的效率更高。然而,pandas-ods-reader似乎不能像pandas一样读取互联网上存在的数据,它只能处理保存在本地驱动器上的实际数据。

这在使用pandas时工作得很好

代码语言:javascript
运行
复制
url= 'https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'

data_range=pd.read_excel(url)

当我将相同的URL与pandas-ods- read一起使用时,数据无法读取

代码语言:javascript
运行
复制
from pandas_ods_reader import read_ods

url='https://www.opendatani.gov.uk/dataset/be060ba2-19b1-426c-9736-94897e290bb4/resource/968cbade-736d-4d89-ae82-e54e68c31ea6/download/2019-northern-ireland-traffic-count-data.ods'

data_range=read_ods(url)

当我运行后面的脚本时,我得到以下错误:“未知的文件类型。”

我想知道是否有一种方法可以将数据保存在内存中,并在使用read_ods时从那里调用它。

EN

回答 1

Stack Overflow用户

发布于 2021-10-11 13:35:59

您可以通过在计算机上保存ods文件来解决此问题。

代码语言:javascript
运行
复制
import requests
from pandas_ods_reader import read_ods


url = "your_url"

response = requests.get(url)

with open("file_name.ods", "wb") as f:
    f.write(response.content)

data_range=read_ods("file_name.ods")
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69526874

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档