腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
不
创建
文件
就可以
使用
read_csv
的
方法
?
使用
StringIO
、
在
不
创建
文件
的
情况下,有什么好
的
方法
可以
使用
StringIO
来
创建
DataFrame吗?
浏览 22
提问于2021-02-10
得票数 0
回答已采纳
2
回答
读取pandas数据帧
的
前几行
的
方法
、
、
、
有没有
一种内置
的
方法
可以
使用
read_csv
只读取
文件
的
前几行n行,而不需要预先知道这些行
的
长度?我有一个很大
的
文件
,需要很长时间才能读取,有时只想
使用
前20行来获取它
的
样本(并且不喜欢加载整个
文件
并获取它
的
头部)。如果我知道代码行
的
总数,我
就可以
执行类似footer_lines = total_lines -
浏览 0
提问于2013-02-22
得票数 122
回答已采纳
1
回答
导入并解析.data
文件
、
、
有一个
文件
,我试图导入和安全
的
熊猫df。乍一看,它似乎已经是列和行排序
的
,但最后我不得不做一堆东西来
创建
pandas df。你能检查一下
有没有
更快
的
方法
来管理它吗?url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data‘ 我这样做
的
方式是: import
浏览 20
提问于2018-12-18
得票数 1
回答已采纳
2
回答
当
使用
熊猫
read_csv
和
StringIO
而不是
文件
对象时,峰值内存
使用
量要大得多。
、
、
、
我有一个容量为600 of
的
CSV,我用以下两种
方法
之一加载了熊猫
的
read_csv
。with open('my_data.csv') as f: data_frame = pd.read_csv(io.
StringIO
(file_contents))第一种
方法
的
峰值内存
使用
量为1GB。第二种
方法
浏览 8
提问于2022-04-25
得票数 0
回答已采纳
1
回答
Pandas
read_csv
中
的
复杂定界列
、
、
我正在尝试
使用
Pandas读取一些日志
文件
,其中列由空格分隔,一些列由带空格
的
单引号字符串组成(例如'string ')。我很难用
read_csv
读取这些
文件
。例如(
使用
一些虚拟数据):from io import
StringIO
1 2 'asdf '这种行为完全有意义,但
浏览 12
提问于2018-01-19
得票数 2
回答已采纳
1
回答
解码后
的
文本
文件
转换为pandas数据帧
、
、
、
我正在
使用
requests获取一个制表符分隔
的
数据
文件
,我想将其转换为pandas数据框。但是,我似乎不知道如何将解码后
的
数据
文件
转换为pandas数据框对象。(url)tmp_df = pd.read_csv(decoded,sep='\t',encoding = 'utf8') 我
的
理解是,decoded是一个驻留在内存中
的
文本<em
浏览 10
提问于2017-07-26
得票数 0
回答已采纳
2
回答
使用
外部url时熊猫
的
read_csv
响应代码
、
、
、
我将requests.get()替换为pd.read_csv(),如果熊猫没有获得相当于状态代码200
的
状态代码,我想编写一些异常逻辑。= 200: 如何将相同
的
逻辑应用于pd.read_csv()?有什么身份代码我可以查吗?
浏览 8
提问于2022-07-18
得票数 1
回答已采纳
1
回答
超时pandas
read_csv
stringio
超时
、
、
Python2.7,django 1.6.5,apache和nginx上
的
Pandas
read_csv
导致我
的
生产服务器超时。只有在
使用
像
StringIO
.
StringIO
或io.BytesIO这样
的
字符串缓冲区时才会发生这种情况。将
文件
名作为参数提供给
read_csv
时,一切正常。调试没有帮助,因为在我
的
开发服务器上不会发生这个问题。有什么想法吗?
浏览 0
提问于2014-06-12
得票数 0
1
回答
Azure存储get_blob_to_stream无法将保存
的
csv
文件
下载为流
、
、
、
我想将存储在Azure存储中
的
CSV
文件
下载到流中,并在我
的
python脚本中直接
使用
,但是在托马斯
的
帮助下,我不能
使用
read_csv
方法
,错误消息是: pandas.io.common.EmptyDataError:没有从
文件
中解析
的
列,因此我假设下载
的
CSV流实际上是空
的
,但是在签入存储帐户后,CSV
文件
中
的
所有数据都很好,这里有什么问题?
浏览 0
提问于2018-03-28
得票数 5
1
回答
单元格中
的
熊猫数据以引号开头,但不结尾则会导致错误标记数据。C错误
、
、
我有一个CSV
文件
,作为自动化
的
一部分打开,我在其中一个
文件
Error tokenizing data.C error中遇到了这个错误良好细胞:Mozilla/5.0 (Linux;
浏览 2
提问于2021-04-21
得票数 1
回答已采纳
1
回答
为什么
使用
.decode()
使用
一个
文件
的
两个实例?Python瓶
、
、
我正在从html表单中检索CSV
文件
,并
使用
utf-8对其进行解码。出于各种原因,我需要在我
的
程序中
使用
这个
文件
的
两个实例,但是当我
使用
.decode('utf-8')时,.decode()函数
使用
了两个
文件
实例。request.form['banks'] 由于某些原因,.decode()函
浏览 1
提问于2022-08-01
得票数 -1
回答已采纳
1
回答
使pandas.read_csv
不
添加列分隔符少于主行
的
行
、
对于列分隔符太多
的
行,
使用
pandas.read_csv和on_bad_lines='warn'选项可以很好地工作,坏行不会被加载,stderr捕获坏行号: data =
StringIO
(""" bat,F,52 caw,(此处为sep=,)小于主分隔符,则添加行添加NaN: import pa
浏览 19
提问于2022-09-22
得票数 0
1
回答
用pd.read_csv打开CSV
文件
-上下文管理器有什么用途吗?
、
、
、
我开始读Nunez-Iglesias et
的
。在打开书中
的
第一个数据集(一个.txt
文件
)时,作者
使用
with open(filename, 'rt') as f:但是我认为会关闭这个
文件
,因为它是在打开一个
文件
描述符(参见 )。那么,这里<
浏览 0
提问于2017-09-18
得票数 5
回答已采纳
1
回答
在已有的本地时区上
创建
可识别pandas时区
的
datetimeindex
我正在尝试将美国/东部时间
的
文件
读入以时间为索引
的
数据帧中。由于2008年2月11日是DST转换日,因此有两个小时1(顺序指示哪个小时是日光,而不是标准)。当尝试本地化时,代码会失败,因为它们是不明确
的
。现在,pytz模块有一种
方法
来指示日期是否为dst,这在这里很有用,但不清楚这是否由pandas公开。一种解决方案是为
read_csv
创建
date_parser函数,但是
有没有
办法
使用
其他pandas函数来实现本地化
浏览 0
提问于2013-06-29
得票数 2
2
回答
从URL中直接读取csv
文件
/如何修复403禁止
的
错误
csv
文件
是可下载
的
。我可以下载该
文件
并
使用
read_csv
,但是我想通过jupyter中
的
直接URL读取该
文件
,我
使用
了以下代码,但我得到了HTTP 403 Forbidden错误s=re
浏览 0
提问于2019-04-23
得票数 2
回答已采纳
2
回答
在阅读熊猫数据框架时跳过包含特定值
的
特定行。
、
、
、
当您
使用
命令pd.read_csv读取csv时,如何跳过一行中包含特定值
的
行?如果在第50行、第55行,第1列
的
值为100,那么在读取csv
文件
时,我想跳过这些行。我如何将这些命令放入像pd.read_csv('read.csv')这样
的
读入命令中?该值
的
总长度为300。
浏览 4
提问于2016-11-17
得票数 2
回答已采纳
2
回答
在内存中生成csv
文件
,然后将其数据编码到base64?
、
、
、
、
我需要在内存中生成csv
文件
,比如数据,然后将其编码为base64,这样我
就可以
保存它。所以基本上我不想在硬盘上
创建
文件
。现在我通过
创建
csv
文件
,然后编码它
的
数据,保存它,然后简单地删除csv
文件
(因为它不再需要)来解决这个问题。但是,
有没有
一种
方法
可以跳过
文件
创建
,但以相同
的
方式保存数据?我
的
意思是这些数据将被用来再次
使用
b
浏览 1
提问于2015-10-16
得票数 13
回答已采纳
4
回答
可以分块读取拼图
文件
吗?
例如,pandas
的
read_csv
有一个chunk_size参数,它允许
read_csv
在CSV
文件
上返回一个迭代器,这样我们
就可以
分块读取它。拼图格式以块
的
形式存储数据,但是没有像
read_csv
这样
的
有文档记录
的
方法
来读入块。
有没有
办法以块
的
形式读取拼图
文件
?
浏览 3
提问于2019-11-29
得票数 8
1
回答
Pandas DataFrame脚本中
的
类CSV数据
、
、
我已经得到了一个城市列表,其中包含与DataFrame相关
的
lon值、lat值,但我不想从CSV
文件
中读取这些值,而是希望让用户修改或添加到这些城市、lat、lon值到IPython笔记本中
的
一个单元格中现在,我有了一个可行
的
解决方案,但它看起来有点难看:sta = array([Sandwich 41.767990 -70.466
浏览 1
提问于2013-04-15
得票数 0
回答已采纳
2
回答
请检查我
的
算法
、
我有一些
文件
要解析。它具有时间信息,如果在该时间范围内被修改,则后跟标签和值。我需要把这个放到CSV
文件
中,这样我
就可以
在之后进行绘图了。CSV
文件
应如下所示1:00, 1, 1, 2, 4, 03:00, 4, 1, 3, 4, 7 4:00, 2, 5然后在整个
文件
中进行第二次解析。我说
的
这个输入
文件
很容易就是几千个不同标签
的
几百兆字节大小。因此,每次我完成一个时间
浏览 2
提问于2014-06-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用创建时间给文件重命名的步骤解析:简单的批量操作方法
Python编程:StringIO和BytesIO
Python:文件处理+序列化
Python3 Python IO编程
Python中将整数转换为对应的字符
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券