Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >从Pydrill查询将csv加载到pandas数据帧中

从Pydrill查询将csv加载到pandas数据帧中
EN

Stack Overflow用户
提问于 2019-10-11 14:04:18
回答 2查看 204关注 0票数 0

我可以将csv加载到pandas dataframe中,但它被困在列表中。我怎样才能直接从Pydrill加载到pandas数据框中,或者从pandas数据框列和数据列表中删除?我尝试过取消列表,它会将所有内容都放入一个列表中。

我使用了to_dataframe(),但似乎找不到有关是否可以使用分隔符的文档。由于Pydrill查询,pd.dataframe无法工作。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
reviews = drill.query("SELECT * FROM  hdfs.datasets.`titanic_ML/titanic.csv` LIMIT 1000", timeout=30)
print(reviews)
import pandas as pd
df2 = reviews.to_dataframe()
df2.rename(columns=df2.iloc[0])
headers = df2.iloc[0]
print(headers)

new_df = pd.DataFrame(df2.values[1:], columns=headers)
new_df.head()

结果将所有内容转换为一个列表。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
["pclass","sex","age","sibsp","parch","fare","embarked","survived"]

0   ["3","1","38.0","0","0","7.8958","1","0"]
1   ["1","1","42.0","0","0","26.55","1","0"]
2   ["3","0","9.0","4","2","31.275","1","0"]
3   ["3","1","27.0","0","0","7.25","1","0"]
4   ["1","1","41.0","0","0","26.55","1","0"]

我想把所有的东西都放到一个普通的熊猫数据帧中。

EN

回答 2

Stack Overflow用户

发布于 2019-10-11 17:58:04

我找到的解决方案是:

它不会列出数据帧,但它是该问题的替代解决方案。

connect_str = "dbname='dbname‘user='dsa_ro_user’conn =dbname copg2.connect(Connect_str) host='host database‘

SQL = "SELECT *“SQL +=”FROM train“

df = pd.read_sql(SQL,conn) df.head()

票数 0
EN

Stack Overflow用户

发布于 2020-09-21 02:46:36

尝试使用O’Reily Text: Chapter 4. Querying Delimited Data中所述的表函数。这将分隔文件并将第一行应用于您的列。注意:因为所有内容都是以文本形式读取的,所以如果您想在selectwhere中进行算术运算,则可能需要将值作为浮点数进行cast

这应该会让你得到你想要的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sql="""
SELECT * 
FROM table(hdfs.datasets.`/titanic_ML/titanic.csv`(
    type => 'text', 
    extractHeader => true, 
    fieldDelimiter => ',')
) LIMIT 1000
"""

rows = drill.query(sql, timeout=30)

df = rows.to_dataframe()
df.head()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58342953

复制
相关文章
python pandas读取csv文件_pandas将数据写入csv
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/175441.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/27
5.9K0
python pandas读取csv文件_pandas将数据写入csv
Sqlserver远程查询数据下载到本地
sqlcmd -S 本地数据库连接地址 -U 本地用户名 -P 本地密码 -i 执行存储过程文件
十分钟空间
2022/08/17
5830
Pandas处理csv表格
该文介绍了如何使用Pandas库对CSV文件进行数据处理和操作,包括读取CSV文件、处理缺失值、数据类型转换、数据筛选和排序、数据分组和统计等。同时,还介绍了如何使用Pandas进行数据预处理,包括数据标准化、数据编码、特征提取和特征选择等。最后,通过一个具体的示例,演示了如何使用Pandas进行数据分析和处理,并生成了对应的CSV文件。
MachineLP
2018/01/09
3.2K0
Pandas处理csv表格
使用CSV模块和Pandas在Python中读取和写入CSV文件
CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据。CSV是一种紧凑,简单且通用的数据交换通用格式。许多在线服务允许其用户将网站中的表格数据导出到CSV文件中。CSV文件将在Excel中打开,几乎所有数据库都具有允许从CSV文件导入的工具。标准格式由行和列数据定义。此外,每行以换行符终止,以开始下一行。同样在行内,每列用逗号分隔。
用户7466307
2020/06/16
20.1K0
Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)
在第一部分中,我们将通过示例介绍如何读取CSV文件,如何从CSV读取特定列,如何读取多个CSV文件以及将它们组合到一个数据帧,以及最后如何转换数据 根据特定的数据类型(例如,使用Pandas read_csv dtypes)。
用户1359560
2019/02/22
3.7K0
Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)
python之pandas数据筛选和csv操作
  本博主要总结DaraFrame数据筛选方法(loc,iloc,ix,at,iat),并以操作csv文件为例进行说明
全栈程序员站长
2022/07/18
2.6K0
Taro中如何将store加载到项目中
上面文章我们了解了如何创建store,最后导出时,在函数内部创建了store,所以导出时,函数需要调用,然后通过provicer组件将其注入到项目中。
挥刀北上
2022/05/11
7680
Taro中如何将store加载到项目中
用Pandas从HTML网页中读取数据
本文,我们将通过几步演示如何用Pandas的read_html函数从HTML页面中抓取数据。首先,一个简单的示例,我们将用Pandas从字符串中读入HTML;然后,我们将用一些示例,说明如何从Wikipedia的页面中读取数据。
老齐
2020/05/15
9.6K0
用Pandas从HTML网页中读取数据
PandasGUI:使用图形用户界面分析 Pandas 数据帧
数据预处理是数据科学管道的重要组成部分,需要找出数据中的各种不规则性,操作您的特征等。Pandas 是我们经常使用的一种工具,用于处理数据,还有 seaborn 和 matplotlib用于数据可视化。PandasGUI 是一个库,通过提供可用于制作
润森
2022/09/22
3.9K0
PandasGUI:使用图形用户界面分析 Pandas 数据帧
将文件导入到数据库中_将csv文件导入mysql数据库
我一开始是准备还原数据库的,结果出现了如下问题。因为它并不是备份文件,所以我们无法进行还原。
全栈程序员站长
2022/11/10
14.4K0
将文件导入到数据库中_将csv文件导入mysql数据库
ESXI 6.5 从载到安装
下载ESXI 访问官网 https://www.vmware.com 到download,选择vsphere 下载esxi https://my.vmware.com/en/group/vm
惨绿少年
2018/03/30
1.4K0
初探pandas——索引和查询数据
索引 import pandas as pd ser=pd.Series(range(0,10,2)) print(ser) 0 0 1 2 2 4 3 6 4 8 dtype: int64 通过索引值或索引标签获取数据 通过index查看索引值 print(ser.index) RangeIndex(start=0, stop=5, step=1) 自定义索引值 ser.index=['a','b','c','d','f'] print(ser) a 0 b 2
LRainner
2020/07/15
6320
Pandas查询数据df.query
形式:DataFrame.query(expr, inplace=False, **kwargs)
北山啦
2022/11/27
5620
Pandas查询数据df.query
使用SQLAlchemy将Pandas DataFrames导出到SQLite
在进行探索性数据分析时 (例如,在使用pandas检查COVID-19数据时),通常会将CSV,XML或JSON等文件加载到 pandas DataFrame中。然后,您可能需要对DataFrame中的数据进行一些处理,并希望将其存储在关系数据库等更持久的位置。
py3study
2020/12/17
4.8K0
使用SQLAlchemy将Pandas DataFrames导出到SQLite
python数据存储系列教程——python(pandas)读写csv文件
csv文件可以使用记事本或excel软件打开,excel软件会自动按照csv文件规则加载csv文件。
用户7886150
2021/01/15
1.4K0
如何在 Python 中使用 plotly 创建人口金字塔?
在本文中,我们将探讨如何在 Python 中使用 Plotly 创建人口金字塔。Plotly是一个强大的可视化库,允许我们在Python中创建交互式和动态绘图。
很酷的站长
2023/08/11
4320
如何在 Python 中使用 plotly 创建人口金字塔?
如何将多个csv文件合并到一个csv中
1、将所有的csv文件放到一个文件夹,比如D:/test中有a.csv,b.csv,c.csv,d.csv,f.csv
ytkah
2020/06/10
11.9K0
如何将多个csv文件合并到一个csv中
在Windows上安装PHP(将PHP加载到Apache中)
第一步:在 windows.php.net 下载软件包 第二步:解压压缩包,将解压后的目录放到指定目录并重命名 第三步: 创建PHP配置文件,修改Apache配置文件(httpd.conf),将PHP加载到Apache中 1. 在官网下载Windows上用的安装包 ---- https://windows.php.net 2. 解压压缩包,将目录放到指定目录并重命名为 7.0 ---- php-7.0.33-Win32-VC14-x64 —> 7.0 3. 创建PHP配置文件,将以下内容添加到A
很酷的站长
2023/02/17
1.7K0
在Windows上安装PHP(将PHP加载到Apache中)
点击加载更多

相似问题

将多个CSV加载到单个pandas数据帧中

223

从登录页面后面的url将csv加载到pandas数据帧中

122

将矩阵从csv (数据帧)加载到R

118

将csv导入pandas数据帧

20

将pandas数据帧导出到CSV

123
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文