Loading [MathJax]/jax/input/TeX/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >从Pydrill查询将csv加载到pandas数据帧中

问从Pydrill查询将csv加载到pandas数据帧中
EN

Stack Overflow用户

提问于 2019-10-11 14:04:18

回答 2查看 204关注 0票数 0

我可以将csv加载到pandas dataframe中，但它被困在列表中。我怎样才能直接从Pydrill加载到pandas数据框中，或者从pandas数据框列和数据列表中删除？我尝试过取消列表，它会将所有内容都放入一个列表中。

我使用了to_dataframe()，但似乎找不到有关是否可以使用分隔符的文档。由于Pydrill查询，pd.dataframe无法工作。

reviews = drill.query("SELECT * FROM  hdfs.datasets.`titanic_ML/titanic.csv` LIMIT 1000", timeout=30)
print(reviews)
import pandas as pd
df2 = reviews.to_dataframe()
df2.rename(columns=df2.iloc[0])
headers = df2.iloc[0]
print(headers)

new_df = pd.DataFrame(df2.values[1:], columns=headers)
new_df.head()

结果将所有内容转换为一个列表。

["pclass","sex","age","sibsp","parch","fare","embarked","survived"]

0   ["3","1","38.0","0","0","7.8958","1","0"]
1   ["1","1","42.0","0","0","26.55","1","0"]
2   ["3","0","9.0","4","2","31.275","1","0"]
3   ["3","1","27.0","0","0","7.25","1","0"]
4   ["1","1","41.0","0","0","26.55","1","0"]

我想把所有的东西都放到一个普通的熊猫数据帧中。

EN

回答 2

Stack Overflow用户

发布于 2019-10-11 17:58:04

我找到的解决方案是：

它不会列出数据帧，但它是该问题的替代解决方案。

connect_str = "dbname='dbname‘user='dsa_ro_user’conn =dbname copg2.connect(Connect_str) host='host database‘

SQL = "SELECT *“SQL +=”FROM train“

df = pd.read_sql(SQL，conn) df.head()

票数 0

EN

Stack Overflow用户

发布于 2020-09-21 02:46:36

尝试使用O’Reily Text: Chapter 4. Querying Delimited Data中所述的表函数。这将分隔文件并将第一行应用于您的列。注意:因为所有内容都是以文本形式读取的，所以如果您想在select或where中进行算术运算，则可能需要将值作为浮点数进行cast。

这应该会让你得到你想要的：

sql="""
SELECT * 
FROM table(hdfs.datasets.`/titanic_ML/titanic.csv`(
    type => 'text', 
    extractHeader => true, 
    fieldDelimiter => ',')
) LIMIT 1000
"""

rows = drill.query(sql, timeout=30)

df = rows.to_dataframe()
df.head()

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58342953

复制

相关文章

python pandas读取csv文件_pandas将数据写入csv

java https 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/175441.html原文链接：https://javaforall.cn

全栈程序员站长

2022/09/27

5.9K0

python pandas读取csv文件_pandas将数据写入csv

Sqlserver远程查询数据下载到本地

数据库 sql 存储

sqlcmd -S 本地数据库连接地址 -U 本地用户名 -P 本地密码 -i 执行存储过程文件

十分钟空间

2022/08/17

5830

Pandas处理csv表格

该文介绍了如何使用Pandas库对CSV文件进行数据处理和操作，包括读取CSV文件、处理缺失值、数据类型转换、数据筛选和排序、数据分组和统计等。同时，还介绍了如何使用Pandas进行数据预处理，包括数据标准化、数据编码、特征提取和特征选择等。最后，通过一个具体的示例，演示了如何使用Pandas进行数据分析和处理，并生成了对应的CSV文件。

MachineLP

2018/01/09

3.2K0

使用CSV模块和Pandas在Python中读取和写入CSV文件

文件存储 python java

CSV文件是一种纯文本文件，其使用特定的结构来排列表格数据。CSV是一种紧凑，简单且通用的数据交换通用格式。许多在线服务允许其用户将网站中的表格数据导出到CSV文件中。CSV文件将在Excel中打开，几乎所有数据库都具有允许从CSV文件导入的工具。标准格式由行和列数据定义。此外，每行以换行符终止，以开始下一行。同样在行内，每列用逗号分隔。

用户7466307

2020/06/16

20.1K0

Python数据处理从零开始----第二章（pandas）⑦pandas读写csv文件(1)

在第一部分中，我们将通过示例介绍如何读取CSV文件，如何从CSV读取特定列，如何读取多个CSV文件以及将它们组合到一个数据帧，以及最后如何转换数据根据特定的数据类型（例如，使用Pandas read_csv dtypes）。

用户1359560

2019/02/22

3.7K0

Python数据处理从零开始----第二章（pandas）⑦pandas读写csv文件(1)

python之pandas数据筛选和csv操作

c 语言文件存储 https 网络安全 java

　　本博主要总结DaraFrame数据筛选方法（loc,iloc,ix,at,iat），并以操作csv文件为例进行说明

全栈程序员站长

2022/07/18

2.6K0

Taro中如何将store加载到项目中

react app store 函数

上面文章我们了解了如何创建store，最后导出时，在函数内部创建了store，所以导出时，函数需要调用，然后通过provicer组件将其注入到项目中。

挥刀北上

2022/05/11

7680

Taro中如何将store加载到项目中

用Pandas从HTML网页中读取数据

html python 爬虫

本文，我们将通过几步演示如何用Pandas的read_html函数从HTML页面中抓取数据。首先，一个简单的示例，我们将用Pandas从字符串中读入HTML；然后，我们将用一些示例，说明如何从Wikipedia的页面中读取数据。

老齐

2020/05/15

9.6K0

用Pandas从HTML网页中读取数据

PandasGUI：使用图形用户界面分析 Pandas 数据帧

gui python matlab numpy

数据预处理是数据科学管道的重要组成部分，需要找出数据中的各种不规则性，操作您的特征等。Pandas 是我们经常使用的一种工具，用于处理数据，还有 seaborn 和 matplotlib用于数据可视化。PandasGUI 是一个库，通过提供可用于制作

润森

2022/09/22

3.9K0

PandasGUI：使用图形用户界面分析 Pandas 数据帧

将文件导入到数据库中_将csv文件导入mysql数据库

数据库云数据库 MySQL sql https tomcat

我一开始是准备还原数据库的，结果出现了如下问题。因为它并不是备份文件，所以我们无法进行还原。

全栈程序员站长

2022/11/10

14.4K0

将文件导入到数据库中_将csv文件导入mysql数据库

ESXI 6.5 从载到安装

下载ESXI 访问官网 https://www.vmware.com 到download，选择vsphere 下载esxi https://my.vmware.com/en/group/vm

惨绿少年

2018/03/30

1.4K0

初探pandas——索引和查询数据

自动化 pandas 函数数据索引

索引 import pandas as pd ser=pd.Series(range(0,10,2)) print(ser) 0 0 1 2 2 4 3 6 4 8 dtype: int64 通过索引值或索引标签获取数据通过index查看索引值 print(ser.index) RangeIndex(start=0, stop=5, step=1) 自定义索引值 ser.index=['a','b','c','d','f'] print(ser) a 0 b 2

LRainner

2020/07/15

6320

Pandas查询数据df.query

形式：DataFrame.query(expr, inplace=False, **kwargs)

北山啦

2022/11/27

5620

Pandas查询数据df.query

使用SQLAlchemy将Pandas DataFrames导出到SQLite

python sqlite android

在进行探索性数据分析时（例如，在使用pandas检查COVID-19数据时），通常会将CSV，XML或JSON等文件加载到 pandas DataFrame中。然后，您可能需要对DataFrame中的数据进行一些处理，并希望将其存储在关系数据库等更持久的位置。

py3study

2020/12/17

4.8K0

使用SQLAlchemy将Pandas DataFrames导出到SQLite

python数据存储系列教程——python（pandas）读写csv文件

编程算法文件存储 python

csv文件可以使用记事本或excel软件打开，excel软件会自动按照csv文件规则加载csv文件。

用户7886150

2021/01/15

1.4K0

如何在 Python 中使用 plotly 创建人口金字塔？

python plotly 布局函数数据

在本文中，我们将探讨如何在 Python 中使用 Plotly 创建人口金字塔。Plotly是一个强大的可视化库，允许我们在Python中创建交互式和动态绘图。

很酷的站长

2023/08/11

4320

如何在 Python 中使用 plotly 创建人口金字塔？

如何将多个csv文件合并到一个csv中

文件存储命令行工具

1、将所有的csv文件放到一个文件夹，比如D:/test中有a.csv，b.csv，c.csv，d.csv，f.csv

ytkah

2020/06/10

11.9K0

如何将多个csv文件合并到一个csv中

在Windows上安装PHP（将PHP加载到Apache中）

apache php windows

第一步：在 windows.php.net 下载软件包第二步：解压压缩包，将解压后的目录放到指定目录并重命名第三步：创建PHP配置文件，修改Apache配置文件（httpd.conf），将PHP加载到Apache中 1. 在官网下载Windows上用的安装包 ---- https://windows.php.net 2. 解压压缩包，将目录放到指定目录并重命名为 7.0 ---- php-7.0.33-Win32-VC14-x64 —> 7.0 3. 创建PHP配置文件，将以下内容添加到A

很酷的站长

2023/02/17

1.7K0

在Windows上安装PHP（将PHP加载到Apache中）

点击加载更多

相似问题

将多个CSV加载到单个pandas数据帧中

223

从登录页面后面的url将csv加载到pandas数据帧中

122

将矩阵从csv (数据帧)加载到R

118

将csv导入pandas数据帧

20

将pandas数据帧导出到CSV

123

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例