我有包含200+列的pandas数据帧。所有列都是int类型。我需要将它们转换为浮点型。我找不到做这件事的方法。我试过了
for column in X_data:
X_data[column].astype('float64')
但是在for循环之后,当我打印X_data.dtypes时,所有的列都只显示为int。我也尝试过X_data = X_data.apply(pd.to_numeric),但它没有转换为float。
数据帧是从csv文件加载中构建的。
我研究了熊猫的造型文档,但无法准确地得到我的问题的具体和准确的答案。我正在使用dataframe读取一个excel文件,并在我的程序中处理该dataframe。最后,我使用xlwing库将处理后的数据帧写入另一个现有的excel文件中。
我用的是-
import pandas as pd
import xlwings as xw
df = pd.read_excel("file.xlsx")
.
. #Code for processing dataframe and writing dataframe in another excel file
.
在将此数据帧写入另一个
我正在尝试从pandas数据帧中的单个列中的字符串中找到一个最大的数字,然后根据最大结果创建另一个列。 我的数据帧: number_quotes
0 I have 1-50 ice-creams
1 4 people out of 10 said hello
2 8889 or 9500 but could be 10903 期望的结果: number_quotes max_number
0 I have 1-50 ice-creams 50
1 4 people out of 10 said hello
我想使用method='bfill'和limit在pandas数据帧上实现fillna方法
df= df.fillna( method='bfill', limit=5)
但是我有以下错误
NotImplementedError: specifying a limit for fillna has not been implemented yet
我在这次讨论中发现了一个bug,但从那时起我就没有找到另一个答案。
我使用了关键字method,但它仍然不起作用
谢谢。
最好的
有没有办法在不遍历每一行的情况下从数据帧中执行SQL update-where?我有一个postgresql数据库,要从数据帧更新数据库中的表,我将使用psycopg2并执行以下操作:
con = psycopg2.connect(database='mydb', user='abc', password='xyz')
cur = con.cursor()
for index, row in df.iterrows():
sql = 'update table set column = %s where column = %s&
我有一个熊猫数据帧: df。我是用sql query得到的。现在,我想编写另一个sql查询,从该pandas数据帧中获取数据: SELECT id, type, value
FROM df
GROUP BY id, type 我想这样做是因为第一个查询非常大,第二个查询也可能变得非常大,所以为了避免大型查询,如何在第二个查询中插入熊猫数据帧?
我有一个特定id的开始日期和结束日期(df_with_start_end),我尝试从另一个数据帧(df_dates)中找出具有相同id的其他日期在它们之间。应在新列中输入结果。
我的想法是使用唯一的ID迭代数据帧df_with_start_end,对于每个ID,我尝试分析在df_with_start_end的开始日期和结束日期内是否有来自df_dates的任何其他日期。
我的实现是这样的,但它不是这样工作的。
for k in df_with_start_end['ID']:
df_with_start_end[k]['FREE_PERIOD'] = d