我有一系列的csv文件,每个文件都有几列。我想打开每个文件,删除一些列,重命名最后一列,并将修改后的文件保存为一个新的、类似的名称,然后重复此操作约2500次
基本的打开、编辑、保存方面确实适用于单一的、硬编码的文件名(包括旧的和新的)。我遇到的问题是在迭代它时。我在中间有一个“print.head(2)”来查看数据帧是否正在被编辑(它没有),并且我在写入csv部分时收到各种错误,这取决于我尝试键入代码的方式(括号、引号和双引号,等等)
import pandas as pd
f = open("D:\Latest programs & data that work
当源数据在Pandas Dataframe中时,我不确定如何使用命名绑定变量从Python 3批量插入到Oracle。下面的代码显示了我的尝试。对于未命名的绑定,它非常容易,但容易出错,因为绑定的顺序需要与Dataframe中的列相同。
"Named pandas binds with cursor.executemany in cx_oracle, how ?"
import pandas as pd
import cx_Oracle
# create table t( a number, b varchar2 (20 char));
Pandas Dataframe是否有一种方法只命名第一列或第一列和第二列,即使有4列:
这里
for x in range(1, len(table2_query) + 1):
if x == 1:
cursor.execute(table2_query[x])
df = pd.DataFrame(data=cursor.fetchall(), columns=['Q', col_name[x-1]])
它给了我这个:
AssertionError:传递了2列,传递的数据有4列
例如,我跟踪熊猫DataFrame:
import pandas as pd
df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])
print(df)
a b c
0 1 2 3
1 4 5 6
我想把它转换成以下格式:
field data
0 a 1
1 a 4
2 b 2
3 b 5
4 c 3
5 c 6
原始列名作为新的colume f
我试图使用重命名函数重命名数据帧中的列,但得到了一个错误指示:"builtins.TypeError: rename() got an unexpected keyword argument 'columns'"
我的代码是:
import pandas as pd
import pandas_datareader as web
import datetime as dt
#this is latest 5 days data selection
prev=30
endDate=dt.datetime.today().date()
startDate=endD
示例
玩具数据表:
>>> df = pd.DataFrame({'a': ['the', 'this'], 'b': [5, 2.3], 'c': [8, 11], 'd': ['the', 7]})
产量:
>>> df
a b c d
0 the 5.0 8 the
1 this 2.3 11 7
以及:
>>> df.dtypes
a object
b