我试图将字典结构中包含的所有数据格式中的所有列从object转换为string,以便对字符串应用清理函数。
# each key represents a dataframe:
# iterate over each dataframe and convert all columns to strings
import pandas as pd
data = {'dataframe_1':pd.DataFrame({'col1': ['John', 'Ashley'], 'col2': ['+10
我从Yahoo!导入了五个股票投资组合。并需要创建一个包含所有股票2016年收盘价的DataFrame。但是,我很难用相应的股票名称来标记这些列。
import pandas.io.data as web
import pandas_datareader.data as web
import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import datetime
start = datetime.datetime(2016, 1, 1)
end = datetime.datetime(2016
我正在尝试迭代Pandas DataFrame中的序列中的行。我想获取列csv_df['Strike']的每一行中的值,并将其插入在函数a中调用的变量K中。
然后,我希望将输出的a1和a2放入DataFrame中各自的列中。
我收到了错误:TypeError: unsupported operand type(s) for *: 'int' and 'zip',我想如果我能找出支持哪些操作数,我就可以将a1和a2转换为它。
我的想法正确吗?
注意:S只是一个静态数字,因为df只有一行,而K有很多行。
代码如下:
from scipy.stats
我有一个pandas dataframe,它的标题id,n和t包含重复的id,在调用groupby和size()之后,在给定计数的情况下生成了没有标题的额外列如何添加与第4列值的值相关联的额外列标题‘below.Now’,使其变为'id','n','t','count‘
id %n%t
7 2 Y 4
7 2 N 6
8 3 Y 2
8 9 N 3
9 1 Y 5
9 6 N 7
我正在使用pandas_datareader返回股票价格。该文件称,熊猫的数据框架由pandas_datareader返回。问题是返回数据帧时使用的是空白列名。这意味着在重命名列之前,我(相信这是真)不能添加另一列。总之,这是我的代码:
from datetime import datetime, timedelta
from pandas import pandas as pd
from pandas_datareader import data, wb
from matplotlib.figure import Figure
from matplotlib.dates import Dat
我是新来的蟒蛇和熊猫。我必须读取几个csv文件,这些文件具有相同的列,并创建了一个结果dataFrame(它包含来自每个csv文件的所有行)。我试过了,但是当我打印dataframe时,它是打印空的DataFrame
栏:[]索引:[]
守则是:
def readCSV(dir):
list = getFilesInDir(dir) # my function which returns list of files.
dataframe = pandas.DataFrame()
for name in list:
df = pandas.read_csv(name)
Pandas Dataframe是否有一种方法只命名第一列或第一列和第二列,即使有4列:
这里
for x in range(1, len(table2_query) + 1):
if x == 1:
cursor.execute(table2_query[x])
df = pd.DataFrame(data=cursor.fetchall(), columns=['Q', col_name[x-1]])
它给了我这个:
AssertionError:传递了2列,传递的数据有4列
我尝试使用Pandas过滤DataFrame中的行,但没有使用:
df[(df.ColumnA == 1)]
我希望能够做到这一点:
i = 'A'
x = 'Column'+'i'
df[(df.x == 1)]
我的目标是在列过滤器中循环。如果我能做到这一点就更好了:
i = A
x = 'Column'+'i'
y = 1
df[(df.x == y)]
允许我在列中循环和在过滤器类型中循环:
谢谢!
我有一个有n列的dataframe,我正在尝试创建一个递归遍历这些列的函数。 例如,假设我有以下数据帧: | left | center | right |
|:---- |:------:| -----:|
| One | Two | Three | 我想运行一个函数,它使用左列,然后是左列和中列,然后是左列、中列和右列。所以基本上,在每一步,我使用前面的列+ 1。在pandas中有一个有效的方法来做到这一点吗?
我正在尝试在pandas中绘制数据框列中的值的一些直方图,我想循环遍历列以获得紧凑的代码,但代码总是抛出错误? for c in df.columns:
axes[i,0].hist(df[df.num>0].c.tolist())
i +=1 AttributeError: 'DataFrame' object has no attribute 'c'
我找到了一个很好的函数pandas.merge_asof。从文件中
pandas.merge_asof(left, right, on=None, left_on=None, right_on=None)
Parameters:
left : DataFrame
right : DataFrame
on : label
Field name to join on. Must be found in both DataFrames.
The data MUST be ordered.
Furthermore this must be a numeric column,such as d