对于同一主题还有其他几个问题,但所希望的格式总的来说是不同的。
我正在尝试使用构建一个热图可视化。
我的数据正作为Excel文件读入数据文件,如下所示:
Foo Bar Bash Baz ...
A 1 2 3 4
B 2 1 0 3
C 0 0 2 0
D 2 3 5 1
...
文件上写着The data for a HeatMap may be supplied as 2D tabular data with one
我有一个数据帧字典,其中键是每个数据帧的名称,值是数据帧本身。 我希望遍历字典并快速绘制每个数据帧中的前10行。每个数据帧都有自己的图。我已经尝试过以下几种方法: for df in dfs:
data = dfs[df].head(n=10)
sns.barplot(data=data, x='x_col', y='y_col', color='indigo').set_title(df) 这是可行的,但只返回迭代中最后一个数据帧的曲线图。有没有办法可以修改它,这样我也可以返回后续的绘图?
我希望根据同一df: totCost中的一列绘制数据帧中的所有列。下面的代码运行良好: for i in range(0, len(df.columns), 5):
g=sns.pairplot(data=df,
x_vars=df.columns[i:i+5],
y_vars=['totCost'])
g.set(xticklabels=[])
g.savefig('output.png') 问题是output.png只包含最后3个图(总共18个)。如果我确定这一行,也会发生同样的情况。
我有一个有423244行的大型数据帧。我想把它一分为四。我尝试了下面的代码,它给出了错误?ValueError: array split does not result in an equal division
for item in np.split(df, 4):
print item
如何将该数据帧分成4组?
我有一个非常大的数据框架,它有"SectionID“、”时间“和”观察值“。对于ID部分,重复时间(例如:一个月的每日数据)。当我试图为观察到的值生成一个热图时,使用海运,在x轴和y轴中使用节ID和时间。但是,既然“时间”被重复了。我试图将数据帧更改为矩阵格式,出现了“索引包含重复条目,无法重塑”的错误。我只是在学习python,我怎样才能为这样的数据生成一个热图,有人能帮忙吗?我创建了以下数据样本:
import pandas as pd
import numpy as np
import glob
import seaborn as sns
import matplotlib as
有一个包含Date、Type、Price和Location列的数据帧。有必要为每种类型构建价格对日期的依赖关系图(每个-在单独的图片上)-完成后,我得到了10个图: import pandas as pd
dat = pd.read_csv('ap-northeast-1.csv', parse_dates = True, names=['Date','Type','OS', 'Location', 'Price'])
da = dat[dat.OS == 'Windows']
d
当我在for循环中“找到”数据帧时,我试图将它们附加到一起,并添加额外的列。
我的意思是:
我有一个现有的数据帧X
a b c
1 2 3
5 6 7
9 10 11
我有一个for循环,我“找到”了满足条件参数的某些行。然后,我想将这些行添加到一个空帧中,并添加额外的columns.so新数据帧Y:
a b c next
5 6 7 8
接下来是添加的新列。到目前为止,我试图以以下方式添加:
allInfo = pd.DataFrame(columns=[list(X), "next"])
allInfo = all
我有一个数据帧列表: all_df = ['df_0','df_1','df_2','df_3','df_4','df_5','df_6'] 我如何从这个列表中调用它们来做这样的事情: for (df,names) in zip(all_df,names):
df.to_csv('output/{}.csv'.format(names)) 当预期执行时,我得到了错误的'str' object has no attribute 'to_c
我有三个数据帧,每个都是100*100,我如何将它们水平地组合成一个新的300*100形状的数据框架?我尝试使用以下命令:
result = df1.combine_first(df2)
result = pd.concat([df1, df2], axis=1, join_axes=[df1.index])
result = df1.append(df2, ignore_index=True)
但是non给出了形状为300*100的数据帧的期望结果。我怎么能这么做?
我编写了此列表理解,用于将熊猫数据帧导出到CSV文件(每个数据帧被写入不同的文件):
[v.to_csv(str(k)+'.csv') for k,v in df_dict.items()]
熊猫数据帧是字典的值,其中键将是CSV文件名的一部分。因此,在上面的代码中,v是数据帧,而k是将数据帧映射到的字符串。
一位同事说,使用列表理解不是写输出文件的好主意。为什么会这样?此外,他还说,为此使用for循环会更可靠。如果是真的,为什么会这样呢?
假设我有一个大小为m x n的网格图,其顶点数为mn,边数为2mn-m-n。如何构造具有k-边的连通子图?我知道因为k是边的数目,那么mn-1 <= k <= 2mn-m-n。如果k= mn-1,则该子图是生成树。如果k= 2mn-m-n,则该子图本身就是网格图。 我的方法是首先使用Kruskal算法构建一棵生成树(以确保它是连通的),并向该生成树添加k条边。我很好奇有没有其他方法可以做到这一点?
我有两个数据帧温度(Y)和比率(X)。在每个数据帧中,我有60列,对应于测量这两个参数的60台不同的机器。
现在,我为y和x的每台机器绘制了一个图,如下所示:
for column in ratio.columns:
x = ratio[column]
y = temperature[column]
if len(x) != len(y):
x_ind = x.index
y_ind = y.index
common_ind = x_ind.intersection(y_ind)
x = x[common
我想在‘location’列下绘制每个组的分布图-location下A、B和C的var1图。当我尝试下面的代码时,它给出了一个单一的分布图。我希望每一组都有单独的地块。任何建议都将受到高度赞赏。
数据帧(file.csv):
location var1 var2
A 122 105
A 126 100
A 137 107
B 145 110
B 153 108
B 138 102
C 129 115
C 130 98
C 149 10