我正在尝试在pandas中绘制数据框列中的值的一些直方图,我想循环遍历列以获得紧凑的代码,但代码总是抛出错误? for c in df.columns:
axes[i,0].hist(df[df.num>0].c.tolist())
i +=1 AttributeError: 'DataFrame' object has no attribute 'c'
对于一个可迭代的对象,我们可以使用 for item in items: 但是,如果我有两个并排的可迭代程序,比如有两列的pandas数据帧,会怎么样呢?我可以使用上面的方法遍历一列,但是有没有一种更优雅的方法同时遍历两列呢? import pandas as pd
df = pd.DataFrame({'col 1': [1,2,3,4,5], 'col 2': [6,7,8,9,10]})
i = 0
for j in df['col 1']:
print(j)
print(df['col 2'][i])
我的控制器返回一个包含多个行和列的PDO数组。在我的视图文件中循环数据的最佳方式是什么?(或者我应该在模型中做更多的逻辑?)
$user->getDetails(); //returns array in view
foreach($user->getDetails() as $row) // Prehaps? But how to index without being explicit with column names?
谢谢!
我正试图解析一些数据以生成直方图。
数据在多个列中,但对我来说唯一相关的列是以下两列。
X
AB 42
CD 77
AB 33
AB 42
AB 33
CD 54
AB 33
只对带有AB的行,我想在col 2中绘制值的直方图。所以直方图应该排序和绘图:
33 - 3
42 - 2
(虽然42个先发生,但我想先写第33号)。
我有很多列,但是它需要grep 'AB‘字符,并且只在这些行中搜索。有人能帮忙吗?
UPDATE:数据在csv文件中,有几个列。
编辑:我现在以这种格式在csv文件中获得数据。
地址、数据
FromAP,42
我正在使用Jupyter笔记本中的绘制直方图,如下所示:
import numpy as np
import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
df = pd.read_csv('CTG.csv', sep=',')
sns.distplot(df['LBE'])
我有一个列数组,其中包含我想要绘制直方图的值,并且我尝试为每个列绘制一个直方图:
c
如何用一行和三列创建一个图,在每个列中我绘制一个直方图?数据来自于这个DataFrame:
import pandas as pd
import matplotlib as plt
d = {'col1': ['A','A','A','A','A','A','B','B','B','B','B','B','C','C','C','C&
我想知道在UIPicker中显示CSV文件内容的最佳方式是什么。
这个想法是,一个人在UIPicker中选择一个日期范围,然后根据他们的选择获得一个UIAlert弹出窗口。
我知道可能有一些选择。我想可能有一些简单的方法可以避免创建数据库。
我的CSV文件有4列。其中一列是日期范围列,其格式如下:
Feb 20, 1920 - Feb 7, 1921
Feb 8, 1921 - Jan 27, 1922
Jan 28, 1922 - Feb 15, 1923
Feb 16, 1923 - Feb 4, 1924
etc....
谢谢你的帮助。
我有一个Pandas DataFrame,它有两列,其中包含范围[-pi,pi)中的一些角度。我需要计算每一行的瞬时角速度,这可以使用diff()来完成,但是当我的数据跨越从pi到-pi的不连续时,这种简单的方法就失败了,例如 我正在尝试对我的列使用numpy.unwrap(),但是当我尝试下面的代码时,我得到了一个ValueError。 angle_data["theta"].apply(np.unwrap)
<Traceback message>
ValueError: diff requires input that is at least one dim
我的结构是pandas DataFrame: n X Y Z
0 1.000000 1.000000 1.014925
1 1.000000 1.000000 1.000000 我想从每一列创建M个单独的子图(直方图)。一个直方图来自X,一个直方图来自Y,最后一个直方图来自Z。 我希望它有单独的地块。我正在研究https://seaborn.pydata.org/generated/seaborn.FacetGrid.html,但我不明白如何从我的数据中绘制它的语法/逻辑。
我如何加入下面的数据,
# Convert Spark DataFrame to Pandas
pandas_df = df.toPandas()
print pandas_df
age name
0 NaN Michael
1 30 Andy
2 19 Justin
我目前的尝试,
persons = ""
for index, row in pandas_df.iterrows():
persons += str(row['name']) + ", " + str(row['age
我有一个不适合记忆的大数据集。我目前正在用两个表将其存储在HDFStore中:df_hist是由MultiIndex索引的直方图集合,其中第一级标记为直方图,第二级标记为直方图bin。df_params包含用于生成每个直方图的模拟参数,并由直方图标签(即df_hist索引的第一级)进行索引。
In [1]: store = pandas.HDFStore('test.h5')
In [2]: store['df_params'].head()
Out[2]:
N z sample sigma oct T
0 64 6 6
我试图在现有的数据框架上创建一个新列,但总是遇到"KeyError“问题。在我的数据框中,我有一个包含出生日期的列,我想使用该列来获取客户的年龄。我使用的函数是 for i in range(len(df1)):
df1['Idade'][i] = calculate_age(df1['Data de Nascimento'][i]) 到目前为止,函数"calculate_age“没有任何问题,但我总是得到这样的结果: Traceback (most recent call last):
File "<ip