在pandas数据帧中,我需要找到任意行中包含零的列,并删除整个列。 例如,如果我的数据帧看起来像这样: A B C D E F G H
0 1 0 1 0 1 1 1 1
1 0 1 1 1 1 0 1 1 我需要删除列A、B、D和F。我知道如何删除这些列,但是以编程方式识别带有零的一列让我摸不着头脑。
因此,我正在尝试创建一个python脚本,该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。 我能够成功地创建其他所有内容,但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”,在这里我将使用我的SQL查询来拉取数据,但是我得到了一个"AttributeError:' dataframe‘object has no attribute 'cursor’“错误。 我没有看到很多pandas.read_sql_query()的例子,所以我很难理解我将如何在其中使用我的数据帧。
我有一个包含2列的数据帧,如下所示:
Index Year Country
0 2015 US
1 2015 US
2 2015 UK
3 2015 Indonesia
4 2015 US
5 2016 India
6 2016 India
7 2016 UK
我想创建一个新的数据帧,其中包含每年国家的最大计数。新的数据帧将包含3列,如下所示:
Index Year Countr
我正在尝试使用python读取我的csv文件,将特定的列提取到一个pandas.dataframe中,并显示该数据帧。但是,我没有看到数据框,我收到Series([],dtype: object)作为输出。下面是我正在使用的代码:我的文档包含: product sub_product issue sub_issue consumer_complaint_narrative
company\_public\_response company state zipcode tags
consumer\_consent\_provided submitted\_via date
来自R,我试着让我的头为熊猫数据切片整数。令我困惑的是,使用相同的整数/切片表达式对行和列进行不同的切片行为。
import pandas as pd
x = pd.DataFrame({'a': range(0,6),
'b': range(7,13),
'c': range(14, 20)})
x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2?
a b
0 0 7
1 1 8
2 2 9
我
我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而,我得到了以下error.But,我想我必须输入与lines.How数量一样多的数据,我可以在我想要的行和列中输入信息吗?如果不输入数据,如何创建列? import pandas as pd
kd = pd.DataFrame(data)
insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True )
print(kd) 错误: ValueError: Length of values (4) does not match length o
如何将数据帧中给定列的每个元素与标量相乘?(我已经尝试过了,但似乎找不到正确的解决方案)
做一些类似的事情:
df['quantity'] *= -1 # trying to multiply each row's quantity column with -1
给我一个警告:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
注意:如果可能的话,我不想在数据帧上迭代,也不想做
我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作,新列的结果是正确的。但在运行代码时,我会得到以下错误消息。我怎么才能解决这个问题?我认为这会影响性能。
C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。
请参阅文档中的注意事项:
# In[1]:
import pandas as pd
import numpy as np
from pandas im
在填写一个非常大的数据帧时,我有两个问题。这张照片有一段。我要把E和F中的1000拉低到26,不要再往下拉。以同样的方式,我希望2000被拉到-1,并被拉到下一个26。我以为我可以用bfill和bfill来做这件事,但不幸的是我不知道怎么做……(Picture1)
另一个问题是,在列中,从-1到26的值不包含E和F中的任何值。我如何删除它们或用0填充它们,以避免bfill或ffill在其中生成错误的条目?(picture2)
import pandas as pd
import numpy as np
data = '/Users/Hanna/Desktop/Coding/C
我正在尝试使用loc方法获取熊猫数据帧的视图,但当我修改原始DataFrame时,它不能像预期的那样工作。
我希望使用loc方法提取DataFrame的行/片,以便在对DataFrame进行修改时,片反映更改。
让我们看一下这个例子:
import pandas as pd
import numpy as np
df = pd.DataFrame({'ID':np.arange(0,5,2), 'a':np.arange(3), 'b':np.arange(3)}).set_index('ID')
df
a b
ID
我在Pandas有一个数据帧,它显示了一个城市/州的男性所占的百分比。数据帧df如下所示(请注意,这不是我的实际使用情况/数据,但我的数据类型类似) STATE CITY PERC_MEN
ALABAMA ABBEVILLE 41.3%
ALABAMA ADAMSVILLE 53.5%
....
WYOMING WRIGHT 46.6% 每个State/percentage of men组合将恰好返回一个值。 如何显示给定州的城市/人口值?我的代码如下所示(我需要按STATE分组的第一行,因为我对数据做了其他事情) for state
假设我有一些数据帧,其中一列有一些值,这些值多次出现形成组(片段中的列A )。现在我想创建一个新的列,例如,每个组的第一个x (列C)条目有一个1,另一个条目是0。我设法完成了第一部分,但我没有找到一个很好的方法来在xes上包含条件,有没有一个好的方法来做到这一点? import pandas as pd
df = pd.DataFrame(
{
"A": ["0", "0", "1", "2", "2", "2"], # data to group by