如何在python dataframe中随机选择和赋值给给定的行数。列B只包含1和0。假设我有一个数据帧,如下 Col A Col B
A 0
B 0
A 0
B 0
C 0
A 0
B 0
C 0
D 0
A 0 我的目标是随机选择5%的行,并将列B的值更改为1。我看到了df.sample(),但这不允许我就地更改列数据
我有一个数据集,其中显示了按月(月)收集的项目(AMT)的数量。
我知道如何创建一个新列来计算两个垂直列之间的差值,即new column = Amount -2。
我不知道如何创建一个函数来计算一列,当两个月的值是垂直的时候,“差”,例如: Feb - Jan将是11-10 = 1。
在excel中,您可以创建一个指向单元格的公式来获得第一个值,然后将其偏移一行以获得第二个值。
然而,我不知道pandas python的偏移量函数,或者用垂直方式的数据计算偏移量的其他方法?
Month Amt Difference
Jan 10 0 (as there is no previ
我对编程非常陌生(不到2周),并且必须学习Python3作为课程的一部分,所以请在任何答案中记住这一点!我正在开发一台新的Mac电脑,以防会有什么不同。
我有一个数据表,它取自一个csv文件,编译成3列,有几千行。我已经根据某些条件过滤了相当多的行,剩下大约200行(但由于初始排序,其索引大约在8000-8300之间)。现在,我正在尝试查找另一列中出现最高值的时间(其中一列)。当我运行下面的代码时,它给我一个错误"index out out bound“。我在这里读到了关于相同错误消息的另一个问题,但我真的不明白答案如何应用到这里。
maxrow=df['A'].idx
我使用的是熊猫Python库,我非常喜欢嵌套循环。
我想对每一行进行计算--这很好:
for i, row in df_merged.iterrows():
我的数据如下:
product price max_move_%
1 100 10
然后在列的值范围内嵌套给定行的数据帧中的另一个循环,如下所示:
for a in range((df_merged['max_move'][row])* (- 1)), (df_merged['max_move'][row])):
所以我得到了
product price max_move_%
如何使用熊猫在每个列上搜索字符串值。假设我有32列,
df[df['A'].str.contains("hello")]
这将返回值是否存在于"A“列中,如何搜索每个列和值所在的行。数据集:
A B C
1 hi hie
2 bye Hello
如果我搜索"hello“或"Hello”输出,应该是:
A B C
2 bye Hello
在类似于此的设置中:
>>> import pandas as pd
>>> from random import randint
>>> df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
'B': [randint(1, 9)*10 for x in range(10)],
'C': [randint(1, 9)*100 for x in rang
我正在处理一个数据集,其中我需要从数据集中查找完整的空列。示例: A B C D
nan nan nan nan
1 ss nan 3.0
2 bb w2 4.0
nan nan nan nan 目前,我正在使用 import pandas as pd
nan_col=[]
for col in df.columns:
if df.loc[df[col].isnull()].empty !=True:
nan_col.append(col) 但这是在指定的列中捕获空值,但我需要捕获空行。 expected Answer: row [0,3]
我是Python/Pandas的新手,正在努力从pd.Dataframe中提取正确的数据。我实际拥有的是一个包含3列的Dataframe:
data =
Position Letter Value
1 a TRUE
2 f FALSE
3 c TRUE
4 d TRUE
5 k FALSE
我想要做的是将所有真正的行放入一个新的Dataframe中,这样答案将是:
answer =
Position Letter Value
1 a TRUE
3
我希望在dict中map value到DataFrame中的一列,其中dict中的key等于DataFrame中的第二列
例如:
如果我的判断是:
dict = {'abc':'1/2/2003', 'def':'1/5/2017', 'ghi':'4/10/2013'}
我的DataFrame是:
Member Group Date
0 xyz A np.Nan
1 uvw B np.Nan
我有一张熊猫桌子:
Type A B C AB AC BC ABC
0 mean(+1) NaN NaN NaN NaN NaN NaN NaN
1 mean(-1) NaN NaN NaN NaN NaN NaN NaN
2 slope NaN NaN NaN NaN NaN NaN NaN
将"mean(+1)“视为另一列,在另一列中头名称为"Type”。和" ABC“作为列标题,那么如何在坐标均值(+1),ABC中写入
我在熊猫DataFrame中有一个名为'line‘的列,它要么是数字的字符串表示,要么是由'&’符号分隔的两个数字的字符串表示。所以,我想找出所有观察到的“&”在“行”列中的索引点。
我知道我能做到
index_points = []
for row in df.index:
if '&' in df.loc[row, 'line']:
index_points.append(row)
但我不喜欢。有更好的办法吗?
我有两个pandas.dataframes df1和df2。他们的一些指数是相等的。我希望找到这些索引,并将相应的行合并到一个新的dataframe。
df1 =
A B
Name
apple 1 5
orange 2 6
banana 3 7
df2 =
A B
Name
apple -1 10
audi -2 11
bmw 0 12
banana 2 8
vw -3 6
我想要的新数据是: 1)查找具有相同索引的行;2)计算列'A‘中相应行的平均值。
df_ne