我希望选择符合特定条件的列,并将它们添加到生成的DataFrame中。
import pandas as pd
df = pd.read_csv('outputData.csv')
for col in df.columns:
for index in col: #how can I do this?
if(index > 0) #... check some conditions
那么,我如何迭代列的索引呢?或者,是否有更好的方法来做到这一点?
编辑:
要读取的DataFrame如下所示:
col1 col2 col3 ....
1 1
我正在尝试通过连接两个具有特定条件的列来创建一个新列。 master['work_action'] = np.nan
for a,b in zip(master['repair_location'],master['work_service']):
if a == 'Field':
master['work_action'].append(a + " " + b)
elif a == 'Depot':
master['work
当我想要基于多个条件从数据帧访问一个值时,什么是一种优雅的失败方式:
#Select from DataFrame using criteria from multiple columns
newdf = df[(df['column_one']>2004) & (df['column_two']==9)]
如果不存在满足上述条件的值,那么pandas会返回一个keyerror。如何将NaN值存储在newdf中。
我有一个派生的sprite对象,我想在它满足特定条件时删除它。在sprite类方法中使用'pygame.sprite.Sprite.kill()‘格式删除它有什么问题吗?
class Pellet(pygame.sprite.Sprite):
def __init__(self, tank):
...
def update(self):
"""Update the position of bullets."""
self.rect.move_ip(self.xposc, self.yposc)
if o
我有一个包含多个列(20)和行(16404)的pandas数据帧。其中一列是“age”。我希望能够绘制其他指标,例如在某个年龄类别上的“收入”。20岁以下的男性和20岁到40岁的女性的收入是多少?
我尝试过这种情况:
for i in range(len(df['age'])):
if df['age'][i]<25 and df['Gender'][i]==1:
df['group'][i]=1
但是我得到了以下错误:The truth value of a Series is ambiguous.
我有一个包含超过500,000条记录的access数据库,我想批量删除记录。我得到了一个根据特定条件需要删除的I列表,这个值可能是1到5000。现在,我的代码如下所示
for ( i = 0 to 5000 )
{
CDatabase.ExecuteSQL( Delete from table where id = ItemToDelete(i) )
}
每个sql调用几乎需要1秒。
有没有批量删除的选项,或者有没有更好的方法?
我对Pythonand还比较陌生,完全是Pandas的新手,所以我很抱歉,如果这真的很简单的话。我有一个dataframe,我想对特定列中的所有元素进行操作,但前提是具有相同索引的不同列满足特定条件。
float_col int_col str_col
0 0.1 1 a
1 0.2 2 b
2 0.2 6 None
3 10.1 8 c
4 NaN -1 a
例如,如果float_col中的值大于
我有以下代码
SELECT C_Record.BunchOfColumns, Count(*) AS Degrees
FROM C_Record
WHERE (((C_Record.[C#])=[Enter Value])) //Parameter Input from User
GROUP BY C_Record.BunchofColumns;
“我的学位”列从不增加,它总是显示1,无论从查询中返回多少行。我怀疑我没有正确地实现我的GROUP BY方法。如果我正确理解它,所有被选中且不是聚合函数一部分的列(在我的例子中是COUNT)都应该放在GROUP BY中。任何帮助都是非常感谢的。提前
除了限制性太强之外,我有以下查询非常有效:
SELECT sr.AssignedTech
, i.image
FROM ScheduleRequest sr
, images i
WHERE JobStatus != 0
AND ScheduleDateExact IS NOT NULL
AND ID IS NOT NULL
AND RecordType != 2
AND JobStatus != 1
AND sr.AssignedTech = i.empno
如果ScheduleRequest.AssignedTech=im
我想从pandas数据框中选择包含非重复项的列,并使用这些列组成一个子集数据框。例如,我有一个这样的数据框: x y z
a 1 2 3
b 1 2 2
c 1 2 3
d 4 2 3 列"x“和"z”具有非重复值,因此我希望将它们挑选出来并创建一个新的数据框,如下所示: x z
a 1 3
b 1 2
c 1 3
d 4 3 可以通过以下代码实现: import pandas as pd
df = pd.DataFrame([[1,2,3],[1,2,2],[1,2,3],[4,2,3]],index=['a