我正在研究如何将函数应用于熊猫数据栏中的一个列。但是我只想在满足条件的情况下应用这个函数。
import pandas as pd
def example_function(a, b):
return a + b
data = dict(
A = [1, 2],
B = [4, 5],
C = ["A", "B"],
)
example_df = pd.DataFrame(data=data)
因此,我想使用来自A和B的值应用example_function,只有在C列中有"B"的情况下。
有什么想法吗?
我有这个数据-
Name Sum State
加10阿格拉
20阿格拉
B 20 Patna Bihar
B 10 Patna Bihar
B 20 Patna Bihar
C 50坎普尔上
D 10新德里
加10阿格拉
B 20 Patna Bihar
C10坎普尔上
我想转换成一个有条件的数据帧
Col1-只包含每个名称一次
Col2-与col1有关的所有和的总数
col3- col1名称所在区域的第一次出现
col1 4-第一次出现来自col1的名称状态
Name Sum State
40阿格拉
B 70 Patna Bihar
C 60坎普尔上
D 10新德里
==What我已经
我知道如何将函数应用于Pandas-DataFrame.中的所有列然而,我还没有弄清楚如何在使用Polars-DataFrame.时实现这一点。
我查看了专门讨论这个主题的,但是我没有找到答案。在这里,我附上了一个代码片段与我的失败尝试。
import numpy as np
import polars as pl
import seaborn as sns
# Loading toy dataset as Pandas DataFrame using Seaborn
df_pd = sns.load_dataset('iris')
# Converting Pandas
我正在尝试创建一个程序,该程序将删除熊猫的dataFrame中的列,如果该列的总和小于10。
我目前有以下解决方案,但我很好奇是否有一种更具蟒蛇风格的方法来实现这一点。
df = pandas.DataFrame(AllData)
sum = df.sum(axis=1)
badCols = list()
for index in range(len(sum)):
if sum[index] < 10:
badCols.append(index)
df = df.drop(df.columns[badCols], axis=1)
在我的方法中,我创建了一个总和小