文章/答案/技术大牛

发布

社区首页 >问答首页 >在熊猫数据上迭代函数的最快方法

问在熊猫数据上迭代函数的最快方法
EN

Stack Overflow用户

提问于 2020-07-30 12:34:24

回答 3查看 145关注 0票数 1

我有一个在csv文件行上操作的函数，根据是否满足条件将不同单元格的值添加到字典中：

df = pd.concat([pd.read_csv(filename) for filename in args.csv], ignore_index = True)

ID_Use_Totals = {}
ID_Order_Dates = {}
ID_Received_Dates = {}
ID_Refs = {}
IDs = args.ID

def TSQs(row):

    global ID_Use_Totals, ID_Order_Dates, ID_Received_Dates

    if row['Stock Item'] not in IDs:
        pass
    else:
        if row['Action'] in ['Order/Resupply', 'Cons. Purchase']:
            if row['Stock Item'] not in ID_Order_Dates:
                ID_Order_Dates[row['Stock Item']] = [{row['Ref']: pd.to_datetime(row['TransDate'])}]
            else:
                ID_Order_Dates[row['Stock Item']].append({row['Ref']: pd.to_datetime(row['TransDate'])})
        
        elif row['Action'] == 'Received':
                
             if row['Stock Item'] not in ID_Received_Dates:
                ID_Received_Dates[row['Stock Item']] = [{row['Ref']: pd.to_datetime(row['TransDate'])}]
            else:
                ID_Received_Dates[row['Stock Item']].append({row['Ref']: pd.to_datetime(row['TransDate'])})
                                    
        elif row['Action'] == 'Use':
            if row['Stock Item'] in ID_Use_Totals: 
                ID_Use_Totals[row['Stock Item']].append(row['Qty'])
            else:
                ID_Use_Totals[row['Stock Item']] = [row['Qty']]
                                       
        else:
            pass

目前，我正在做：

for index, row in df.iterrows():
    TSQs(row)

但是，对于40000行csv文件，timer()返回70到90秒。

我想知道在整个dataframe (它可能有数十万行)实现这一点的最快方法是什么。

python

python-3.x

pandas

numpy

Stack Overflow用户

发布于 2020-07-30 12:44:30

您可以使用apply函数。代码将如下所示：

df.apply(TSQs, axis=1)

在这里，当axis=1时，每一行将作为一个pd.Series发送到函数TSQs，您可以在那里进行像row["Ref"]这样的索引以获得该行的值。因为这是一个向量操作，所以它将在for循环之后运行那么多。

票数 1

查看全部 3 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63173294

复制

相似问题

问在熊猫数据上迭代函数的最快方法
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在熊猫数据上迭代函数的最快方法EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在熊猫数据上迭代函数的最快方法
EN