我需要在python中读取一个.dat文件,该文件共有12列和数百万行。我的计算需要除以第2栏、第3栏和第4栏和第1栏。因此,在加载该.dat文件之前,是否需要删除所有其他不需要的列?如果不是,我如何有选择地声明列并要求python进行计算?我对python很陌生,所以请给我一点打开、阅读和计算的指导。我从您的建议中添加了作为启动程序的代码:
import pandas as pd
我有一张大数据:df = pd.read_csv('data.csv)
ID Year status223725 1993 No223725 1995 No
我有许多唯一的IDs,我希望根据ID和status列删除重复的行。如果一个ID.中的ID值为Yes,则仅保留该行,则为该特定的ID删除所有stat