我是pandas的新手,我尝试过使用pandas对数据集进行排序/过滤和分组。我试图在论坛上寻找一个我目前面临的问题的解决方案,但找不到合适的解决方案。问题是这样的: 我有一个包含两个日期列的数据集,并且基于其他列上的某些条件,我需要将这些日期组合在一起,例如:这是我拥有的输入数据集 Input Data Set 根据列Con1和Co
我有一个很大的CSV文件(300MB),其中包含基于pincodes/zipcode的事故数据。该文件基本上具有头文件和逗号分隔值。关键字段有月、日、年、拼码、计数。Count表示该PIN码的事故计数,但是每个PIN码可以在一天中获得多个条目,例如每隔几个小时。因此,我希望能够计算在给定日期每个PIN码的最大事故数,即我需要按月、日、年、PIN码分组,然后在分组后求和计数?如果我将大文件加载到数据库或云服务(如GCP Big