我有一批50-60个csv文件,不管是什么原因,每个文件的前四行都有垃圾数据。然而,在垃圾数据之后,列标题被正确地列出,并且文件的其余部分是正常的。我该如何在python中剥离每个文件的前四个文件呢?到目前为止,我的代码如下:total = open('C:\\Csv\\201.csv', 'rb') p
我对此非常陌生,但昨天我开始从网站中提取数据(项目名称及其相应价格),并研究如何使用Python2.7为给定网站创建csv文件的格式:价格、项目名称。现在我有了一些数据集,我想比较它们,并得到一个给定的项目名称的平均价格。我现在遇到的问题是项目名称(可能)在每个网站上略有不同。例如,我的第一个数据集提供了csv文件。Disney's Peter Pan5.0, Up (DVD)6.0, &