我在HDF5文件中保存了一个pandas.DataFrame。DataFrame由多个列组成,大小非常大。HDF5文件中每个表的大小都大于2 2GB。对于分析,希望仅将表的列的子集加载到存储器中。使用SQLite3,这是一项微不足道的工作。只需使用"select column1,colum2,... from table1“查询即可。在Python中有没有一种简单的方法可以做到这一点?请注意,pandas.read_hdf不
我的问题是,一些excel工作表有非常多的空行,例如下面的3. Access Control工作表有1048534行和16384列,尽管只有前100行是非空的。openpyxl是否支持过滤所有这些多余的行,并且只返回包含至少一个非空单元格的一组行? >>> for ws in wb.worksheets:
...