首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

(数据科学学习手札89)geopandas&geoplot近期重要更新

2 geopandas&geoplot近期重要更新内容 2.1 geopandas近期重要更新 2.1.1 新增高性能文件格式   从geopandas0.8.0版本开始,在矢量文件读写方面,新增了.feather...图1   在将geopandas更新到0.8.0版本后,便新增了read_feather()、to_feather()、read_parquet()以及to_parquet()这四个API,但要注意,这些新功能依赖于...图3   具体的性能比较结果如下,可以看到与原始的shapefile相比,feather与parquet取得了非常卓越的性能提升,且parquet的文件体积非常小: 类型 写出耗时 读入耗时 写出文件大小...shapefile 325秒 96秒 619MB feather 50秒 25.7秒 128MB parquet 52.4秒 26秒 81.2MB   所以当你要存储的矢量数据规模较大时,可以尝试使用...feather和parquet来代替传统的文件格式。

82020

geopandas&geoplot近期重要更新

2 geopandas&geoplot近期重要更新内容 2.1 geopandas近期重要更新 2.1.1 新增高性能文件格式 从geopandas0.8.0版本开始,在矢量文件读写方面,新增了.feather...Arrow项目下的重要数据格式,提供高性能文件存储服务,使得我们可以既可以快速读写文件,又可以显著减少文件大小,做到了“多快好省”: 图1 在将geopandas更新到0.8.0版本后,便新增了read_feather...()、to_feather()、read_parquet()以及to_parquet()这四个API,但要「注意」,这些新功能依赖于pyarrow,首先请确保pyarrow被正确安装,推荐使用conda...的文件体积非常小: 类型 写出耗时 读入耗时 写出文件大小 shapefile 325秒 96秒 619MB feather 50秒 25.7秒 128MB parquet 52.4秒 26秒 81.2MB...所以当你要存储的矢量数据规模较大时,可以尝试使用feather和parquet来代替传统的文件格式。

74130

Pandas DataFrame 数据存储格式比较

compression) elif file_name.endswith('.orc') : df.to_orc(file_name) elif file_name.endswith('.feather...') : df.to_feather(file_name) elif file_name.endswith('.h5') : df.to_hdf(file_name, key= 'df')...df.parquet','snappy'], ['df.parquet','gzip'], ['df.orc','default'], ['df.feather...我们对测试的结果做一个简单的分析 CSV 未压缩文件的大小最大 压缩后的尺寸很小,但不是最小的 CSV的读取速度和写入速度是最慢的 Pickle 表现得很平均 但压缩写入速度是最慢的 Feather 最快的读写速度...总结 从结果来看,我们应该使用ORC或Feather,而不再使用CSV ?是吗? “这取决于你的系统。” 如果你正在做一些单独的项目,那么使用最快或最小的格式肯定是有意义的。

17230
领券