我已经尝试了一段时间,阅读他们的文档,但我仍然觉得我不能完全掌握它。我看到了他们对任意python对象进行序列化的depcrecated方法,但由于它已被弃用,我想知道保存对象列表或任意python对象的正确方法是什么?
什么时候你还想费心使用pyarrow呢?
发布于 2020-11-04 07:32:35
PyArrow是用于(Apache)箭头的python binding。Arrow是一个跨语言的规范,它描述了如何在内存中存储列数据。它充当数据处理应用程序和库的内部结构,允许它们有效地处理大型表格数据集。
什么时候你还想费心使用pyarrow呢?
PyArrow的一个简单用例是在Pandas/Numpy/dict和Parquet文件格式之间转换。这是一种可移植性更强的格式,例如,pickle。它还允许您以可移植的方式嵌入自定义元数据。
https://stackoverflow.com/questions/64583567
复制相似问题