不仅如此,Arrow还定义了IPC格式,序列化内存中的数据,进行网络传输,或者把数据以文件的方式持久化。
开发库:arrow定义的格式是与语言无关的,所以任何语言都能实现Arrow定义的格式。...Libraries are available for C, C++, C#, Go, Java, JavaScript, Julia, MATLAB, Python, R, Ruby, and Rust...arrow限制了array的最大长度,当结果集(或者表)的大小超过了array的最大长度,就需要把结果集水平切分成多个有序集合。...序列化与进程间通信(IPC)
之前已经提到了,多个长度相同的array组成的有序集合可以用来表示结果集的子集(或者部分的表),arrow称这个有序集合为Record Batch。...(这里并没有讨论dictionary encoding的情况)
反思
在传统的编程世界中,数据只存放与oltp database中(比如说MySQL),application通过JDBC或者ODBC等标准接口和数据库进行交互