我正在进行一项临床试验,我们有几个站点向我们发送EHR数据。这些网站目前正在excel文件中发送数据。我觉得有人在打开这些文件,因为其中3个文件有64,999行,excel 2007的截止时间是65,000行。
我在python工作,但我试图阻止本地站点的人打开excel中的文件。
如果文件不能在excel中打开和切断,那么发送给我的文件的最佳格式是什么?不幸的是,csv也可以在excel中打开。
发布于 2019-10-24 17:38:32
如果您正在使用python,我建议使用Numpy的npy格式。NPY文件是由安装了NumPy库的NumPy软件包创建的NumPy数组文件。它包含一个以NumPy文件格式保存的数组。NPY文件存储在任何计算机上重构数组所需的所有信息,其中包括dtype和形状信息。
您还可以考虑使用hdf或hdf5格式,这两种格式都在Python中得到支持。层次数据格式(HDF)是一种用于存储大量数值数据的开源文件格式。它通常用于研究应用(气象学、天文学、基因组学等)。在不使用数据库的情况下分发和访问非常大的数据集。可以使用HDF5数据格式对大型数据集进行相当快的序列化。
https://datascience.stackexchange.com/questions/62165
复制相似问题