假设我将以编程的方式从互联网获得10万本开放的访问书籍,作为文本字符串。我的目的是对它们做一些分析(用熊猫)。我已经在我的应用程序的某些部分使用mongodb,但是我不认为将它放在一个挂件中并将它转移到另一台机器是不容易的。Sqlite是可移植的,但我讨厌编写sql。我看到的其他选项是将其作为单独的文本文件或hdf5放在文件系统中。
hd
我已将dict of arrays保存到计算机上的.npy文件中。如果我把它作为文本文件打开,就会看到一个混乱的ASCII字符,因为我不仅仅是在保存数组。我可以在Python中通过np.load看到它的内容,但我想知道是否有一个GUI可以让我直接查看文件的内容,即不需要经过python控制台?基本上:如果我返回,我会将它保存为一个json或hdf5文件,这样我就可