场景:我正在开发一个rails应用程序,它将以上传的基于文本的文件的形式进行数据输入。在导入数据之前,我需要解析这些文件。我可以选择上传到应用程序的文件类型;上传者使用的软件(Microsoft Access)有几个有关文件类型的导出选项。
虽然它可能无关紧要,但我想知道是否有特定的文件类型是最有效的解析。我相信,这个问题可以被看作是与语言无关的。
(虽然XML通常被解析,但对于本项目而言,它不是一种可行的文件类型。)
发布于 2010-05-06 22:03:38
如果它是通过Access导出的,那么最简单的就是CSV;特别是因为Ruby在standard library中包含了CSV解析器。您将不得不做一些工作来确定CSV的方言(它使用什么作为分隔符,它如何处理引号);我不知道ruby解析器对这些问题的健壮性如何,但您也应该从Microsoft Access获得一些控制。
发布于 2010-05-06 21:47:00
你可能想看看JSON。它是一种轻量级的格式,与XML相比,它的解析非常容易和干净,不需要在后端使用巨大的库。
它可以表示字符串、数字、关联数组(对象)等类型
发布于 2010-05-06 21:48:43
我建议对不包含n的数据使用n-SV (其中n是一些字符),这将使词法分析文件成为一个split
问题。
如果您有更灵活的数据,我建议使用JSON。
https://stackoverflow.com/questions/2784746
复制相似问题