我想知道是否有人有喜欢的方法/有用的库来处理以制表符分隔的文本文件?这个文件平均有30,000 - 50,000行。只需读取每一行并将其放入数据库中。但是,我需要临时存储所有数据,原因是如果包含数据的表超过1,000,00行,我将需要创建一个新表并将数据放入其中。代码将在windows服务中运行,所以我不担心处理时间。
正在考虑只做一个标准的while(sr.ReadLine()) ...有什么建议吗?
干杯,
肖恩。
发布于 2009-09-26 10:19:34
This library是非常灵活和快速的。我从来没有厌倦过推荐它。默认为',‘作为分隔符,但您可以很容易地将其更改为'\t’。
发布于 2009-09-26 10:32:15
filehelpers
发布于 2009-09-28 00:39:09
我怀疑“将数据放入数据库”至少要比将一行读入缓冲区多花1个数量级的时间,因此您可以预先扫描数据以计算行数(无需解析它们)。然后做出数据库决策。然后重新读取数据,做真正的工作。幸运的是,操作系统将缓存文件,因此读取速度会更快。
https://stackoverflow.com/questions/1480923
复制相似问题