昨天在一次面试中,我被问到这个问题,我提供的答案似乎没有给面试官留下深刻的印象。:(
这是一个场景。文件在新行分隔的记录中具有逗号分隔的属性值。要求此文件必须进入具有匹配的列序列的数据库表中。该文件有一个自引用列,即一列" id“保存该记录的唯一非空id,另一列"LinkId”包含其他记录的id。该值可以为空。
要求:该文件必须插入到数据库中的相同顺序,但所有的一次!这意味着没有多个插入。
问:如何在.Net框架中最好地实现这一点(您可以使用最新的4.0框架)
我给出的解决方案是:逐行读取文件并将其解析为所需的XML。然后使用DataTable.ReadXML()调用将文件立即加载到数据表中,并提交保存数据表的数据集。
挑战:
一个100 GB的文本文件怎么样?它会这样工作吗?功能会变得多慢?如果我们必须在内存中存储100 GB的数据,那么系统的虚拟地址空间会支持它吗?页面交换不会导致问题和变慢吗?
DataTable.ReadXML()能处理这么大的XML吗?数据集是否能够提交?
我的回答是:
有什么想法吗,伙计们?
谢谢哈里什。
发布于 2011-06-01 11:30:52
如果使用的是SQL Server,则可以使用BULK INSERT命令
http://msdn.microsoft.com/en-us/library/ms188365.aspx
基本上,您设置了一个SQLCommand对象,将CommandText设置为如下所示:
sqlCommand.CommandText = "BULK INSERT " & tableName & " FROM '" & file & "' WITH(TABLOCK, FIELDTERMINATOR=',')
sqlCommand.ExecuteNonQuery()tableName -是要插入的表格的名称。
文件-是希望SQL Server读取的文件的名称。您需要确保SQL Server可以到达存储文件的位置。这包括ACL权限和网络连接。
BULK INSERT命令有很多选项,我以前用过它,它工作得很好。
https://stackoverflow.com/questions/6195796
复制相似问题