将文本文件的内容存储在DataSet中的方法总结

    项目中比较多的会对文件进行操作,例如文件的上传下载,文件的压缩和解压等IO操作。在.NET项目中较多的会使用DataSet,DataTable进行数据的缓存。

    项目中对文本文件的操作比较简单,但是如果需要将文本文件的内容写入系统的缓存中,操作起来,会稍微的繁琐一些。现在总结一个较为通用的方法,将文本文件的内容缓存进入DataSet数据集中。

        private DataSet _iifSet;

        /// <summary>
        /// 将文本文件转化为DataSet
        /// </summary>
        /// <param name="filePath"></param>
        /// <returns></returns>
        public DataSet Parse(string filePath)
        {

        if (string.IsNullOrEmpty(filePath))         {           throw new ArgumentNullException(filePath);         }

try
            {
                _iifSet = new DataSet();
                var fileText = System.IO.File.ReadAllText(filePath);
                var lines = fileText.Split('\n');
                CreateTables(lines, _iifSet);
                FillSet(lines, _iifSet);
                return _iifSet;
            }
            catch (IOException ex)
            {
                throw new IOException(ex.Message);
            }
            
        }

        /// <summary>
        /// 读取行数组并将其解析为数据集的表
        /// </summary>
        /// <param name="lines">String iif文件中的行数组</param>
        /// <param name="set"></param>
        private void FillSet(IReadOnlyList<string> lines, DataSet set)
        {
            for (var i = 0; i < lines.Count; i++)
            {
                if (IsTableHeader(lines[i]))
                {
                    continue;
                }
                if (lines[i] == "" || lines[i] == "\r" || lines[i] == "\n\r" || lines[i] == "\n")
                {
                    continue;
                }
                if (lines[i].IndexOf(";__IMPORTED__", StringComparison.Ordinal) != -1)
                {
                    continue;
                }
                var line = lines[i];
                while (!IsFullLine(line, set))
                {
                    i++;
                    line += lines[i];
                }
                ParseRecord(line, set);
            }
        }

        /// <summary>
        /// 解析记录
        /// </summary>
        /// <param name="line"></param>
        /// <param name="set"></param>
        private void ParseRecord(string line, DataSet set)
        {
            if (IsTableHeader(line))
            {
                return;
            }
            var tablename = line.Split('\t')[0];
            var parameters = CreateDataRowParams(line, set.Tables[tablename].Columns.Count);
            if (parameters.Length > 0)
                set.Tables[tablename].Rows.Add(parameters);
        }

        private bool IsFullLine(string line, DataSet set)
        {
            if (IsTableHeader(line))
            {
                return true;
            }
            var values = line.Split('\t').Length;
            var tableName = line.Split('\t')[0];
            var columns = set.Tables[tableName].Columns.Count;
            return values >= columns;
        }

        private bool IsTableHeader(string tab)
        {
            return tab.StartsWith("!");
        }


        /// <summary>
        /// 创建datatable
        /// </summary>
        /// <param name="lines"></param>
        /// <param name="set"></param>
        private void CreateTables(IReadOnlyList<string> lines, DataSet set)
        {
            foreach (var t in lines.Where(IsTableHeader))
            {
                set.Tables.Add(CreateTable(t));
            }
        }


        private DataTable CreateTable(string line)
        {
            var values = line.Split('\t');
            values[0] = values[0].Substring(1);
            var dt = new DataTable(values[0]);
            values[0] = null;
            foreach (var name in values)
            {
                if (string.IsNullOrEmpty(name))
                    continue;
                var dc = new DataColumn(name, typeof(string));
                try
                {
                    dt.Columns.Add(dc);
                }
                catch (DuplicateNameException)
                {
                    dc = new DataColumn(name + "_duplicateCol" + dt.Columns.Count);
                    dt.Columns.Add(dc);
                }
            }

            return dt;
        }

        public string GetTableName(string line)
        {
            var values = line.Split('\t');
            if (values[0].StartsWith("!"))
            {
                values[0] = values[0].Substring(1);
            }
            return values[0];
        }

        public readonly static object[] EmptyStringArray = { };

        private object[] CreateDataRowParams(string line, int maxLength)
        {
            var raw = line.Split('\t');
            var length = raw.Length - 1;
            if (length == 0 || maxLength == 0)
                return EmptyStringArray;
            if (length > maxLength)
                length = maxLength;
            var values = new string[length];
            for (var i = 0; i < length; i++)
            {
                values[i] = raw[i + 1];
            }

            if (values[values.Length - 1].EndsWith("\n"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf('\n'));
            }
            else if (values[values.Length - 1].EndsWith("\n\r"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf("\n\r", StringComparison.Ordinal));
            }
            else if (values[values.Length - 1].EndsWith("\r"))
            {
                values[values.Length - 1] = values[values.Length - 1].Substring(0, values[values.Length - 1].LastIndexOf('\r'));
            }

            return values;
        }

        protected virtual void Dispose(bool cleanAll)
        {
            _iifSet?.Dispose();
        }

        public void Dispose()
        {
            Dispose(true);
            GC.SuppressFinalize(this);
        }

     有关dataset的一些常用的操作,基本属性和方法在这里就不做介绍了。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大内老A

The .NET of Tomorrow

Ed Charbeneau(http://developer.telerik.com/featured/the-net-of-tomorrow/) Exciti...

39110
来自专栏张善友的专栏

LINQ via C# 系列文章

LINQ via C# Recently I am giving a series of talk on LINQ. the name “LINQ via C...

3015
来自专栏飞扬的花生

jsencrypt参数前端加密c#解密

      写程序时一般是通过form表单或者ajax方式将参数提交到服务器进行验证,如何防止提交的请求不被抓包后串改,虽然无法说绝对安全却给非法提交提高了难度...

4239
来自专栏魂祭心

原 canvas绘制clock

5154
来自专栏pangguoming

Spring Boot集成JasperReports生成PDF文档

由于工作需要,要实现后端根据模板动态填充数据生成PDF文档,通过技术选型,使用Ireport5.6来设计模板,结合JasperReports5.6工具库来调用渲...

1.4K7
来自专栏落花落雨不落叶

canvas画简单电路图

85911
来自专栏张善友的专栏

Miguel de Icaza 细说 Mix 07大会上的Silverlight和DLR

Mono之父Miguel de Icaza 详细报道微软Mix 07大会上的Silverlight和DLR ,上面还谈到了Mono and Silverligh...

3007
来自专栏跟着阿笨一起玩NET

c#实现打印功能

3752
来自专栏陈仁松博客

ASP.NET Core 'Microsoft.Win32.Registry' 错误修复

今天在发布Asp.net Core应用到Azure的时候出现错误InvalidOperationException: Cannot find compilati...

5248
来自专栏一个会写诗的程序员的博客

Spring Reactor 项目核心库Reactor Core

Non-Blocking Reactive Streams Foundation for the JVM both implementing a Reactiv...

2822

扫码关注云+社区