专栏首页前端儿前端读取Excel报表文件

前端读取Excel报表文件

在实际开发中,经常会遇到导入Excel文件的需求,有的产品人想法更多,想要在前端直接判断文件内容格式是否正确,必填项是否已填写

依据HTML5的FileReader,可以使用新的API打开本地文件(参考这篇文章

  • FileReader.readAsBinaryString(Blob|File)
  • FileReader.readAsText(Blob|File, opt_encoding)
  • FileReader.readAsDataURL(Blob|File)
  • FileReader.readAsArrayBuffer(Blob|File)

通过 readAsBinaryString 虽然能打开二进制文件(*.pdf、*.doc、*.xls等),但如若要直接通过JS进行判断这些二进制数据是否符合要求,是不行的

所以就需要转换,对于Excel文件的内容分析转换,已经有了比较成熟的解决方案:js-xlsx 

其实现方式也用到了上述新特性,看看具体要怎么用

1. 首先定义一个文件上传项

<input type="file" id="excel-file">

2. 下载js-xlsx的相应的 xlsx.core.min.js 文件后引入

<script type="text/javascript" src="xlsx.core.min.js"></script>

3. 监听文件选择,即时打开文件获取表格内容

使用XLSX.utils.sheet_to_json方法解析表格对象返回相应的JSON数据

    $('#excel-file').change(function(e) {
            var files = e.target.files;

            var fileReader = new FileReader();
            fileReader.onload = function(ev) {
                try {
                    var data = ev.target.result,
                        workbook = XLSX.read(data, {
                            type: 'binary'
                        }), // 以二进制流方式读取得到整份excel表格对象
                        persons = []; // 存储获取到的数据
                } catch (e) {
                    console.log('文件类型不正确');
                    return;
                }

                // 表格的表格范围,可用于判断表头是否数量是否正确
                var fromTo = '';
                // 遍历每张表读取
                for (var sheet in workbook.Sheets) {
                    if (workbook.Sheets.hasOwnProperty(sheet)) {
                        fromTo = workbook.Sheets[sheet]['!ref'];
                        console.log(fromTo);
                        persons = persons.concat(XLSX.utils.sheet_to_json(workbook.Sheets[sheet]));
                        // break; // 如果只取第一张表,就取消注释这行
                    }
                }

                console.log(persons);
            };

            // 以二进制方式打开文件
            fileReader.readAsBinaryString(files[0]);
        });

上述代码只是简单地获取表格文件的内容,如果要判断,还得根据实际加上一些判断逻辑

js-xlsx只能读取相关的文件,否则会报错

4. 表格文件内容

使用一个excel表格,定义了三张表

5. 查看获取到的数据

红框部分为三个表项的不同之处,看看代码执行之后的结果:

第一个红框是每张表的数据范围,由于js-xlsx这个库自身的问题,它是不会直接获取到表头数据保存起来的,而是直接把表头放到最末级的内容对象里面

可自行逐级看看读取到的表格workbook对象内容:

如果要判断表头的数量,就需要使用到!ref属性

在excel文件中,A1:D3中的字母指代列待号,紧接其后的数字指代行号,所以判断表头数量,即为判断列号数量

比如第一张表有四个表头,所以为A-D;第三张表有五个表头,所以为A-E,如

if (fromTo[0] === 'A' && fromTo[3] === 'D') {
     excelIsOk = true;
}

 这只是单单判断表头数量,还得判断表头内容

            console.log(persons);

                var headStr = '姓名,性别,年龄,学校';
                for (var i = 0; i < persons.length; i++) {
                    if (Object.keys(persons[i]).join(',') !== headStr) {
                        persons.splice(i, 1);
                    }
                }

                console.log(persons);

可以看到,倒数第二项的JSON数据,因为表头内容不匹配,被过滤掉了

这里还得注意的是最后一项,虽然有个表头,但因为没有内容,所以得到的JSON是符合要求的,所以就需要用到那个!ref属性来共同判断表格是否符合要求

6. 其他

除此之外,还有更多用法如XLSX.readFile、XLSX.writeFile等,具体就看看官方文档

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ES6笔记(4)-- Symbol类型

    类似字符串String的声明方式 var str = 'str'; Symbol的声明方式类似,它调用构造函数Symbol()

    书童小二
  • 不高兴的小明

    小明又出问题了。妈妈认为聪明的小明应该更加用功学习而变的更加厉害,所以小明除了上学之外,还要参加妈妈为他报名的各科复习班。另外每周妈妈还会送他去学习朗诵、舞蹈和...

    书童小二
  • 基于Node.js实现一个小小的爬虫

    从拉钩招聘网站中找出“前端开发”这一类岗位的信息,并作相应页面分析,提取出特定的几个部分如岗位名称、岗位薪资、岗位所属公司、岗位发布日期等。并将抓取到的这些信息...

    书童小二
  • underscore 诞生记(二)—— 链式调用与混入(mixin)

    如果你还没看过第一篇文章,请点击 “underscore 诞生记(一)—— 基本结构搭建”

    小皮咖
  • 我是如何做到在 5 分钟之内将应用大小减少 60% 的?

    移动设备的资源总是有限的。有限的电量,有限的存储,有限的处理能力,有限的内存,有限的网络带宽……无论你面对的是 Android 还是 iOS,这都是真理。

    Android技术干货分享
  • 数字产品经理的学习力

    当很多人看到《数字产品经理的培养》中,所提到的知识图谱和实践技能时,第一反应是:“做到这些好难啊”。这的确不太容易。但无论起点如何,决定是否能获取到这些技能的一...

    ThoughtWorks
  • 基于mysqldump聊一聊MySQL的备份和恢复

    Hi,大家好,我是麦洛,今天我们聊聊MySQL的备份和恢复,在下面文章中,你会了解到MySQL常见的备份类型,以及基于mysqldump命令在日常开发中如何做M...

    麦叔
  • 如何才能成为一名自然语言处理工程师?

    自然语言处理和大部分的机器学习或者人工智能领域的技术一样,是一个涉及到多个技能、技术和领域的综合体。

    人工智能的秘密
  • 剑指Offer的学习笔记(C#篇)-- 序列化二叉树

    二叉树的序列化,是将一个结构化的东西变成扁平化的字符串,序列化二叉树或者是反序列化二叉树就是二叉树和扩展二叉树遍历序列之间的转换。将二叉树中的没...

    WeiMLing
  • 如何成为一名自然语言处理工程师

    用户1737318

扫码关注云+社区

领取腾讯云代金券