首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【js】Mammoth.js的使用:将.docx 文件转换成HTML

【js】Mammoth.js的使用:将.docx 文件转换成HTML

作者头像
全栈程序员站长
发布2022-11-15 18:20:18
发布2022-11-15 18:20:18
10.9K00
代码可运行
举报
运行总次数:0
代码可运行
  • docx文档预览
  • FileReader 对象
  • Blob对象

只能转换.docx文档,转换过程中复杂样式被忽略。(居中、首行缩进等)

API

  • mammoth.convertToHtml(input, options) :把源文档转换为 HTML 文档
  • mammoth.convertToMarkdown(input, options) :把源文档转换为 Markdown 文档。
  • mammoth.extractRawText(input) :提取文档的原始文本。这将忽略文档中的所有格式。每个段落后跟两个换行符。

Demo HTML文件

代码语言:javascript
代码运行次数:0
运行
复制
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<meta http-equiv="X-UA-Compatible" content="ie=edge">
<title>test</title>
</head>
<body>
<div class="container">
<input id="document" type="file" />
<div class="row" style="width: 100%;">
<div class="span8">
<div id="output" class="well"></div>
</div>
</div>
</div>
<script src="https://cdn.bootcss.com/mammoth/1.4.8/mammoth.browser.js"></script>
<script type="text/javascript">
document.getElementById("document")
.addEventListener("change", readFileInputEventAsArrayBuffer, false);
function displayResult(result) { 

let html = result.value;
let newHTML = html.replace(//g, '')
.replace('<h1>', '<h1 style="text-align: center;">')
.replace(/<table>/g, '<table style="border-collapse: collapse;">')
.replace(/<tr>/g, '<tr style="height: 30px;">')
.replace(/<td>/g, '<td style="border: 1px solid pink;">')
.replace(/<p>/g, '<p style="text-indent: 2em;">');
document.getElementById("output").innerHTML = newHTML;
}
function readFileInputEventAsArrayBuffer(event) { 

var file = event.target.files[0];
var reader = new FileReader();
reader.onload = function (loadEvent) { 

var arrayBuffer = loadEvent.target.result;//arrayBuffer 
mammoth.convertToHtml({ 
 arrayBuffer: arrayBuffer })
.then(displayResult)
.done();
};
reader.readAsArrayBuffer(file);
}
</script>
</body>
</html>

Jetbrains全家桶1年46,售后保障稳定

项目中的应用: 后端返回二进制。

代码语言:javascript
代码运行次数:0
运行
复制
var xhr = new XMLHttpRequest();
xhr.open(
"GET",
`${ 
url}/web/showWordDownload?companyId=${ 
that.companyId}`
);
xhr.responseType = "arraybuffer";
xhr.onload = function (e) { 

let content = xhr.response;
let blob = new Blob([content], { 
 type: "application/pdf" });
let reader = new FileReader();
reader.readAsArrayBuffer(blob);
reader.onload = function (loadEvent) { 

var arrayBuffer = xhr.response; //arrayBuffer
mammoth
.convertToHtml({ 
 arrayBuffer: arrayBuffer })
.then(displayResult)
.done();
};
function displayResult(result) { 

document.getElementById("output").innerHTML =result.value;
}
};
xhr.send();

FileReader对象

FileReader对象,可以读取计算机本地文件 或数据缓冲 进行处理。 创建对象 : let reader = new FileReader();

方法

描述

readAsArrayBuffer(file)

异步按字节读取文件内容,结果用ArrayBuffer对象表示。简单理解为存放了一段二进制数据的内存空间

readAsBinaryString(file)

异步按字节读取文件内容,结果为文件的二进制串

readAsDataURL(file)

结果用data:url的字符串形式表示【base64编码后输出】

事件

描述

onload

读取成功完成时调用

使用:

代码语言:javascript
代码运行次数:0
运行
复制
let input = document.getElementById('input');
input.onchange = function(){ 

let file = this.files[0];
let reader = new FileReader();
reader.readAsArrayBuffer(file);
reader.onload = function(){ 

//读取完成
console.log(this.result);// this.result 为结果
}
}

应用场景: 1.在线预览本地文件。(图片 readerAsDataURL) 2、二进制数据上传。 input【type=“file”】 readAsArrayBuffer => xhr 将读取的结果发给后端。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/227298.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月30日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • API
  • Demo HTML文件
  • FileReader对象
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档