在JavaScript中,去除文本格式通常指的是将富文本(包含HTML标签或其他格式)转换为纯文本。以下是一些常见的方法和相关概念:
通过创建一个DOM元素,将富文本设置为其innerHTML
,然后获取其textContent
或innerText
。
function stripHtml(html) {
var doc = new DOMParser().parseFromString(html, 'text/html');
return doc.body.textContent || "";
}
// 示例
var richText = "<p>Hello <strong>World</strong>!</p>";
var plainText = stripHtml(richText);
console.log(plainText); // 输出: Hello World!
通过正则表达式去除HTML标签。
function stripHtml(html) {
return html.replace(/<[^>]*>/g, '');
}
// 示例
var richText = "<p>Hello <strong>World</strong>!</p>";
var plainText = stripHtml(richText);
console.log(plainText); // 输出: Hello World!
例如,使用sanitize-html
库来去除HTML标签。
const sanitizeHtml = require('sanitize-html');
var richText = "<p>Hello <strong>World</strong>!</p>";
var plainText = sanitizeHtml(richText, { allowedTags: [] });
console.log(plainText); // 输出: Hello World!
)。可以使用he
库来解码这些字符。const he = require('he');
function stripHtml(html) {
var doc = new DOMParser().parseFromString(html, 'text/html');
return he.decode(doc.body.textContent || "");
}
// 示例
var richText = "<p>Hello <strong>World</strong>!</p>";
var plainText = stripHtml(richText);
console.log(plainText); // 输出: Hello World!
通过以上方法,你可以有效地去除JavaScript中的文本格式,确保文本的安全性和一致性。
领取专属 10元无门槛券
手把手带您无忧上云