我正在寻找内存效率高的HTML转换,类似于html2text CLI,但是我遇到的问题是在大型文件上占用太多内存。
例如,对于300 by的长HTML文件(仅包含长表),它可以占用3GB的内存,这样内核就会杀死它:
Jan 9 00:42:16 kernel: Out of memory in UB 191: OOM killed process 27293 (html2text) score 0 vm:3075332kB, rss:1818104kB, swap:993020kB
Jan 9 00:42:48 kernel: Out of memory in UB 191: OOM ki
我试图删除html内容的标签,而不改变它的格式。我已经尝试过HTML::带状和HTML: giving,但是它没有给出预期的输出。
我需要得到输出
Heading
point 1
point 2
这是我的密码
use strict;
use warnings;
use HTML::Restrict;
use HTML::Strip;
my $hs = HTML::Strip->new();
my $hr = HTML::Restrict->new();
my $tree = '<div><span itemprop="description"
大家好,我正在写一个abir John,想要找到时钟Javascript文件
,即在javascript文件中添加代码,然后在index.html文件中链接
function clock(){
var hour = document.getElementById('hour');
var minute = document.getElementById('minute');
var seconds= document.getElementById('seconds');
var amp= document.getElementById('