我想下载DNA序列的表达数据。在页面上,图形( png图像)总是页面上的第6、第7或第8图像,但我不想每次下载2张额外的图像。
检查页面上的图像会产生<img src="../trash/hgc/gtexGene_genome_6d0b_5d5220.png" border="1">
,尽管链接中的最后几个数字每次都会发生变化。
在我的代码中,我
my $image = $mech1->find_image( alt_regex => qr/gtexGene/i );;
$mech1->get($image -> URI);
$mech1->save_content("exp.png");
这不起作用。
如果只下载图片链接中的某些内容,我如何下载?
发布于 2016-11-11 14:50:24
您使用的是alt_regex
,它对alt
属性执行模式匹配。您需要的是src
属性,因此需要 instead。
url => 'string',
和url_regex => qr/regex/,
酌情根据字符串或regex匹配图像的URL。URL可能是一个相对URL,如foo/bar.html,这取决于它在页面上的编码方式。
所以你的代码应该这样读。
my $image = $mech->find_image( url_regex => qr/gtexGene/i );
只对大小写不敏感的情况使用/i
修饰符,如果您真的希望它不区分大小写.
https://stackoverflow.com/questions/40550394
复制相似问题