首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从网站抓取图片

从网站抓取图片
EN

Stack Overflow用户
提问于 2011-10-10 10:15:57
回答 2查看 178关注 0票数 0

我想知道有没有人能给我指明正确的方向。

我有一个相当大的电子表格的产品信息,需要插入一个商店。棘手的一点是,电子表格有一个链接,指向另一个网站的相关页面,其中包含产品的详细信息,而我需要做的是抓取相关的图像并保存在本地,所以我可以使用later.The的理由来解释这一行是有7500个产品……

我的朋友建议我可以使用php & filepopen。

图像确实有一个外部标记ID,我可以引用它。

我在考虑迭代电子表格,这是我必须使用的链接类型。

sku=APCRBC105

图像本身被称为随机的东西,但我想我可以重命名他们,因为我抓住他们到更相关的SKU号码。

  • 因此,按SKU编号迭代电子表格。
  • 通过页面上的相关标识标识图像(我假设它在每个页面上的相同位置)
  • 将图像重命名为正确的SKU号时保存图像

对我怎么做有什么想法吗?手动访问每一页并保存图像7500次的想法似乎不是最好的前进方式!

谢谢你找我

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-10-10 11:10:57

将base_sku从您的链接中删除。

APCRBC105

然后使用curl获取图像页。

http://www.apc.com/products/moreimages.cfm?partnum=APCRBC105

用regex表达式撕开图像链接:

代码语言:javascript
运行
复制
    <div align="center">
<img align="center" src="http://www.apcmedia.com/resource/images/500/Front_Left/35531838-5056-9170-D33F24AE47742E6C_pr.jpg" />
</div>

然后使用卷曲再次撕开实际的图像并保存它。那应该管用..。

票数 0
EN

Stack Overflow用户

发布于 2011-10-10 10:26:39

如果没有任何问题的版权材料,看看谷歌精化。

您可以根据单元格值从网站中获取内容,然后使用它们构建更复杂的场景。请参阅屏风获取更多信息(screencast 3讨论如何通过URL获取值)。

一旦您在电子表格中获得了Image,通过curl或类似的方式获取它们应该是相当容易的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7711320

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档