我想知道有没有人能给我指明正确的方向。
我有一个相当大的电子表格的产品信息,需要插入一个商店。棘手的一点是,电子表格有一个链接,指向另一个网站的相关页面,其中包含产品的详细信息,而我需要做的是抓取相关的图像并保存在本地,所以我可以使用later.The的理由来解释这一行是有7500个产品……
我的朋友建议我可以使用php & filepopen。
图像确实有一个外部标记ID,我可以引用它。
我在考虑迭代电子表格,这是我必须使用的链接类型。
sku=APCRBC105
图像本身被称为随机的东西,但我想我可以重命名他们,因为我抓住他们到更相关的SKU号码。
对我怎么做有什么想法吗?手动访问每一页并保存图像7500次的想法似乎不是最好的前进方式!
谢谢你找我
发布于 2011-10-10 11:10:57
将base_sku从您的链接中删除。
APCRBC105
然后使用curl获取图像页。
http://www.apc.com/products/moreimages.cfm?partnum=APCRBC105
用regex表达式撕开图像链接:
<div align="center">
<img align="center" src="http://www.apcmedia.com/resource/images/500/Front_Left/35531838-5056-9170-D33F24AE47742E6C_pr.jpg" />
</div>然后使用卷曲再次撕开实际的图像并保存它。那应该管用..。
发布于 2011-10-10 10:26:39
如果没有任何问题的版权材料,看看谷歌精化。
您可以根据单元格值从网站中获取内容,然后使用它们构建更复杂的场景。请参阅屏风获取更多信息(screencast 3讨论如何通过URL获取值)。
一旦您在电子表格中获得了Image,通过curl或类似的方式获取它们应该是相当容易的。
https://stackoverflow.com/questions/7711320
复制相似问题