我正计划建立一个网站,在那里我可以分享我精心挑选的内容,而且我不能把这些数据输入到我的网站而不经过API的基本想法。
我首先想,也许我应该检查我想嵌入到我的站点上的页面的源HTML,并使用类似于$('div.post').find('img').attr('src')的东西访问它。但我无法想象自己每次都这么做,所以我想肯定有更好的方法。
这就是Google+对他们的帖子所做的。一旦您添加了一个url链接,再过一秒钟,它就会从链接的页面中提取一些有特色的图像和一些文本片段。
发布于 2015-09-28 11:23:12
许多网站使用开放图协议来获取任何网址的元标题、元描述、图像等。
例如,open: view:https://blog.kissmetrics.com/open-graph-meta-tags/和搜索"Open“。
它们包含在页面源中。您必须发送一个请求到您想要从其中爬行的URL,并通过常规Expr / HTML解析器读取适当的元标记。
https://stackoverflow.com/questions/32821745
复制相似问题