我正在尝试抓取一个网站(相信它是在JavaScript)使用一个简单的PHP脚本。我是一个初学者,所以任何帮助都会非常感谢。该网页的URL为:
http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/Yes-Bank-Ltd/532648
因此,例如,在这里,我想传递get_file_contents中的公司名称(Yes-Bank-Ltd)和代码(532648)。不知道该怎么做,所以有人能帮我吗?
谢谢,Nidhi
发布于 2011-07-12 02:16:49
为什么不在url中添加公司的字符串和代码呢?这里有一个想法,你填充一个公司和代码的数组(需要相同的大小),然后循环它们来抓取你想要的数据。
for($i=0;$i<count($listOfCie);$i++)
{
$cie = $listOfCie[$i];
$code = $listOfCode[$i];
$urlToScrape = "http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/" . $cie . "/" . $code
//... = get_file_contents($urlToScrape....
}
发布于 2011-07-12 02:21:07
使用YQL!http://developer.yahoo.com/yql/console中的data.html表
发布于 2018-01-17 19:11:17
在PHP中抓取站点的最简单方法是使用curl
(http://php.net/manual/en/book.curl.php)
比如http://php.net/manual/en/curl.examples-basic.php或谷歌:)
但是,如果网站依赖于javascript,那么就很难获得你想要的数据。您可能会看到像http://phantomjs.org/这样的“无头浏览器”
https://stackoverflow.com/questions/6654541
复制相似问题