tl;博士:我想一次加载一个XML文件,然后一次又一次地重用它。
我有一些javascript,它向一个PHP页面发出ajax请求,该页面收集并解析一些XML并将其返回给显示(例如,有4000个节点,PHP将结果分页为100块,您将有40个“页面”的数据)。如果有人单击其他页面中的一个(除了最初加载的页面),则会发出另一个请求,PHP加载该大XML文件,抓取索引的子集(如记录200-299)并返回它们以供显示。我的问题是,是否有一种方法只加载该XML文件一次,然后重复使用它?
每个ajax请求的过程是:
- load the xml file (simplexml\_load\_file()
我有一个网站,其中有很少的数据存在,一些数据是在分页格式。但是,当我尝试使用view-source来获取url的HTML数据时,却没有在其中找到分页数据。并且当我转到分页数据的第二列时,url也不改变。
我的问题是:
How to fetch the hidden data or data that is bought by Javascript into the HTML format
希望你们都能接受我的问题。提前感谢
更新部分:-
我基本上是在尝试抓取数据,所以当我输入url并尝试抓取数据时,我将无法获得所需的数据,因为数据不是以HTML格式存在的,而是由Javascript/JQue
可能重复: 什么是重复的内容,我如何避免它在我的网站上受到惩罚?
我现在正在建一个约会网站。在主页上,我有一个分页的名单,所有成员在网站上。每个页面显示从最新到最老的10个成员。分页只是简单的"<< Prev“和"Next >>”链接,所以Googlebot应该能够抓取站点上的每个成员配置文件。
现在问题是,这些配置文件列表也会出现在其他页面上。一个列表块,如:
-------------------------------------
<IMAGE>
Jill / 28 / Straight
New York, NY
Likes: l
我感兴趣的想法是建立一个画廊的数百个美丽的图像,我已经收集了整个夏威夷使用一个页面,使用无休止的寻呼某种类型。每一个都有一个描述,一个背景故事,h2标题等等。我将使用php作为我的后端语言。
搜索引擎是否能够使用这种方法抓取所有图像/文本?
您能建议一些已经创建的插件,值得为无休止的分页检查吗?
我希望能够添加滚动到锚标签在这个页面上。使用下面的代码,它是否仍能正常工作,用于使用无休止滚动创建的锚标记?
//Direct link scrolls to anchor tag
URL: example.com/gallery#mountain
<a name="mountain
我有一个脚本,它可以抓取一个特定的网站,其中一个页面的数量是用?start={}定义的。。
这是我的剧本:
from bs4 import BeautifulSoup
from urllib.request import urlopen
def parse():
for i in range(0, 480, 5):
html = urlopen('http://rl.odessa.ua/index.php/ru/poslednie-novosti?start={}'.format(i))
soup = BeautifulSoup(htm
我正在尝试刮一个具有AJAX分页html表的网页。我可以很好地获得表格的第一页,但我希望能够得到表中的每一页。这里是ajax分页表的。
这是我目前正在抓取的第一页:
<?php
include_once('simple_html_dom.php');
class JobPosting {
var $Id;
var $RequistionNumber;
var $Title;
var $JobCategory;
var $EmployeeClassification;