开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >从缓存内存访问html文件

问从缓存内存访问html文件
EN

Stack Overflow用户

提问于 2013-07-23 17:10:18

回答 2查看 127关注 0票数 0

我正在用python编写代码，它可以完成以下工作: 1)从internet获取html文件。2)提取其urls。3)将这些urls与搜索键进行比较，并打开用户希望打开的正确的网页。我使用以下代码：

def open_page(name):

    try:
        links = lxml.html.parse('http://www.w3schools.com/html/').xpath("//a/@href")
        for url in links:
            if re.search(name, url):
                self.get_webpage.open('http://www.w3schools.com/html/'+url)
                break
    except IndexError as e:
        pass`

我不得不在我的模块中多次调用这个方法，这使得打开网页的过程非常缓慢。我试着检查这个方法的每一行的执行时间，并且知道lxml.html.parse()大部分时间都在消耗。另外，如果我尝试使用一些存储在本地系统中的html文件，这种方法可以快速工作。是否有任何方式可以从缓存第一次从这个网页http://www.w3schools.com/html/的html文件？附注：我不想将这个html文件永久保存在我的本地系统中，因为在这种情况下，我可能会错过这个html文件上的更新/更改。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-07-23 17:36:03

听起来你确实想要缓存页面，但是你也想检查一下，自从你上次下载页面以来，没有任何变化。

如果-修改-自 header是您在这方面的朋友。在发出HTTP请求时，可以为该标头字段提供上次下载页面的时间。如果从那时起，服务器上的页面没有改变，服务器将返回一个304未修改状态代码，并且不会发送页面内容，从而避免了再次下载它的麻烦。

下面是如何在Python 2中这样做：

import contextlib
import datetime
import urllib2

with contextlib.closing(urllib2.urlopen(urllib2.Request(
        "http://www.w3schools.com/html/",
        headers={"If-Modified-Since": last_access_time}))) as u:
    if u.getcode() != 304:
        cached_html = lxml.html.parse(u)
        last_access_time = datetime.datetime.now()
html = cached_html

last_access_time和cached_html很可能存储在磁盘上。

票数 1

EN

Stack Overflow用户

发布于 2013-07-23 17:16:49

您可以使用时间戳将html存储在一起，并且只有在html太旧的情况下才可以下载html。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17823574

复制

相关文章

nginx 访问.php文件正常，访问.html文件500错误

phpmyadmin nginx php

Nginx遇上Access Denied提示怎么解决这几天在摆弄linux下面的各种服务器，对nginx非常有兴趣。

友儿

2022/09/11

1.7K0

用imdisk创建内存盘存放缓存文件提高访问速度

云服务器 windows server windows

当下内存条和SSD硬盘都比两三年前便宜很多了，2000元内配个16G内存的AMD台式机(含1080P显示器)就完全够日常办公用了，如果有条件搞2个3600MHz的16G内存条组成双通道超频到3933MHz甚至4133Hz甚至更高就更完美了。为了让内存发挥更大的作用，可以创建内存盘来放缓存，甚至一些业务都完全可以跑在内存盘里，这样访问很快。下面说说内存盘怎么实施：

Windows技术交流

2023/09/12

2.8K0

Android RxJava应用：从磁盘/内存缓存中获取缓存数据

android java 缓存腾讯云开发者社区

Rxjava，由于其基于事件流的链式调用、逻辑简洁 & 使用简单的特点，深受各大 Android开发者的欢迎。

Carson.Ho

2022/03/25

2.3K0

Android RxJava应用：从磁盘/内存缓存中获取缓存数据

Android RxJava 实战系列：从磁盘 / 内存缓存中获取缓存数据

Carson_Ho的Github地址 = RxJava2实战系列：从磁盘 / 内存缓存中获取缓存数据

Carson.Ho

2019/02/22

2K0

Caffeine缓存最快缓存内存缓存

Caffeine是在Guava Cache的基础上做一层封装，性能有明显提高，二者同属于内存级本地缓存。使用Caffeine后无需使用Guava Cache，从并发的角度来讲，Caffeine明显优于Guava，原因是使用了Java 8最新的StampedLock锁技术。

赛先生和泰先生

2022/01/21

3K0

Caffeine缓存最快缓存内存缓存

Nginx使用Linux内存加速静态文件访问

腾讯云测试服务网站压力测试

Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。

EltonZheng

2021/01/26

2.3K0

HTML DOM 访问

下面的例子返回包含文档中所有 <p> 元素的列表，并且这些 <p> 元素应该是 id="main" 的元素的后代（子、孙等等）：

陈不成i

2021/07/21

7160

内存缓存MemoryCache

云数据库 Redis®缓存分布式

内存缓存MemoryCache实现了ICache接口，Redis同样实现了ICache接口，两者在缓存操作上达到了高度抽象统一。应用设计时一律使用ICache接口，开发环境装配为MemoryCache，生产环境根据分布式需要可以装配为Redis。如果应用系统没有分布式需求，继续使用MemoryCache更好。

JusterZhu

2022/12/07

8070

内存缓存MemoryCache

go 内存缓存

缓存云数据库 Redis®go github git

很多时候我们为了缩短单次请求的时间，就需要去分析请求在哪一步耗时比较大，一般越靠近应用层优化效果越大，后端程序就是请求到达路由解析到返回结果这一步骤了。

花落花相惜

2021/11/25

8690

[BlogCore操作文档4] MemoryCache：内存缓存

缓存服务接口框架内存

采用最新的前后端完全分离技术【 ASP.NET Core Api 6.0 + Vue 2.x 】，并结合 IdentityServer4 ，可快速解决多客户端和多资源服务的统一认证与鉴权的问题，以及整合较为完善的数据权限控制。

老张的哲学

2023/08/23

2970

[BlogCore操作文档4] MemoryCache：内存缓存

内存缓存详解

缓存云数据库 Redis®go github git

很多时候我们为了缩短单次请求的时间，就需要去分析请求在哪一步耗时比较大，一般越靠近应用层优化效果越大，后端程序就是请求到达路由解析到返回结果这一步骤了。

花落花相惜

2021/12/16

6920

从GPU的内存访问视角对比NHWC和NCHW

存储缓存 gpu 内存事务

NHWC和NCHW是卷积神经网络(cnn)中广泛使用的数据格式。它们决定了多维数据，如图像、点云或特征图如何存储在内存中。

deephub

2023/10/07

1.6K0

从GPU的内存访问视角对比NHWC和NCHW

JMeter访问redis缓存

云数据库 Redis®apache http mac os https

第二次工业革命在20世纪初, 基于劳动分工的电力驱动时代, 人类大量使用流水线的电气化时代, 20世纪70年代电子技术,工业机器人的使用提升了生产效率, 使生产自动化水平进一步提高, 人类进入了第三次工业革命. 第四次工业革命就是工业4.0 , 基于大数据, 物联网(机器人视觉传感器)融合的系统在生产中大规模使用, 使人类进入”智能化时代”. IT技术是4.0非常重要的核心, 是支撑未来长期技术性和经济周期的基础.

louiezhou001

2019/07/24

1.2K0

JMeter访问redis缓存

centos7.0 可以访问HTML文件，不能访问PHP文件，因为php-fpm没有扩展包

https 网络安全 java

解决方法：https://blog.csdn.net/ityang_/article/details/53980190

全栈程序员站长

2022/07/07

9740

centos7.0 可以访问HTML文件，不能访问PHP文件，因为php-fpm没有扩展包

【Android 内存优化】Bitmap 内存缓存 ( Bitmap 缓存策略 | LruCache 内存缓存 | LruCache 常用操作 | 工具类代码 )

缓存队列工具类内存数据

Glide 开源库 : 官方建议凡是使用到 Bitmap 解码 , 显示 , 缓存等操作 , 直接使用 Glide 开源库进行上述操作 , 不建议直接操作 Bitmap 对象 ;

韩曙亮

2023/03/27

2.2K0

（代码篇）从基础文件IO说起虚拟内存，内存文件映射，零拷贝

JAVA虚拟机内部便会调用OS底层的 read()系统调用完成操作，在调用 in.read()的时候就是从内核缓冲区直接返回数据了。

intsmaze-刘洋

2018/08/29

4740

（代码篇）从基础文件IO说起虚拟内存，内存文件映射，零拷贝

（理论篇）从基础文件IO说起虚拟内存，内存文件映射，零拷贝

　　为了快速构建项目，使用高性能框架是我的职责，但若不去深究底层的细节会让我失去对技术的热爱。　　探究的过程是痛苦并激动的，痛苦在于完全理解甚至要十天半月甚至没有机会去应用，激动在于技术的相同性，新的框架不再是我焦虑。　　每一个底层细节的攻克，就越发觉得自己对计算机一无所知，这可能就是对知识的敬畏。

intsmaze-刘洋

2018/08/29

1.7K1

（理论篇）从基础文件IO说起虚拟内存，内存文件映射，零拷贝

禁止IIS缓存静态文件的方法(png,js,html等)

html 缓存 iis png 配置

IIS为了提高性能，默认情况下会对静态文件js，html，gif，png等做内部缓存，这个缓存是在服务器iis进程的内存中的。IIS这么做在很大程度上可以提高静态文件的访问性能，在正常情况下只要静态文件更新了IIS也会更新缓存。但是如果更新的静态文件很多就有可能出现缓存不更新的情况。

会长君

2023/04/26

2.9K0

【缓存】HTML5缓存的那些事

数据库存储缓存 html5 浏览器

在HTML5出生之前，通常在浏览器（客户端）使用cookies来存储客户端的内容；

前端修罗场

2023/10/07

4151

【缓存】HTML5缓存的那些事

如何优化tomcat配置(从内存、并发、缓存4个方面)优化

tomcat java bash bash 指令 socket编程

　　Tomcat内存优化主要是对 tomcat 启动参数优化，我们可以在 tomcat 的启动脚本 catalina.sh 中设置 java_OPTS 参数。　　JAVA_OPTS参数说明　　-server 启用jdk 的 server 版；　　-Xms java虚拟机初始化时的最小内存；　　-Xmx java虚拟机可使用的最大内存；　　-XX: PermSize 内存永久保留区域　　-XX:MaxPermSize 内存最大永久保留区域　　服务器参数配置

拓荒者

2019/03/11

2.2K0

相似问题

Javascript -从内存缓存访问对象

15

如何从AWS Lambda访问内存缓存？

16

内存访问和缓存

22

访问内存缓存项

11

毕加索-仅访问内存缓存

11

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例