首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Postgres:在html blob中搜索可见文本

Postgres:在html blob中搜索可见文本
EN

Stack Overflow用户
提问于 2019-10-07 15:49:22
回答 1查看 254关注 0票数 0

我有一个PostgreSQL表,它在一个文本字段中包含缓存的100,000+行。我需要一种方法来搜索该HTML,但只搜索将对用户可见的项目,如果该HTML发送到浏览器。

我研究过xpath,但是使用XMLPARSE解析HTML会抛出错误(因为HTML并不总是“格式良好的XML")。我也研究过使用正则表达式,但我发现了许多原因(这里是堆栈溢出),为什么通过正则表达式搜索HTML不能很好地工作。

有什么想法?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-08 02:47:00

我将通过删除所有标记来预处理该列:

代码语言:javascript
运行
AI代码解释
复制
regexp_replace(col, '<[^>]*>', '', 'g')
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58273025

复制
相关文章
如何使用 Selenium 在 HTML 文本输入中模拟按 Enter 键?
Selenium是 Python 中可用的内置模块,允许用户制作自动化套件和测试。我们可以使用 selenium 构建代码或脚本以在 Web 浏览器中自动执行任务。Selenium 用于通过自动化测试软件。此外,程序员可以使用 selenium 为软件或应用程序创建自动化测试用例。
海拥
2021/12/20
8.4K0
PHP操作MySQL中BLOB字段的方法示例【存储文本与图片】
本文实例讲述了PHP操作MySQL中BLOB字段的方法。分享给大家供大家参考,具体如下: 1、M/【参考文章的时候,并不建议直接复制,应该尽量地读懂】/ySQL中BLOB字段类型 BLOB类型的字段用于存储二进制数据。 MySQL中,BLOB是个类型系列,包括:TinyBlob、Blob、MediumBlob、LongBlob,这几个类型之间的唯一区别是在存储文件的最大大小上不同。 MySQL的四种BLOB类型 TinyBlob:  最大 255字节 Blob:      最大 65K MediumBlob:最大 16M LongBlob:  最大 4G 注意:如果你存储的文件过大,数据库的性能会下降很多。 2、PHP操作BLOB案例 (1)操作新闻内容
用户2323866
2021/07/07
3.3K0
HTMl网页中的文本和图像
JaneYork
2023/10/11
2390
【Rust日报】 2019-08-29:在 Postgres 中运行 WebAssembly
OSINT 就是“公开资源情报”,常见于安全和黑客领域。这个 sn0int 是给 IT 安全专业人士和 bug 捕获者设计的 OSINT 框架及包管理器。它用于对给定的目标或你自己搜集情报,生成统一的格式,给后续的研究使用。
MikeLoveRust
2019/09/03
1K0
【Rust日报】 2019-08-29:在 Postgres 中运行 WebAssembly
【VBA】在excel中检索文本
虽然在excel文件中检索的vba代码不知道写了多少遍了,每次需要的时候,都是从网上找,然后写。实在是低效的做法。从网上找了一段代码,放在此处,以后需要的时候可以随手拿来。
东风压倒西风
2022/09/06
2.8K0
PG中的blob cleanup
PG提供了一个很好的BLOB接口,得到了广泛应用。然而最近我们遇到了各种客户遇到的问题,有必要对PG如何处理blob进行一次思考,尤其是BLOB清理。
yzsDBA
2021/01/05
1.5K0
在 HTML 中嵌入 PHP 代码
PHP 天生对 Web 和 HTML 友好,在 PHP 诞生之初,主要用于在 Web 1.0 中构建个人主页,那个时候,PHP 代表的是 Personal Home Page,随着 Web 互联网的发展,在 Web 2.0 时代,PHP 进一步进化为 PHP:Hypertext Preprocessor,即超文本处理器,而 HTML 则是 HyperText Markup Language 的缩写,也就是超文本标记语言。
学院君
2020/05/28
6.4K0
在Email中的HTML规范
目前,兼容性最好的Doctype是XHTML 1.0 Strict,事实上Gmail和Hotmail会删掉你的Doctype,换上这个Doctype。
javascript.shop
2019/09/04
2.4K0
在HTML网页中巧用URL
首先,先放出一个地址给大家测试 http://cnbruce.com/test/htmlpro/?name=cnbruce&email=cnbruce@126.com 1,时下流行的(可能是吧,因为最
Java架构师必看
2021/03/22
1.7K0
在HTML中如何使用CSS?
一、前言 在 HTML 中使用 CSS,包括内联式、内嵌式、链接式和导入式。 二、分类 2.1 内联式 内联式是所有样式应用方式中最为直接的一种,它通过对 HTML 标记使用 属性,将 CSS 代码直接写在其中。 内联式是最简单、直接的 CSS 使用方法,但它的针对性很明显,只能作用于当前标记,造成代码冗余,维护比较困难。 2.2 内嵌式 内嵌式与内联式使用方法不同,它将 CSS 代码写在 标记之间,并需要采用 标记进行声明。 使用内嵌式 CSS 用法时 CSS 代码将被集中放在 标记中,这样方便查
企鹅号小编
2018/02/01
8.6K0
文本搜索(C实现)
#include <stdio.h> #include <string.h> using namespace std; struct cha { char aa[50];//存储单词(不重复) int num;//该单词出现的次数 int Mark[100];//标记该单词出现过的行 }; cha CHA[1000]; struct Mystr { char bb[50];//存储 :字符串 int rol;//存储:字符串 所在行 }; vo
小爷毛毛_卓寿杰
2019/02/13
9040
UILabel加载html文本
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010105969/article/details/53163142
用户1451823
2018/09/13
3K0
WebWorker 在文本标注中的应用
在之前数据瓦片方案的介绍中,我们提到过希望将瓦片裁剪放入 WebWorker 中进行,以保证主线程中用户流畅的地图交互(缩放、平移、旋转)。
ConardLi
2019/10/10
4.7K0
WebWorker 在文本标注中的应用
MySQL中BLOB字段类型介绍
MySQL中,BLOB是个类型系列,包括:TinyBlob、Blob、MediumBlob、LongBlob,这几个类型之间的唯一区别是在存储文件的最大大小上不同。
用户2353021
2020/05/12
6.1K0
[记录点滴]在Ionic和Android中上传Blob图片
本文是开发中的简略记录,具体涉及知识点有:Blob,Ionic,Android和Lua。
罗西的思考
2020/09/07
1.3K0
Blob初探
简介   Blob在js中意味着二进制大数据。实现该接口的对象有3个属性,分别是type(MIME),size(byte)和 一个切割方法:slice(在大文件分片上传可能用到)。另外,File实现了Blob接口,并且还有额外的属性--name和 lastModify。   早起的一些浏览器实现了草案(已废弃)上的BlobBuilder,但是现在的大多浏览器废弃了该对象。目前,创建新的 Blob对象需要使用Blob构造函数,new Blob(array,type)。第一个参数数组中可以包含字符串,Array
欲休
2018/03/15
2.7K0
如何在 Python 中搜索和替换文件中的文本?
让我们看看如何在文本文件中搜索和替换文本。首先,我们创建一个文本文件,我们要在其中搜索和替换文本。将此文件设为 Haiyong.txt,内容如下:
海拥
2021/10/20
16.2K0
【DB笔试面试553】在Oracle中,什么是不可见索引?
索引维护是DBA的一项重要工作。当一个系统运行很长一段时间,经过需求变更、结构设计变化后,系统中就可能会存在一些不再被使用的索引,或者使用效率很低的索引。这些索引的存在,不仅占用系统空间,而且会降低事务效率,增加系统的负载。因此,需要找出那些无用或低效的索引,并删除它们(找出无用索引可以通过索引监控的方法)。但是,直接删除索引还是存在一定风险的。例如,某些索引可能只是在一些周期的作业中被使用到,而如果监控周期没有覆盖到这些作业的触发点,那么就会认为索引是无用的,从而将其删除。当作业启动后,可能就会对系统性能造成冲击。这时,可能就会手忙脚乱地去找回索引定义语句、重建索引。在Oracle 11g里,Oracle提供了一个新的特性来降低直接删除索引或者禁用索引的风险,那就是不可见索引(Invisible Indexes)。
AiDBA宝典
2019/09/29
6620
在PowerBI的切片器中搜索
在制作PowerBI报告时,一般来说,我们都会创建一些切片器。为了节省空间,一般情况下尤其是类目比较多的时候,大多采用下拉式的:
陈学谦
2020/06/18
12.4K0
在Google搜索中玩打砖块
37年前,经典游戏Atari’s Breakout(打砖块)诞生。而为了纪念这款游戏,Google采用了更特别的模式:搜索彩蛋,而不是常用的首页logo。
reizhi
2022/09/26
1.5K0
在Google搜索中玩打砖块

相似问题

从html内容的可见文本中删除搜索文本

11

在hsql的blob中搜索文本

11

postgres文本搜索

21

oracle blob文本搜索

51

在postgres中构建文本搜索查询

13
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文