腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >Postgres:在html blob中搜索可见文本

问Postgres:在html blob中搜索可见文本
EN

Stack Overflow用户

提问于 2019-10-07 15:49:22

回答 1查看 254关注 0票数 0

我有一个PostgreSQL表，它在一个文本字段中包含缓存的100,000+行。我需要一种方法来搜索该HTML，但只搜索将对用户可见的项目，如果该HTML发送到浏览器。

我研究过xpath，但是使用XMLPARSE解析HTML会抛出错误(因为HTML并不总是“格式良好的XML")。我也研究过使用正则表达式，但我发现了许多原因(这里是堆栈溢出)，为什么通过正则表达式搜索HTML不能很好地工作。

有什么想法？

html

postgresql

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-08 02:47:00

我将通过删除所有标记来预处理该列：

regexp_replace(col, '<[^>]*>', '', 'g')

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58273025

复制

如何使用 Selenium 在 HTML 文本输入中模拟按 Enter 键？

selenium python 自动化

Selenium是 Python 中可用的内置模块，允许用户制作自动化套件和测试。我们可以使用 selenium 构建代码或脚本以在 Web 浏览器中自动执行任务。Selenium 用于通过自动化测试软件。此外，程序员可以使用 selenium 为软件或应用程序创建自动化测试用例。

海拥

2021/12/20

8.4K0

PHP操作MySQL中BLOB字段的方法示例【存储文本与图片】

php 存储 sql 数据库云数据库 SQL Server

本文实例讲述了PHP操作MySQL中BLOB字段的方法。分享给大家供大家参考，具体如下： 1、M/【参考文章的时候，并不建议直接复制，应该尽量地读懂】/ySQL中BLOB字段类型 BLOB类型的字段用于存储二进制数据。 MySQL中，BLOB是个类型系列，包括：TinyBlob、Blob、MediumBlob、LongBlob，这几个类型之间的唯一区别是在存储文件的最大大小上不同。 MySQL的四种BLOB类型 TinyBlob：最大 255字节 Blob：最大 65K MediumBlob：最大 16M LongBlob：最大 4G 注意：如果你存储的文件过大，数据库的性能会下降很多。 2、PHP操作BLOB案例 (1)操作新闻内容

用户2323866

2021/07/07

3.3K0

HTMl网页中的文本和图像

html 搜索引擎 list 互联网浏览器

JaneYork

2023/10/11

2390

【Rust日报】 2019-08-29：在 Postgres 中运行 WebAssembly

https 网络安全 github git 开源

OSINT 就是“公开资源情报”，常见于安全和黑客领域。这个 sn0int 是给 IT 安全专业人士和 bug 捕获者设计的 OSINT 框架及包管理器。它用于对给定的目标或你自己搜集情报，生成统一的格式，给后续的研究使用。

MikeLoveRust

2019/09/03

1K0

【Rust日报】 2019-08-29：在 Postgres 中运行 WebAssembly

【VBA】在excel中检索文本

vba

虽然在excel文件中检索的vba代码不知道写了多少遍了，每次需要的时候，都是从网上找，然后写。实在是低效的做法。从网上找了一段代码，放在此处，以后需要的时候可以随手拿来。

东风压倒西风

2022/09/06

2.8K0

PG中的blob cleanup

yzsDBA

2021/01/05

1.5K0

在 HTML 中嵌入 PHP 代码

html javascript css 网站 php

PHP 天生对 Web 和 HTML 友好，在 PHP 诞生之初，主要用于在 Web 1.0 中构建个人主页，那个时候，PHP 代表的是 Personal Home Page，随着 Web 互联网的发展，在 Web 2.0 时代，PHP 进一步进化为 PHP:Hypertext Preprocessor，即超文本处理器，而 HTML 则是 HyperText Markup Language 的缩写，也就是超文本标记语言。

学院君

2020/05/28

6.4K0

在Email中的HTML规范

html css http

目前，兼容性最好的Doctype是XHTML 1.0 Strict，事实上Gmail和Hotmail会删掉你的Doctype，换上这个Doctype。

javascript.shop

2019/09/04

2.4K0

在HTML网页中巧用URL

网站 php http html asp

首先，先放出一个地址给大家测试 http://cnbruce.com/test/htmlpro/?name=cnbruce&email=cnbruce@126.com 1，时下流行的（可能是吧，因为最

Java架构师必看

2021/03/22

1.7K0

在HTML中如何使用CSS？

html c++

一、前言在 HTML 中使用 CSS，包括内联式、内嵌式、链接式和导入式。二、分类 2.1 内联式内联式是所有样式应用方式中最为直接的一种，它通过对 HTML 标记使用属性，将 CSS 代码直接写在其中。内联式是最简单、直接的 CSS 使用方法，但它的针对性很明显，只能作用于当前标记，造成代码冗余，维护比较困难。 2.2 内嵌式内嵌式与内联式使用方法不同，它将 CSS 代码写在标记之间，并需要采用标记进行声明。使用内嵌式 CSS 用法时 CSS 代码将被集中放在标记中，这样方便查

企鹅号小编

2018/02/01

8.6K0

文本搜索（C实现）

编程算法

#include <stdio.h> #include <string.h> using namespace std; struct cha { char aa[50];//存储单词（不重复） int num;//该单词出现的次数 int Mark[100];//标记该单词出现过的行 }; cha CHA[1000]; struct Mystr { char bb[50];//存储：字符串 int rol;//存储：字符串所在行 }; vo

小爷毛毛_卓寿杰

2019/02/13

9040

UILabel加载html文本

其他 http

用户1451823

2018/09/13

3K0

WebWorker 在文本标注中的应用

https 网络安全编程算法 github git

在之前数据瓦片方案的介绍中，我们提到过希望将瓦片裁剪放入 WebWorker 中进行，以保证主线程中用户流畅的地图交互（缩放、平移、旋转）。

ConardLi

2019/10/10

4.7K0

MySQL中BLOB字段类型介绍

数据库云数据库 SQL Server sql

MySQL中，BLOB是个类型系列，包括：TinyBlob、Blob、MediumBlob、LongBlob，这几个类型之间的唯一区别是在存储文件的最大大小上不同。

用户2353021

2020/05/12

6.1K0

[记录点滴]在Ionic和Android中上传Blob图片

android lua ios nginx javascript

本文是开发中的简略记录，具体涉及知识点有：Blob，Ionic，Android和Lua。

罗西的思考

2020/09/07

1.3K0

Blob初探

javascript

简介　　Blob在js中意味着二进制大数据。实现该接口的对象有3个属性，分别是type（MIME），size（byte）和一个切割方法：slice（在大文件分片上传可能用到）。另外，File实现了Blob接口，并且还有额外的属性--name和 lastModify。　　早起的一些浏览器实现了草案（已废弃）上的BlobBuilder，但是现在的大多浏览器废弃了该对象。目前，创建新的 Blob对象需要使用Blob构造函数，new Blob（array，type）。第一个参数数组中可以包含字符串，Array

欲休

2018/03/15

2.7K0

如何在 Python 中搜索和替换文件中的文本？

编程算法正则表达式

让我们看看如何在文本文件中搜索和替换文本。首先，我们创建一个文本文件，我们要在其中搜索和替换文本。将此文件设为 Haiyong.txt，内容如下：

海拥

2021/10/20

16.2K0

【DB笔试面试553】在Oracle中，什么是不可见索引？

oracle sql 云推荐引擎

索引维护是DBA的一项重要工作。当一个系统运行很长一段时间，经过需求变更、结构设计变化后，系统中就可能会存在一些不再被使用的索引，或者使用效率很低的索引。这些索引的存在，不仅占用系统空间，而且会降低事务效率，增加系统的负载。因此，需要找出那些无用或低效的索引，并删除它们（找出无用索引可以通过索引监控的方法）。但是，直接删除索引还是存在一定风险的。例如，某些索引可能只是在一些周期的作业中被使用到，而如果监控周期没有覆盖到这些作业的触发点，那么就会认为索引是无用的，从而将其删除。当作业启动后，可能就会对系统性能造成冲击。这时，可能就会手忙脚乱地去找回索引定义语句、重建索引。在Oracle 11g里，Oracle提供了一个新的特性来降低直接删除索引或者禁用索引的风险，那就是不可见索引（Invisible Indexes）。

AiDBA宝典

2019/09/29

6620

在PowerBI的切片器中搜索

bi desktop powerbi 搜索

在制作PowerBI报告时，一般来说，我们都会创建一些切片器。为了节省空间，一般情况下尤其是类目比较多的时候，大多采用下拉式的：

陈学谦

2020/06/18

12.4K0

在Google搜索中玩打砖块

游戏硬件开发

37年前，经典游戏Atari’s Breakout（打砖块）诞生。而为了纪念这款游戏，Google采用了更特别的模式：搜索彩蛋，而不是常用的首页logo。

reizhi

2022/09/26

1.5K0

相似问题

从html内容的可见文本中删除搜索文本

在hsql的blob中搜索文本

postgres文本搜索

oracle blob文本搜索

在postgres中构建文本搜索查询

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

社区富文本编辑器全新改版！诚邀体验～

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验

问Postgres:在html blob中搜索可见文本
EN