腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
子
串
大
文本
的
更好
方法
是什么
?
java
、
string
、
file
、
substring
、
file-read
假设我
的
文件是2 2GB,我想要其中
的
一些特定数据。索引到另一个索引(考虑两个索引之间
的
特定数据300MB ),
更好
的
方法
是什么
?我尝试了substring,但是抛出了内存不足异常。请建议
更好
的
方法
来做同样
的
事情。
浏览 19
提问于2019-01-17
得票数 0
4
回答
字符
串
中python
的
if
子
字符
串
的
运行时
python
、
time-complexity
、
python-internals
下面的if statement
的
大
O
是什么
? ...这是测试
子
字符
串
是否在字符
串
中最有效
的</
浏览 6
提问于2016-02-05
得票数 27
回答已采纳
1
回答
子
字符
串
搜索(regex?)条件Python
python
、
substring
、
text-search
如果
大
文本
中存在
子
字符
串
,则需要搜索子字符
串
。所以,我只是简单地使用了:但是,我希望确保“
文本
”中“模式”
的
存在不会立即以字母作为前缀或后缀。它是没有问题
的
,如果它是领导或跟踪
的
特殊字符,数字或空格。因此,如果模式是"abc",匹配“一些
文本
abc",”随机
文本
,abc,cde“应该返回真,而搜索”一些
文本</e
浏览 6
提问于2022-10-11
得票数 0
回答已采纳
2
回答
Python :如何检查字符
串
中
的
字符是否在正则表达式匹配子字符
串
的
范围内?
python
、
regex
我有一个regex模式,我在一个
大
的
文本
(一个字符
串
)上使用它。原始
文本
的
几个不连续区域与regexp匹配。现在,我正在尝试构建一个状态机,迭代
文本
,并根据位置上
的
char执行不同
的
操作,以及这个位置是否在正则表达式匹配
的
范围内。使用RE.finditer(
文本
),我可以找到所有的
子
字符
串
,并提取它们
的
跨度,因此我有一个元组列表。(1、5) (1
浏览 4
提问于2011-09-12
得票数 3
3
回答
如何从Java中
的
路径开始读取和处理
文本
文件?
java
、
file
我有以下必须用Java实现
的
任务。我有一个表示
文本
文件路径
的
字符
串
,如下所示:这个
文本
文件包含一些
文本
(表示XML,但这并不重要,因为我不必使用XPath之类
的
东西对其进行操作,但必须进行简单
的
子
字符
串
操作)。所以我需要读取这个
文
浏览 32
提问于2015-06-09
得票数 -3
1
回答
Java :没有Stringbuffer
的
Regexp
java
、
regex
、
bufferedreader
我有一个包含多个子
文本
的
大
文本
文件,每个子
文本
由<text>和</text>分隔,如下所示Path bigInp
浏览 4
提问于2016-12-17
得票数 0
回答已采纳
4
回答
如何在像一本大书这样
的
巨大字符
串
中查找字符
串
的
出现次数
c#
、
string
、
performance
我最近在一次C#面试中被问到这个问题:我想知道用来存储书籍内容
的
最有效
的
数据结构
是什么
。我能想到
的
最糟糕
的
方法
就是把它存储在StringBuilder中,然后找出
子
字符
串
的
计数,但我相信肯定有
更好
的
方法
来做到这一点。对于一个大小合适
的</e
浏览 0
提问于2011-02-09
得票数 4
1
回答
搜索
文本
中模式
的
长列表
的
最快
方法
search
、
substring
、
information-retrieval
、
trie
、
fst
给定一个“
大
”模式列表和一个“简短”
文本
,在
文本
中搜索/标记这些模式
的
最佳/最快
方法
是什么
?在
文本
中,我们试图将模式作为
文本
的
子
字符
串
查找?如果一个
文本
中有多个模式匹配,我们希望理想地找到所有匹配
的
模式。 具体来说,
文本
实际上是流查询,要查找
的
模式是命名实体。我们需要一个完整
的
模式来完全匹配
浏览 11
提问于2021-12-08
得票数 0
2
回答
子
字符
串
和Go垃圾收集器
string
、
go
、
slice
、
idioms
在Go中获取字符
串
的
子
字符
串
时,不会分配新
的
内存。相反,
子
字符
串
的
基础表示形式包含一个数据指针,该指针是原始字符
串
的
数据指针
的
偏移量。这意味着,如果我有一个
大
的
字符
串
,并且希望跟踪一个小
的
子
字符
串
,垃圾收集器将无法释放任何
大
的
字符
串
,直到我
浏览 1
提问于2013-06-04
得票数 7
4
回答
在python中有此字符
串
匹配
方法
的
实现吗?
python
、
string
、
fuzzy-search
、
fuzzy-comparison
我正在尝试使用近似字符
串
匹配来计算数据存储中
的
哪些条目是接近重复
的
。谢谢:) ..。一种蛮力
的
方法
是计算T
的
所有
子
字符
串
到P
的
编辑距离,然后选择最小距离
的
子
字符
串
。但是,该算法
的
运行时间为O(n3 m)。一个<em
浏览 13
提问于2011-03-04
得票数 3
1
回答
在一
大
组列中搜索一
大
组令牌
sql
、
sql-server-2008
我试图返回给定列有一个
子
字符
串
的
所有记录,该
子
字符
串
至少匹配一个非常
大
的
令牌集
的
一个令牌。我搜索
的
列数量也相当
大
。做这件事最好
的
方法
是什么
?我知道最基本
的
方法
是: (col1 LIKE '%token1%' OR col1 LIKE '%token2%' OR...
浏览 1
提问于2014-06-26
得票数 1
回答已采纳
2
回答
在Django中等效
的
SQL
mysql
、
sql
、
python-3.x
、
django
、
django-models
我想检查给定
的
文本
是否包含在db中
的
子
字符
串
中,select * from `demo` where instr('my name is john','column_name') > 0 Django与上述查询
的
等价性
是什么
?注意到-
浏览 4
提问于2021-06-07
得票数 1
回答已采纳
2
回答
从非常
大
的
文本
文件中删除重复字符
串
c#
、
string
、
duplicates
我必须从非常
大
的
文本
文件(100 Gb+)中删除重复
的
字符
串
我想知道解决这个问题
的
方法
是什么
。我最初
的
尝试是,将文件分成多个子文件,对每个文件进行排序,然后将所有文件合并在一起…… 如果您有比这
浏览 2
提问于2012-03-22
得票数 15
回答已采纳
6
回答
高效搜索较大字符
串
中
的
多个子字符
串
之一
javascript
、
algorithm
、
parsing
我正在寻找一个函数,它可以从一个更长
的
字符
串
('haystack')
的
字符
串
数组中找到一个
子
字符
串
。这是我想出
的
最好
的
方法
,但是对于非常
大
的
文本
块和非常
大
的
针数组(这就是我正在使用
的
),它似乎相当慢,我相信还有
更好
的
方法
。这是非常关键
的
性
浏览 2
提问于2011-11-01
得票数 2
回答已采纳
3
回答
将字符
串
反序列化为对象
java
将这种字符
串
格式转换为对象
的
最佳
方法
是什么
?[Start successful - User:Berord; Name:Test; Fruits:Orange; Version:;] 我正在考虑用';‘和do
子
字符
串
(str.indexOf(“User:”) +1)、
子
字符
串
(str.indexOf(“Name:”)+1)来拆分它。还有其他
更好
的
方法
吗?
浏览 0
提问于2019-04-25
得票数 0
回答已采纳
1
回答
如何提取匹配模式
的
子
串
?
cocoa
、
macos
、
nsstring
、
osx-snow-leopard
我必须解析
大
的
html
文本
文件,并提取与特定模式匹配
的
子
串
。<span id='report-15212'>Report for Apr 2009</span>可可中是否有某种RegExp特性?这样
的
RegExp会<e
浏览 0
提问于2011-08-21
得票数 0
回答已采纳
2
回答
使用sed编辑
子
字符
串
bash
、
sed
我需要在
文本
中找到
子
字符
串
,并使用sed编辑它。...qwerty/asdfgh/zxc......------/------/---...或者
更好
地使用其他
方法
来解决这个问题?不幸
的
是,我找不到在sed中使用regex编辑创建
的
子
字符
串
的
信息。
浏览 0
提问于2017-03-21
得票数 0
2
回答
从MemoryStream获取
子
字符
串
,而不将整个流转换为字符
串
c#
、
substring
、
string-matching
、
memorystream
我希望能够有效地从MemoryStream (最初来自zip中
的
xml文件)获得
子
字符
串
。目前,我将整个MemoryStream读入一个字符
串
,然后搜索我想要
的
xml节点
的
开始和结束标记。这很好,但是
文本
文件可能非常
大
,所以我希望避免将整个MemoryStream转换为字符
串
,而只是直接从流中提取所需
的
xml
文本
部分。 做这件事最好
的
方法
是什么
?
浏览 3
提问于2017-01-03
得票数 3
回答已采纳
2
回答
java索引(String str)
方法
复杂性
java
、
algorithm
可能重复: java (String)
方法
的
复杂性
是什么
?我
的
意思是,有字符
串
匹配算法,如KMP,运行在线性时间。我正在实现一个需要在一个非常
大
的
字符
串
中搜索大型
子
字符
串
的
系统,所以我可以使用java ( string )
方法
或者我应该实现KMP。
浏览 2
提问于2012-10-05
得票数 28
回答已采纳
1
回答
单元测试
文本
索引
c++
、
unit-testing
、
data-structures
考虑一个
文本
索引,例如后缀树或后缀数组,支持计数查询(模式出现次数),并在给定
文本
上定位查询(所有模式出现
的
位置)。您将如何进行单元测试这样
的
类?我想到
的
是生成一个
大
的
随机字符
串
,然后从这个大字符
串
中提取一个随机子字符
串
,并将这两个查询
的
结果与简单
的
实现(例如string::find)进行比较。我
的
另一个想法是找到出现在原始字符
串
中
的</
浏览 0
提问于2012-10-05
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
民大娇子│与梦偕行,寻找更好的自己
判断String是否包含子串的四种方法及性能对比
word表格转换成文本的方法是什么?三个方法轻松搞定
python基础必知必会:将字符串、列表等数据保存为txt文本文件的方法
Python爬虫语法规则
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券