腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3738)
视频
沙龙
1
回答
对于
非常大
的
文件
,
grep
和
pandas
TextFileReader
哪个
更快
?
python
、
pandas
、
grep
我需要在一个无法加载到内存或创建数据帧
的
非常大
的
文件
中搜索特定
的
正则表达式。在这种情况下,
grep
和在
TextFileReader
上迭代
哪个
更快
? 遗憾
的
是,我没有时间学习、配置
和
运行Hadoop。
浏览 4
提问于2016-08-16
得票数 1
回答已采纳
4
回答
比较awk
和
grep
awk
、
grep
对于
一个
非常大
的
文件
,我运行了以下两个命令执行死刑花费了几
浏览 0
提问于2015-11-04
得票数 4
2
回答
javascript
和
php中字符串和数组
的
处理速度,数组可以不经过操作就传递给php吗?
php
、
javascript
、
arrays
、
string
在php
和
JS (或任何其他语言)中,通常哪种格式处理或搜索文本(
对于
非常大
的
数组或文本字符串)
更快
。示例:使用
哪个
更快
的
搜索来查看xyz是否存在/匹配?在确定xyz
的
索引位置时,
哪个
更快
? <
浏览 0
提问于2011-09-09
得票数 2
回答已采纳
2
回答
使用正则表达式高效地搜索IP地址
regex
、
grep
、
zgrep
我想找到最有效
的
正则表达式来在一次搜索中找到三个IP地址,但我不确定是否有更有效(
更快
)
的
语法可以使用。 我试着一次搜索一个地址,但我很好奇是否有
更快
的
方法。我真的只是想知道是否有
更快
的
语法可以使用。
浏览 42
提问于2019-05-25
得票数 1
2
回答
存储大文本
的
字符串与向量
c++
、
text
、
storage
对于
数据压缩,我需要打开
文件
(这里是文本
文件
),并将其所有内容存储在变量中。 使用字符串或字符向量来存储
非常大
的
文本(数百万个或更多字符)
哪个
更好?所谓更好,我
的
意思是
更快
地遍历每个字符,并且
更快
地使用count函数来计算给定字符在文本中出现
的
次数。大小在这里并不是问题,因为字符串
和
向量都可以存储大量字符,如果有必要,我可以将文本分解为几个子文本。
浏览 0
提问于2017-02-20
得票数 0
2
回答
指定
文件
名模式
的
递归
Grep
grep
、
find
可以使用递归搜索
和
给定
的
文件
模式进行搜索吗?find ./ -name "*.[c|h]" -exec
grep
-Hn PATTERN {} \;
grep
-Hn -r PATTERN *.c 它只查找当前目录中
的
*.c
文件
,而不是递归查找。我发现了这一点,但它没有提到指定
文件
名:-
浏览 0
提问于2017-01-12
得票数 2
5
回答
用于
Pandas
和
/或Numpy
的
读写操作
的
最快
文件
格式
python
、
numpy
、
pandas
我在
非常大
的
DataFrames中工作了一段时间,我一直使用csv格式来存储输入数据
和
结果。我注意到,在读取
和
写入这些
文件
时花费了大量时间,例如,这些
文件
大大减慢了数据
的
批处理速度。我想知道
文件
格式本身是否相关。是否有
更快
读取/写入
Pandas
DataFrames
和
/或Numpy数组
的
首选
文件
格式?
浏览 9
提问于2014-04-08
得票数 33
回答已采纳
1
回答
管理MySQL数据
的
最快方法是什么?
pandas
vs fetch_row
python
、
mysql
、
python-3.x
、
pandas
、
mysql-python
我想知道我从MySQL得到
的
管理数据
的
常用
和
更好
的
方法是什么。passwd="####", db="####", charset='utf8')result = db.use_result()df = pd.rea
浏览 1
提问于2018-04-02
得票数 1
2
回答
gz
文件
中
的
几个字符串
bash
、
grep
、
gunzip
从匹配第二个
文件
中多个字符串
的
非常大
的
gz
文件
中提取行
的
最佳方法是什么?我试过了,它适用于字符串
和
周围环境:
浏览 0
提问于2017-11-06
得票数 1
回答已采纳
4
回答
用于重置数组索引
的
array_merge与array_value
php
、
arrays
、
indexing
、
array-merge
我发现
和
函数都可以完成这项工作( array_merge函数不需要两个数组即可工作)。
对于
非常大
的
数组,
哪个
更快
?我会对此进行基准测试,但我不知道如何实现,也还没有大型数组。
浏览 0
提问于2010-05-31
得票数 7
回答已采纳
2
回答
Julia Dataframes vs Python
pandas
python
、
pandas
、
dataframe
、
julia
我目前正在使用python
pandas
,我想知道是否有一种方法可以将熊猫
的
数据输出到julia Dataframes中,反之亦然。(我想你可以用Pycall从Julia调用python,但我不确定它是否能处理数据帧)有没有办法从python调用Julia并让它接收panda
的
数据帧?(不保存为其他
文件
格式,如csv) 什么时候使用Julia Dataframes比使用
Pandas
更有优势,除了
非常大
的
数据集
和
运行许多循环
的
东西(比如
浏览 0
提问于2014-04-27
得票数 16
回答已采纳
3
回答
找到定义C/C++函数/宏
的
文件
比“
grep
”更简单
的
方法
c++
、
c
、
emacs
我开始做一个有C
和
C++
文件
音调
的
大型项目,这已经是别人写
的
了。 是否有任何
更快
/更简单
的
方法可以在除
grep
-r之外
的
哪个
文件
中定义宏或函数?有点长。在某些IDE中,有一种神奇
的
东西,比如右击
和
“进入定义”。但我现在用
的
是emacs。我不知道是否有任何定制可以做到这一点?每次,我必须复制我
的
终端中
的
名字,运行一个<
浏览 0
提问于2018-10-08
得票数 2
回答已采纳
2
回答
通过剥离前n行来创建csv
文件
的
副本
python
、
powershell
我有一组巨大
的
csv
文件
(每个大约30 in ),在前2行有乱码
的
标题(这个数字是可变
的
)。我想剥离这些标题行并创建一个干净
的
文件
副本。我尝试使用以下Powershell脚本首先获取原始
文件
中
的
行数,然后运行tail命令将这些行(减去标题)写入新
文件
。然而,我认为tail命令试图读取内存中
的
所有内容,
对于
非常大
的
文件
,机器在一个小时后变得没有响应
浏览 2
提问于2020-11-13
得票数 0
3
回答
如何使用
pandas
在用户输入后打开.csv
文件
?
python
、
pandas
、
python-2.7
我对Python非常陌生,这将是一个非常基本
的
问题。我希望用户输入csv
文件
的
名称,我希望使用
pandas
打开该
文件
,以便轻松地访问其行
和
列。这是我写
的
代码: import
pandas
as pd dataset = pd.read_csv(DATAFIN) dataset.head() 然而,我似乎在做一些错误
的</e
浏览 36
提问于2021-01-13
得票数 0
5
回答
使用
grep
vs awk
linux
、
awk
、
grep
、
performance
要捕获特定
的
模式,可以使用awk
和
grep
。我们为什么要用一个而另一个呢?
哪个
更快
,为什么?如果我有一个日志
文件
,并且我想获取一个特定
的
模式,我可以执行以下操作之一或
grep
'pattern' /var/log/messages很高兴知道这两种工具
的</
浏览 0
提问于2013-08-28
得票数 26
回答已采纳
1
回答
如何通过Vi或gedit查看巨大
的
文本
文件
text-editor
我已经通过wordlist.txt生成了一个11 GB
的
crunch-3.6。当我尝试用Vi或gedit打开
文件
时,由于
文件
大小,我遇到了问题。如何查看此
文件
?
浏览 0
提问于2017-11-09
得票数 27
回答已采纳
1
回答
set_value
和
=在熊猫中有什么区别?
python
、
pandas
在编写
pandas
中
的
数据
文件
时,我们看到我们有几种方法可以实现它,就像
和
提供
的
那样。
哪个
更快
?要么是副本?
浏览 1
提问于2017-04-26
得票数 2
回答已采纳
2
回答
递归目录中
的
快速字符串替换
replace
、
recursive
如何用递归目录
和
带有空格
和
单引号
的
文件
名替换快速文本?最好使用标准
的
UNIX工具,或者是众所周知
的
软件包.
对于
许多
文件
来说,使用find非常慢,因为它会为每个
文件
生成一个新
的
进程,因此我正在寻找一种将目录遍历
和
字符串替换集成为一个操作
的
方法。find .-name '*.txt' -exec
grep
foo {} \; 快速搜
浏览 0
提问于2018-03-29
得票数 0
回答已采纳
2
回答
如何在
pandas
中读取
非常大
的
制表符分隔
文件
python
、
pandas
我需要在
pandas
中读取一个
非常大
的
文件
,并添加一个新列。因为这个
文件
对于
我
的
系统来说太大了(7500万行,超过3 3GB),所以我决定分块读取。我知道skipfooter
和
skiprows,但是虽然skiprows似乎可以工作,但我对skipfooter有问题。例如,当我尝试:我
的
系
浏览 0
提问于2017-01-07
得票数 0
2
回答
哪个
更高效: ls -l * ABC * vs ls -l |
grep
ABC
linux
、
bash
、
unix
至少有两种方法可以做同样
的
事情:) ls -l *ABC*
和
ls -l |
grep
ABC 但是哪一个更有效呢?还有没有其他更高效
的
?
浏览 2
提问于2017-11-02
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券