腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
计算
一个
巨大
的
csv
文件
的
唯一
行数
我有
一个
巨大
的
csv
文件
(大约5-6 GB)
的
大小,这是在配置单元。有没有办法
计算
文件
中存在
的
唯一
行
的
数量? 我对此一无所知。我需要将输出与另
一个
配置单元表进行比较,后者具有相似的内容但具有
唯一
的
值。所以,基本上我需要找出不同
的
linnes
的
数量。
浏览 7
提问于2019-05-16
得票数 2
回答已采纳
1
回答
R
csv
.bz2 Shell Windows计数
行数
、
、
、
我在
计算
一个
凌乱
的
csv
.bz2
文件
中
的
行数
时遇到了问题。 由于这是
一个
巨大
的
文件
,所以我希望能够在读取带有bzip2 ()函数
的
read.
csv
文件
之前预先分配数据帧。正如您在下面的测试中所看到
的
,我
的
结果是广泛可变
的
,并且没有
一个
与
csv
.bz2
浏览 4
提问于2014-05-27
得票数 2
2
回答
如何使用python中
的
熊猫
计算
csv
文件
中
的
唯一
行数
?
、
、
如何使用python中
的
熊猫
计算
.
csv
文件
中
唯一
的
行数
。我尝试了这些解决方案,但只能
计算
特定列中
唯一
值
的
数量。
浏览 2
提问于2020-05-14
得票数 0
回答已采纳
1
回答
标识从日志中更新了多少行
的
方法
、
、
、
、
我们处理来自上游系统
的
CSV
文件
,并将它们加载到Server数据库中
的
主表中。我们目前正在登入
一个
新
的
上游系统,突然,我们
的
更新声明花了很长时间。这可能是由于输入
的
数据在我们
的
系统中有以前
的
相关数据,并导致了
巨大
的
更新。我们能够找到通过sp_whoisactive更新
的
表。我
的
问题是: 发布更新,是否有方法可以从错误日志、默认跟踪或通过DMV
浏览 4
提问于2020-05-15
得票数 3
回答已采纳
3
回答
计算
具有相同值
的
行数
,即24百万行。
、
、
、
所以我有
一个
巨大
的
CSV
,我制作了
一个
测试脚本来查看
行数
,它返回大约2400万行。我希望提取具有相同CIK编号
的
行数
,并在单独
的
CSV
中传输该数据。因此,另
一个
文件
中想要
的
输出是:我有一些想法,但它们不够有效,所以脚本是无用
的
,因为花了很长时间才通过
csv
。有人和我一样遇到了类似的问题吗?
浏览 0
提问于2019-04-21
得票数 0
回答已采纳
1
回答
如何
计算
唯一
的
csv
/地板行?
、
、
、
在
csv
/parquet中,是否有比写入HashMap或读取一行并遍历整个
文件
(如果
文件
很大)更好
的
计算
唯一
行
的
算法?
浏览 5
提问于2022-07-25
得票数 0
1
回答
为什么在我
的
任务中Python3比Python2慢得多?
、
、
、
我编写了
一个
简单
的
命令行命令来
计算
一个
巨大
的
CSV
文件
中
的
行数
。$ cat huge.
csv
| python -c "import sys; print(sum(1 for _ in sys.stdin))"# it took 15 seconds有没有更快
的
方法来
计算
Python 3中
的
行数<
浏览 5
提问于2017-11-07
得票数 6
回答已采纳
1
回答
大熊猫在
巨大
的
csv
的
每一栏中发现独特元素
的
数量。
、
、
我有
一个
大约10 GB
的
巨大
的
csv
文件
,如果我试图在内存中加载,我会得到
一个
错误。 我需要为dataframe
的
每一列
计算
唯一
元素
的
数量。我怎么能这么做?
浏览 1
提问于2015-04-17
得票数 1
回答已采纳
2
回答
每个Dask Dataframe列中
的
唯一
值数
、
我有
一个
名为train
的
Dataframe,它是从
一个
大型
CSV
文件
中加载
的
,我想在每一列中
计算
唯一
值
的
数量。= train[col].nunique().compute() print(line) 但是,上面的代码将为每一列遍历
巨大
的
CSV
文件
,而不是只遍历
浏览 2
提问于2020-12-27
得票数 0
回答已采纳
1
回答
在
计算
所有值和写入
CSV
文件
之前,我可以添加哪些行来只提取
唯一
值?
、
、
、
我正在尝试创建
一个
CSV
文件
,它是数据集中所有
唯一
值
的
列表。我
的
数据来自
一个
包含200+
CSV
文件
的
文件
夹,所有
文件
都有9列和不同
的
行数
。有些
文件
没有副本,但许多
文件
有重复
的
值。我已经找到了
一个
代码,其中列出了每个
文件
中
的
行数</
浏览 5
提问于2022-08-13
得票数 0
2
回答
使用Scala剪切大型
CSV
文件
、
、
、
在Scala 2.8中执行
文件
IO
的
最佳方式是什么? 我想要做
的
就是将
一个
巨大
的
CSV
文件
切成许多较小
的
文件
,每个
文件
有1000
行数
据,每个
文件
保留头部。
浏览 0
提问于2010-09-02
得票数 3
回答已采纳
5
回答
PowerShell:如何
计算
csv
文件
中
的
行数
?
、
、
、
、
如何使用powershell
计算
csv
文件
中
的
行数
?我试过这样
的
东西或但这些结果是错误
的
浏览 0
提问于2011-07-28
得票数 28
回答已采纳
1
回答
如何获取Pandas块中
的
行数
?
、
、
我正在通过迭代块来读取
一个
巨大
的
csv
文件
。如何获取当前处理
的
区块大小?特别是,最后
一个
块
的
行数
可能比用参数chunksize定义
的
要少。reader = pd.read_table('myFile.
csv
', sep=';', chunksize=100)
浏览 3
提问于2017-01-08
得票数 5
回答已采纳
2
回答
火花上
的
Scala数据分析
、
、
、
、
我是Scala新手,我必须使用Scala和Spark
的
SQL、Mllib和GraphX来对
巨大
的
数据集进行一些分析。我想做
的
分析是: 我是否应该将
CSV
文件
中
的
数
浏览 2
提问于2016-09-25
得票数 3
1
回答
JMeter,将
CSV
中
的
URL在用户之间随机(或平均)划分,而不会多次调用
我有一种情况,我在
CSV
文件
中有100000个URL,我想同时启动N个用户(线程),但它们应该是
CSV
文件
的
一部分,而不会干扰彼此
的
数据集。Url2 ....(不一定相等拆分),但
一个
URL应该只热一次。并且所有的用户必须同时启动才能达到我想要
的
负载。我可以将
文件
拆分成多个
CSV
并创建多个线程组,但是如果我有1000个用户,实际上不可能创建1000个线程组。
浏览 2
提问于2018-08-09
得票数 0
0
回答
无法将excel行与pandas dataframe
行数
匹配
、
、
、
但是,我在Jupyter notebook中使用df.column.value_counts()获得
的
唯一
行数
与同一
文件
的
excel
行数
不匹配(在删除重复值之后)。 我如何解决这个问题?我加载了
一个
文本
文件
(以制表符分隔),并使用encoding = 'ISO-8859-1‘将其转换为pandas数据帧。创建数据帧时,其中一列
的
唯一
行数
为66370。当我在原始
csv
<em
浏览 13
提问于2019-01-21
得票数 0
2
回答
如何使
csv
文件
适当分割行?
、
、
、
我有
一个
巨大
的
csv
文件
,大约100 M,我试着在它上做
一个
head,它释放出整个
csv
,而不管我要求
的
行数
。head data.
csv
和head -1 data.
csv
给出了相同
的
结果,即整个
文件
。稍后,我注意到
文件
中根本没有一行:0 data.
csv
我在excel中打开<e
浏览 0
提问于2015-11-01
得票数 0
回答已采纳
1
回答
csv
文件
的
真实行
、
、
、
我有
一个
csv
文件
,它有那么多行,我想在python程序中获得
行数
。当我使用wc -l或vim
文件
和设置编号来计数
行数
时,我得到了7125393.。但是,当我使用熊猫解析
csv
并使用.size获取
行数
时,它返回6842536。然后,我使用
csv
(python
的
内置包)解析
csv
,并使用for循环来计数
行数
,它还返回6842536。当我
计算
csv
浏览 1
提问于2020-04-23
得票数 0
回答已采纳
3
回答
使用python混洗
csv
文件
的
行
我正在寻找一种在python中导入
csv
文件
的
方法,并让它随机洗牌所有的行,并创建
一个
新
的
csv
文件
,其中
的
行被洗牌。我不确定如何开始这项工作。有没有人知道些什么?
浏览 0
提问于2019-09-03
得票数 0
2
回答
将循环
的
输出存储为
文件
夹中所有
csv
文件
的
字典计数行。
、
、
、
运行
一个
循环,
计算
文件
夹中所有.
csv
文件
的
行数
。现在我需要将这些结果保存到字典中。我得到了我想要
的
输出,但是我试图将它保存到dict中
的
任何方式都会导致"I/0操作在
文件
上关闭“。_2019_03.
csv
中
的
行数
为914653
csv
MA_2019_04.
csv
中
的
行数
浏览 1
提问于2022-09-18
得票数 0
点击加载更多
相关
资讯
python如何读取CSV文件中的特定行数据
csv 文件读写乱码问题的一个简单解决方法
CSV配置文件的优化策略
更高效的Python CSV文件导出
盘点一个dbeaver导入csv文件到sql server报错的一个问题
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券