我可以在python中一次重命名非常大的数据集的所有行/列吗？_我可以在Pandas数据帧上应用Groupby并计算所有列的平均值吗？_如果可能的话，我如何才能改善下面的python代码的时间复杂性呢?否则，我可以在一行中完成所有的工作而不是这个原始代码吗？ - 腾讯云开发者社区

python、python-3.x、jupyter-notebook、jupyter、jupyter-lab

我想在python中一次重命名所有行的名称。这是我想要的示例(在R中)： names(dataframe) <- c(paste0("G",1:7129),"class")

浏览 38提问于2021-11-03得票数 0

2回答

重命名大型CSV数据文件的列

python、pandas

我有一个相当大的数据文件，即200%的可用内存，我想重命名这些列，并将其保存到一个新的文件中，并使用不同的名称。print_columns(df)这样可以按预期的方式重命名列，但只保存大文件中采样的10行<

浏览 5提问于2020-04-24得票数 3

回答已采纳

2回答

搜索和更新python中的十六进制值

python、insert

我有一个csv文件，其中一列为十六进制值，这是一些乘积no。像'182666828988‘，'183a2d4e3a12’，我必须采取一个新的产品编号。并检查它是否已经存在，如果我必须更新产品编号的频率。如果没有在数据集中添加一个新行，则使用频率行。在python中最有效的方法是什么，因为我有一个非常大

浏览 2提问于2016-05-24得票数 0

回答已采纳

1回答

SettingWithCopy警告

python、dataframe、merge

我收到了python的警告，但我不知道如何解决它。我试图合并两个列“名称”、“成分”、“评分”的数据集。第一个数据集的值仅用于前两列和15行(其中一些是重复的)。第二个数据集具有所有三列和十行的值，与以前相同，但没有重复

浏览 1提问于2022-01-08得票数 0

2回答

如何将CSV加载到字典(散列)中？

python、pandas、numpy、csv、dictionary

我正在处理(未排序的)CSV-文件，其中某些列包含一个键，而另一列是值。假设每一行的列(1、2、3、7)包含键，第11列是该行的值。我希望将它们加载到散列中，以便能够快速访问密钥的值。我是NumPy新手，对numpy.loadtxt()的速度和易用性印象最深--我可以准确地给它提供我感兴趣<

浏览 7提问于2022-05-18得票数 -1

回答已采纳

1回答

如何使用Pandas替换含义相同的数据字符串(但类型不同)，并将数字中的次要数字转换为主要字符串

python、pandas、data-mining、data-cleaning

例如, 我有一个包含许多属性的大型数据集。假设其中一列是具有20个标签的占领列。我们拿一个标签，一副轮机长。由于数据集是结构化的，并且由于数据收集方式的性质，对于职业来说，一号副工程师将以许多形式出现，例如"First Office Engineer“、”First Off. Engineer“。我的问题是，对于我来说

浏览 0提问于2020-09-22得票数 0

1回答

选择列中字符串中与值匹配的行。

python、pandas

在python的熊猫中，假设有一个DataFrame，其中一个列中的值是一个字符串。Washington'],\如何选择列中任何字符串中的一个值的行

浏览 1提问于2016-03-15得票数 2

回答已采纳

3回答

将DataSet导入SQL Server2008Express

c#、sql-server、visual-studio-2010、sql-server-2008

我有一个非常大的DataSet，其中包含大约160.000条记录。如果循环遍历数据集并导入每条记录，则可能需要大约20分钟才能将完整的数据集导入到SQL Server中。有没有一种更快的方法在数据库中一次导入数据集？数据集是从我处理的用户提供的文件中创建的

浏览 1提问于2010-12-21得票数 3

回答已采纳

1回答

Cassandra模式设计可行性

cassandra

我正在为我的一个项目评估cassandra，我有兴趣了解一个基本的cassandra模式设计的可行性，该设计包含数百万个列族和数百万个行。每行的上限为30,000列。对于分布式cassandra集群(5-10个节点)，这是一个可行的设计，还是我错过了什么？我还想知道在一个事务中检索一行中的所有</em

浏览 0提问于2012-04-27得票数 2

回答已采纳

2回答

带新样本的增量学习

machine-learning

我有一个包含时间戳数据的非常大的数据集。到目前为止，我已经加载了整个数据集，以便使用python (statsmodels.api、statsmodels.formula.api、keras.models.Sequential)来训练一些模型现在，我想用所有的历史数据一次训练模型，然后用新的数据</em

浏览 0提问于2018-04-06得票数 3

6回答

Pytables与CSV用于不是很大的文件

python、csv、pytables

我最近遇到了Pytables，发现它非常酷。很明显，对于非常大的数据集，它们优于csv格式。我正在使用python运行一些模拟。输出不是很大，比如200列和2000行。如果有人对这两种格式都有经验，你能建议哪种格式在长期运行时对这类不太大的数据集更方便吗？Pytables具有数据操作能力和使用Vitables浏览数据</

浏览 0提问于2010-10-26得票数 8

回答已采纳

1回答

是否有可能在大型稀疏矩阵上使用scikit TSNE？

python、scikit-learn、sparse-matrix、dimensionality-reduction

解释说，fit_transform只能用于密集矩阵，但我有一个csr格式的稀疏矩阵，我想对它执行tsne。文档说要对稀疏矩阵使用fit方法，但这并不返回低维嵌入。我很感谢我可以像在.todense()中一样使用方法，但是我的数据集非常大(0.4*10^6行和0.5*10^4列)，所以内存中不适合使用。真的，用稀疏矩阵来做这件事是很好的。是否有一种

浏览 6提问于2017-09-26得票数 4

回答已采纳

1回答

更改多个DataGridView HeaderText值的速度很慢

c#、performance、datagridview、headertext

在将数据网格视图绑定到数据源之后，我需要将12列的列标题更改为用户友好的值，并使它们成为只读的。Grid.Columns["columnname"].HeaderText = "Column Name";当网格包含大型数据集检索数据所需<em

浏览 7提问于2017-02-03得票数 0

2回答

我们是否可以在matplotlib中绘制一行的特定列与同一行的另一列

python、matplotlib、plot

我正在使用python绘制我的数据集。我想要在同一行的另一列上绘制一行的特定列。准确地说，我希望我的两列是x轴和y轴，然后在该图上绘制用户输入的特定值。mydata = pandas.DataFrame(np.random.randn(10,2), colu

浏览 2提问于2017-02-17得票数 0

1回答

R:更改数据集的条目

r、dataframe、rename

我必须将AnnotatedDataFrame和graphNEL的信息汇总在一起。我的问题是，数据框架和graphNEL中相同的“特性”有不同的名称:在数据框架中，我有名称和IDnumber (两列)，在graphNEL中，只有一个列，其条目在表单名称(IDnumber)中。它是一个非常大的数据集</em

浏览 0提问于2014-09-17得票数 0

3回答

内存问题:如果我使用交换，我应该写入文件/数据库吗？(Python)

python、memory、swap

我正在创建和处理一个非常大的数据集，大约有3400万个数据点，目前我将它们存储在内存中的python字典中(大约22,500个字典，在1588个类实例中每个实例中有15个字典)。虽然我能够在内存中管理所有这些，但我正在耗尽我所有的RAM和大部分交换空间。我需要能够首先生成所有这些数据，然后一

浏览 3提问于2010-06-22得票数 2

回答已采纳

1回答

将部分表从Server复制到Aurora (通过AWS基于MySQL )

mysql、sql-server、amazon-aurora

我有一个遗留的Server，我需要从AWS (RDS)将非常大的表的一部分复制到一个新的Aurora集群中。SQL server中的旧表有18亿条记录和43列，但是在新的DB中，我将只保留其中的13列和几乎所有行。我想知道是否有人对我能把这些数据跨过去<e

浏览 1提问于2015-11-17得票数 1

回答已采纳

2回答

Laravel dabatabse正面内存使用情况

php、laravel、memory、pdo

我发现了用php pdo编写的一个很好的例子，它有助于迭代大量的数据，而不实际为整个结果分配内存： //do something我做了一个调查，这种方法使用了内存的18mb。如果我获取像这个$results = $statement->fetchAll(PD

浏览 2提问于2019-03-06得票数 3

回答已采纳

4回答

在表中更改2列-有风险的操作？

sql、sql-server-2005、alter-table

我在MSSQL server2005上有一个表，大约有100列，大约30M行。我需要修改2列-将它们的类型从VARCHAR(1024)更改为VARCHAR(max)。这些列没有索引。我担心这样做会填满日志，并导致操作失败。如何估计此类操作所需的空闲磁盘空间(包括数据和日志)，以确保操作不会失败？

浏览 0提问于2010-11-04得票数 2

回答已采纳

4回答

将两列中的数据合并为一列，除非第二列已在pandas中占用

python、python-3.x、pandas、data-analysis

假设我在一个数据框中有两列，其中一列不完整。a列中的相应值填充b列中的空值，同时保持b列的其余部分不变？这样你就可以在不迭代列的情况下获得？df a b1 2 23 4 4 我认为你

浏览 2提问于2017-06-27得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云