为Pandas Dataframe中的重复集创建规则_为Pandas Dataframe中的每个重复行追加值/索引_如何删除pandas dataframe中的重复行？ - 腾讯云开发者社区

、、、、

我有一个包含不同重复值的大型数据帧。如何遍历这些不同的重复集并相应地设置列值？2020-11-1', '2012-4-1']) df = pd.DataFrame，并填写标题为“2020年出生的</e

浏览 10提问于2021-04-19得票数 3

回答已采纳

1回答

无法在数据标注MLStudio中设置DataSet类型

、、、

无法在数据标签项目MLStudio中设置DataSet类型。默认数据集文件类型为始终显示。我想和panda_dataframe一起工作。如何在创建数据集时将数据集设置为表格数据集。另外，如何将Filedataset更改为要应用pandas_dataframe的表格datasetI。但它不适用于文件数据集。call last) <ipython-input-

浏览 12提问于2020-08-29得票数 1

1回答

我需要合并一个Pandas* df (0.22)来忽略某些多连接键中的NaN*

、、、

因此，我有一个需要从excel/csv导入中应用的(长)规则。该规则来自另一个系统，包含许多条件列，但这些列并不总是被填充。当一个或多个密钥为NaN时，期望的结果是将该密钥视为匹配。在本例中，我希望indigo和violet的值为-200，而不是NaN：df = pd.DataFrame({'colour&#x

浏览 1提问于2021-01-06得票数 0

1回答

如何将Tensorflow数据集导出到csv？

、、、

寻求如何创建TF数据集映射两个列表并将数据集保存到CSV文件的建议。我已经创建了两个列表:原始:B‘’File 1.JPG'，b‘’File 2.JPG'，b‘’File 3.JPG'，b‘’File 4.JPG‘需要将每个原始文件映射到相关的复制文件

浏览 1提问于2020-07-30得票数 3

1回答

Pandas中消除不同列中重复值列的有效方法

、、

我在Pandas中寻找一种高效而优雅的方法来删除DataFrame中的“重复”行，这些行具有完全相同的值集，但在不同的列中。理想情况下，我正在寻找一种矢量化的方法来实现这一点，因为我已经可以使用Pandas pandas.DataFrame.iterrows()方法识别非常低效的方法。假设我的

浏览 1提问于2019-04-02得票数 1

回答已采纳

1回答

AzureML:当拼花文件为空时TabularDataset.to_pandas_dataframe()挂起

、、

我使用创建了一个表格数据集。问题中的数据是一堆在Azure Data 2中分布在多个分区中的拼花文件(~10K块文件，每个文件大小为330 KB)。当我尝试使用API TabularDataset.to_pandas_dataframe()加载数据集时，如果数据集中包含空的拼花文件，它将永远继续(挂起)。如果表格数据集不包括那些空的拼板文件，TabularData

浏览 7提问于2022-02-11得票数 1

回答已采纳

1回答

如何根据复杂的列条件集聚合重复行

、、、

我用熊猫来探索多个重复条目的数据集。例如：pd.DataFrame({'ID':['001','001','002','002','002','003','003','004','004'],001 Yes NaN002 Yes NaN002

浏览 0提问于2019-02-03得票数 2

回答已采纳

1回答

当存在重复列名时，按列拆分Pandas数据

、、、、

我有一个数据集，必须将数据作为2d数组读取。然后我用 arrayFull.pop(0)import pandas as pd现在，我尝试将"datafra

浏览 3提问于2020-08-30得票数 0

回答已采纳

1回答

在Pandas* Dataframe中寻找缺口*

、、

我有一个Dataframe，它有一列分钟和相关的值，频率大约是79秒，但有时会丢失一个时间段的数据(根本没有行)。我希望检测到是否存在25分钟或更长的间隔，如果有，则删除数据集。dataframe如下所示：0 23.000因此，有一个不规则但很短的间隙，超过25分钟。在这种情况下，我希望数据<e

浏览 1提问于2020-04-09得票数 0

回答已采纳

4回答

Python设置为数组和数据

import numpy as n , pandas as pprint(n.array(s))上面的代码将没有问题的集合转换为但是，当我尝试从它创建一个DataFrame时，我会得到以下错误： ValueError: DataFrame构造函数没有正确调用！那么，有没有办法将python /nested转换为numpy数组/字典，这样我就可以从它创建Data

浏览 0提问于2018-08-29得票数 5

1回答

我希望使用自己的数据为训练模型。在TFDS中已经有一组数据集可用(Tensorflow数据集)，还可以选择到TFDS。但是，如果我不必等待这些添加请求和内容，并直接训练我的数据，那会怎么样呢？在示例colab笔记本中，他们使用以下内容来创建训练和验证数据： examples, metadata = tfds.load('ted_hrlr_translate/pt_to_en', with_info_OptionsDatas

浏览 16提问于2019-07-19得票数 2

回答已采纳

3回答

在同一个df中扩展

、、、、

我正在寻找基于任何数字的扩展数据集，例如，(5)import pandas as pdprint (df)df = pd.DataFrame({"X": ["A", &

浏览 4提问于2022-08-11得票数 0

回答已采纳

2回答

熊猫数据-使用WildCards选择行

、

我是蟒蛇的新手。我的问题有点含糊不清。如果单元格中的任何字符串与特定通配符规则匹配，我希望从dataFrame中选择行。of values to select rows from a pandas dataframe', 'selecting columns from a pandas dataframe basedbased on values in a column in pa

浏览 5提问于2017-02-12得票数 2

回答已采纳

2回答

在牛市高层共享数据的多视图图表

、

我们如何创建多视图图表，在牛市的上共享数据？例如，如何避免在规范中重复两次数据集的以下情况：import pandas as pd data = pd.DataFrame({'x': [1.1, 2.5

浏览 0提问于2018-06-28得票数 1

回答已采纳

1回答

将每个sas数据集转换为熊猫中的数据

、

我正在将每个sas数据集从目录列表转换为熊猫中的单个数据import pandas as pdos.chdir(r'XX\XX\aa.sas7bdatcc.sas7bdatee.sas7bdat 现在，我正在创建字典，它使用pyd.read_sas7bdat导入到单个数据框架来迭代每个sas数据集。我的输出是为每个sa

浏览 2提问于2020-10-07得票数 0

回答已采纳

2回答

在python中获取月末数据

、

我正在尝试弄清楚如何获得每个数据集(aapl，intc，ebay和amzn)的月末‘调整关闭’行。下面是我所做的：import pandas as pdfrom pandas.tseries.offsetsamazon = amzn amzn = pd.DataFrame({'AMZN': amazon['A

浏览 0提问于2018-11-20得票数 2

1回答

如何根据Pandas中的条件创建数据行的修改副本？

、、、、

我有一个Pandas dataframe，它包含几个列和几个行。 ColXYZ. Interval. Temperature. Pressure. ColCDE.每当Interval值为0时，我希望为每一行创建重复值，并为数据集中的所有Temperature和Pressure条件创建此值--例如，创建除温度和压力变化外所有值相同的A行副本，为除温度和压力变化外的所有值

浏览 6提问于2022-01-06得票数 0

回答已采纳

1回答

找到重复的值

、、

我需要在dask DataFrame中的列中找到副本。Q:，在dask中获取所有重复值的最佳方法是什么？我的想法：创建一个作为索引的列，然后是drop_duplicates，然后是join。df = pandas.DataFrame

浏览 3提问于2020-10-08得票数 3

1回答

如果另一列中存在大于0的任何值，则需要将值分配给数据框

、、、

我正在使用一个事务数据库查询集，但我无法获取付款的具体日期，所以我尝试用python编写sone代码来为我指定日期。我的第一个想法是在excel中执行此操作，但数据集是800,000+行X excel列，因此使用其他任何方法都不现实。数据集在payments列的某些行中具有值，因此我需要在包含付款金额的行中添加一个仅包含日期的date列。我已经创建了存储日期<em

浏览 14提问于2019-06-30得票数 1

回答已采纳

1回答

TensorFlow2.0:我可以更改Tf.data.Dataset上的设置吗--特别是‘`repeat()’特性？

、

我有一个从一些熊猫数据创建的TensorFlow2.0 tf.data.Dataset。现在我想更改数据集上的设置，但它似乎不允许我这样做。例如，我想将数据集上的.repeat()参数从无限重复更改为仅重复1次。但当我尝试进行此更改时，数据集不接受此更改。下面是一个包含一些代码的示例。，但这会导致数据集永远重复。这就像我将数据集设置为无限<em

浏览 18提问于2019-12-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云