如何移动pandas dataframe组中的列，然后连接回单个dataframe？_Pandas DataFrame将单个列除以列组的总和_对Pandas Dataframe中的列组求和 - 腾讯云开发者社区

python-3.x、pandas

在pandas 0.23.0和python 3.6.5中，我看到了在DataFrame上使用iloc[int]时不理解的行为。如果DataFrame只有一列，并且该列的类型是“category”，则iloc[int]将返回标量值而不是系列。当"answer“列是一个对象数据类型时，我会得到一个预期的Series： >>> df = pandas.DataFrame({'answer': ['no', 'no', 'yes']}) >>> df['answer'] =

浏览 1提问于2018-08-24得票数 0

2回答

连接Pandas DataFrame中的行

python、pandas、dataframe

我对熊猫的DataFrame对象有个问题。我读过csv文件，我的DataFrame是这样的：我想用符号‘|’连接行之间的行，应该是这样的： Pandas有这样的功能，用特定的分隔符连接行，或者我应该如何实现

浏览 0提问于2019-12-02得票数 0

1回答

Pandas未正确保存到CSV

python、pandas、csv

我有CSV文件： lang 12345,it 77777,en 第一行是标题。我的表有一列lang。在接下来的每一行中，都有两个值: index和value。当我用pd.read_csv(path)的Pandas阅读这张表时，我得到了下一个DataFrame结构： lang 12345 it 77777 en 但是当我通过df.to_csv(path)将它保存回CSV时，我在CSV文件的头之前得到了冗余的,： ,lang 12345,it 77777,en 似乎pandas处理这个逗号就像处理未命名的列一样，当我下次阅读这个文件时，我得到了这个DataFrame结构：

浏览 24提问于2019-09-22得票数 0

回答已采纳

1回答

从两个集合的交集中选择数据集的子集

python、python-3.x、pandas、set

我从一个DataFrame中得到了两组列标题。一个集合是另一个集合的子集。 import pandas as pd d = {'feature1':[1,2,3], 'feature2':[3,4,5], 'feature3':[6,7,8]} df = pd.DataFrame(data=d) 现在我有两套： set_1 = {'feature1','feature2','feature3'} set_2 = {'feature1','feature3'} 如何在我

浏览 1提问于2018-09-16得票数 0

回答已采纳

2回答

复制包含行中的字符串，并将特定结果移动到新列Pandas python。

python、regex、pandas

浏览 10提问于2022-07-08得票数 1

回答已采纳

1回答

多个值和名称依赖于现有列的新列

python、pandas、dataframe

我有一个包含多个列的dataframe (在这个问题中，我将使用这个dataframe的一个例子)，并希望创建新的列，当year=2017除以初始列的值时，它将显示特定列的值。更具体地说，以列price为例。第一个新列price_2017只应在year=2017时显示price列的值。下一列price_ratio应该显示等于price/price_2017的值。这些_2017和_ratio后缀被添加到除year之外的所有列中。我知道如何手动操作，但是在实际的dataset中，我有60列，因此需要进行一些优化，比如使用loop或apply，但是不知道如何做。 # importing pandas

浏览 4提问于2022-02-17得票数 1

回答已采纳

1回答

使用从拼花文件创建的dataframe时内存使用量过高

parquet、dask

我有拼花文件，也就是800 K行x8.7K列。我把它装进了一个dask数据仓库： import dask.dataframe as dd dask_train_df = dd.read_parquet('train.parquet') dask_train_df.info() 这产生了： <class 'dask.dataframe.core.DataFrame'> Columns: 8712 entries, 0 to 8711 dtypes: int8(8712) 当我尝试执行像dask_train_df.head()或dask_train_df

浏览 0提问于2018-12-24得票数 6

回答已采纳

2回答

分组/拆分DataFrame并将其保存到现有excel文件中，而不会擦除数据

python、pandas、pandas-groupby、openpyxl

我有像这样的DataFrame，我在下面的代码中创建了df。我有三个excel文件(名称：- 1C1,1M1,1V1)，现在我想按DataFrame列'Sheet2‘拆分/分组，并在不擦除'Sheet1’中现有数据的情况下将数据保存在新的‘Sheet1’中。 import glob from openpyxl import load_workbook from openpyxl.utils.dataframe import dataframe_to_rows import pandas as pd df=pd.DataFrame() for f in gl

浏览 0提问于2020-06-11得票数 0

2回答

如何在熊猫数据中添加复选框

python-3.x、pandas、dataframe、checkbox

我创建了一个dataframe，作为： import pandas as pd data = [['Ankit'], ['Akshat' ]] df = pd.DataFrame(data, columns = ['Name']) 现在，我想插入一个列PPA，其中包含复选框按钮作为值。所以，我把代码写成： import ipywidgets checkbox_button=widgets.Checkbox(description="", value=False,indent=False) df.insert(loc = 0

浏览 2提问于2021-10-28得票数 3

回答已采纳

1回答

在Pandas中分配列时处理SettingWithCopyWarning

python、pandas

我有一个DataFrame，我想用包含上一行数据的列来扩展它。这个脚本完成了以下工作： #!/usr/bin/env python3 import numpy as np import pandas as pd n = 2 df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [0,1,1,0,0]}, columns=['A', 'B']) df2 = df[df['B'] == 0] print(df2) for i in range(1, n+1): df2[

浏览 11提问于2017-02-24得票数 2

回答已采纳

1回答

用户定义函数以组合CUDF数据基列

pandas、rapids、cudf

根据标题，我试图组合来自不同cudf.DataFrame列的行值。以下代码适用于标准pandas.DataFrame import pandas as pd data = {'a': [1], 'b': [2], 'c': [3], 'd': [4]} df = pd.DataFrame.from_dict(data) def f(row): return {'dictfromcolumns': [row['a'], row['b'], row['c'],

浏览 18提问于2022-09-23得票数 0

回答已采纳

1回答

检查来自pandas dataframe的哪些值不在SQL数据库中

python、mysql、sql、sql-server、pandas

我想检查来自pandas dataframe的哪些值不在SQL数据库中。因此，基本上是一个左连接( left是pandas df)，其中右(SQL DB)键为NULL。 DB非常大，大约有500万个条目，但我只对主键感兴趣。 Pandas dataframe(50k行)比SQL DB(5M)小得多，所以我更愿意将数据移动到能带来所有数据的batabase中我曾经考虑过在SQL中创建一个临时表并进行左连接，但也可以只使用一个查询来实现 pandas数据帧： index 0 1 2 3 4 sql数据库：

浏览 9提问于2019-07-11得票数 2

回答已采纳

1回答

土生大熊猫select_as_multiple

python、pandas、pytables

假设我有一个块稀疏的DataFrame。我的意思是，有几组行具有不相交的非空列集。存储这个巨大的表将在值中使用更多的内存(nan填充)，并将表解压到行将创建一个大型索引(至少在保存到磁盘时是这样的.我不完全清楚是否有一些有效的MultiIndexing应该正在进行)。通常，我将块作为单独的DataFrames存储在一个dict或list中(删除nan列)，并创建一个具有与DataFrame几乎相同的api的类，“手动”将查询传递给块并连接结果。这很好，但是需要少量的特殊代码来存储和处理这些对象。最近，我注意到pytable提供了类似于此的特性，但仅用于。在熊猫身上有什么办法来解决这个问题

浏览 0提问于2013-09-22得票数 0

3回答

如何将一栏中的所有项目移到熊猫栏中？

python、pandas

我对熊猫很陌生。我正在尝试将列的项移动到dataframe的列中。我挣扎了几个小时，但做不到。米维 import numpy as np import pandas as pd df = pd.DataFrame({ 'X': [10,20,30,40,50], 'Y': [list('abd'), list(), list('ab'),list('abefc'),list('e')] }) print(df) X Y 0 10

浏览 6提问于2022-05-12得票数 3

回答已采纳

1回答

如何根据排序后的列值将一列分成5组，然后添加列的

python、pandas

如何将一列按列的值排序分为5组。并按组添加一列例如 import pandas as pd df = pd.DataFrame({'x1':[1,2,3,4,5,6,7,8,9,10]}) 我想像这样添加列：

浏览 0提问于2018-06-18得票数 1

2回答

在Pandas中将列连接为索引

python、pandas

我正在将一个文本文件导入到pandas中，并希望将该文件中的3列连接起来以建立索引。我愿意在一个或多个步骤中做到这一点。我可以在创建DataFrame的同时进行转换，也可以创建DataFrame并用新创建的列重新构造它。知道如何使用这两种方法对我来说是最有帮助的。我最终希望索引是连接前3列中的值的值。

浏览 2提问于2013-07-24得票数 9

回答已采纳

1回答

Pandas -连接多个名称不同但数据类型相同的excel文件

excel、pandas、xlsb

我有大约50个excel工作表与.'xlsb‘扩展名。我想将一个特定的工作表连接到pandas DataFrame中(所有工作表的名称都相同)。我遇到的问题是，每个工作表中的列名称并不完全相同。我使用pandas编写了一段代码，但它的工作方式是将所有值连接到pandas数据框中的同一列中，但基于列的名称。所以举个例子:有时我有一列叫做: FgsNr，有时叫做FgNr --两列中的数据类型和含义完全相同，我希望把它们放在数据框中的同一列中，但是pandas创建来分离数据框中的列，并将那些列中列出的同名的值堆叠在一起。 files = glob(r'C:\Users\Folder

浏览 29提问于2021-08-10得票数 0

1回答

在pandas数据帧中使用apply时如何创建列时间戳？

python、python-3.x、pandas、time

我将一些函数应用于pandas dataframe列，如下所示： <code>A0</code> 然后，我将该函数应用于列： <code>A1</code> 如何返回包含函数<code>D2</code>完成所需的毫秒数的列？例如： <code>A3</code> 其中<code>D4</code>是包含求和结果的列。

浏览 11提问于2018-12-19得票数 0

回答已采纳

1回答

Python:将DataFrame列值压缩到单个单元格中

python、pandas、dataframe

如果我有一个DataFrame df import pandas as pd d = {'col1': ['Google','Yahoo','LinkedIn'], 'col2': ['Microsoft', 'Oracle', 'Uber']} df = pd.DataFrame(data=d) 如何将这些列值连接到使用"&“连接的单个单元格，如下所示： col1 col2

浏览 6提问于2020-02-15得票数 0

回答已采纳

2回答

使用iloc时的Pandas SettingWithCopyWarning

python、pandas

在与另一个DataFrame合并后，我正在尝试更改DataFrame中的值，并遇到了一些问题(合并之前似乎不是问题)。我使用以下命令对DataFrame中的值进行索引和更改： df.iloc[0]['column'] = 1 随后，我使用merge连接(左外部连接)两个索引(我意识到left.join(右)也可以)。此后，当我使用iloc执行相同的值赋值时，我收到以下警告： __main__:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame

浏览 2提问于2017-02-25得票数 2

1回答

如何连接多索引数据中的所有列？

python、pandas、dataframe

我有一个多索引df，我正在尝试连接它。各栏如下： a.columns MultiIndex([( 'Note', '507.3'), ( 'Note', '507.4'), ( 'Note', '507.5'), ( 'Note', '507.6'), ('St

浏览 4提问于2022-05-03得票数 0

回答已采纳

3回答

在python pandas中，如何在一个csv文件中并排堆叠(每次迭代)列中的数据帧？

python、pandas

如果我可以在for循环中每次迭代生成两列数据，并且我想将其保存在csv文件中，那么如果在下一次迭代中我将生成两列数据将并排堆叠在同一个csv文件中(没有覆盖)，该如何做？下一次迭代也是如此。我已经搜索了pandas.DataFrame(mode='a')，但它只垂直地(按行)追加列。我研究过连接pd.concat，然而，我不知道如何在超过两个dataframes的for循环中实现它。你有没有这方面的示例代码？或者分享一些想法？ import numpy as np, pandas as pd for i in xrange (0, 4): x = pd.DataFram

浏览 50提问于2016-07-20得票数 1

1回答

群比和移动平均函数在熊猫中起作用，但速度慢

python、performance、pandas

我收集了很多人(超过5万人)在两年内每隔一天收集的一些时间序列数据。我想对数据集中的每个人和每个度量应用指数加权移动平均函数。在计算移动平均值之后，我想要将新值与dataframe中的现有值连接起来。我已经知道了如何在一个小样本数据集上这样做，但是我担心它没有被优化，因此不会扩展到我的实际数据集。我有大量的RAM可用，所以我不怕耗尽空间，但我关心的是，这可能需要多长时间来计算我的整个数据集。特别是当我试验不同的跨度和聚合水平时。感谢第13966期的起点！如何优化此代码以更好地扩展到更大的数据集？ import pandas as pd import random from datetime

浏览 0提问于2017-11-16得票数 1

回答已采纳

1回答

Python快速DataFrame连接

python、pandas

我编写了一段代码，将DataFrame的部分连接到相同的DataFrame，以便按照某一列规范行的出现。 import random def normalize(data, expectation): """Normalize data by duplicating existing rows""" counts = data[expectation].value_counts() max_count = int(counts.max()) for tag, group in data.groupby(exp

浏览 3提问于2016-02-12得票数 5

回答已采纳

1回答

当不存在公共记录时，Pandas merge将删除添加的列

python、sql、pandas、merge、jupyter-notebook

我留下了基于键的连接数据帧A到B。合并后，我发现在右边的dataframe上没有任何记录与右边的dataframe具有相同的键，但是右边的表中的列仍然被添加。如果没有公共记录，如何阻止Pandas添加新列？

浏览 0提问于2019-07-24得票数 0

1回答

Pandas在DF创建过程中添加额外的空列

python、pandas

我得到了： AssertionError: 14 columns passed, passed data had 12 columns. 错误是不言而喻的，我正在从列表列表创建一个DataFrame，每个列表实际上包含12个字段。如何在一次操作中使用NaN强制pandas.DataFrame添加额外的列。这就是我创建df的方式。 pandas.DataFrame(results, columns=FIELDS) 有没有一种方法可以在DataFrame创建中简化这一过程，而不必这样做： pandas.DataFrame(results, columns=FIELDS_12) df["E

浏览 53提问于2017-02-15得票数 0

回答已采纳

1回答

pandas应用于每列/行的不同参数

python、pandas、rolling-computation、rolling-average

假设我有一个M(行)乘N(列)的dataFrame df = pandas.DataFrame([...]) 和一个长度为N的向量 windows = [1,2,..., N] 我想将移动平均函数应用于df中的每一列，但希望每列的移动平均长度不同(例如，column1的MA长度为1，列2的MA长度为2，等等)-这些长度包含在windows中有没有内置的函数可以快速做到这一点？我知道df.apply(lambda a: f(a), axis=0, args=...)，但不清楚如何为每个列应用不同的参数

浏览 2提问于2018-03-08得票数 0

3回答

Python Pandas将一系列字符串连接成一个字符串

string、python-3.x、pandas、string-concatenation、series

在python pandas中，有一个字符串值Series/dataframe列，可以组合成一个长字符串： df = pd.DataFrame({'text' : pd.Series(['Hello', 'world', '!'], index=['a', 'b', 'c'])}) 目标：“Hello world！” 到目前为止，像df['text'].apply(lambda x: ' '.join(x))这样的方法只返回序列。获得目标连接字符串的

浏览 7提问于2016-12-31得票数 13

回答已采纳

3回答

为什么groupby.apply返回重复级别

pandas

def afun(group): aa=len(group) group.sort_values(inplace=True) return pandas.DataFrame({'score':numpy.arange(aa),'price':group}) df = pandas.DataFrame({ 'stock':numpy.repeat( ['AAPL','GOOG','YHOO'], 3 ), 'date&

浏览 0提问于2016-08-15得票数 3

回答已采纳

3回答

计算一只熊猫的元组

python、pandas、count、tuples

我有下面的pandas.DataFrame val1 val2 val3 val4 1 7 8 3 2 2 1 4 5 4 3 5 7 5 3 4 7 8 3 2 5 6 8 1 0 6 0 2 5 7 7 1 4 5 4 8 7 8 3 2 我想数一下我的DataFrame中每个元组的数量。预期结果(或多或少)： count tuple 3

浏览 2提问于2014-12-26得票数 3

回答已采纳

1回答

存储多对多关系的最佳方式，以便将来快速查询

python、pandas、many-to-many

我有一个数据框，我在其中对一个字段执行多个regex子字符串搜索，以确定此字符串属于哪个“家族”。这是一个相当昂贵的搜索，所以我想将结果保存在一个Pandas列中，以便更快地检索。Pandas有一个很好的isin()方法，用于确定单个检索到的项是否在给定的查询集中，但我不确定如何进行反向操作。下面是一个简单的单行示例： >>> from pandas import DataFrame >>> example = DataFrame({"text": "the quick brown fox jumps over the lazy d

浏览 0提问于2015-08-10得票数 0

1回答

迭代行并找出不超过数的行和

python、pandas

下面是一个dataframe，它显示了每一行的坐标值，每一行都有一个相应的值列。我想要找到值列不超过5的坐标范围。下面是dataframe输入。 import pandas as pd From=[10,20,30,40,50,60,70] to=[20,30,40,50,60,70,80] value=[2,3,5,6,1,3,1] df=pd.DataFrame({'from':From, 'to':to, 'value':value}) print(df) 因此，我想转换下表：取得以下成果：进一步解释：连接

浏览 4提问于2020-06-09得票数 0

1回答

从dask dataframe提供程序收集属性

python、pandas、dask

TL;DR：我如何从分布式读取中收集元数据(解析期间的错误)到dataframe集合中。目前，我有一种专用的文件格式，用于输入dask.DataFrame。我有一个函数，它接受一个文件路径并返回一个pandas.DataFrame，dask.DataFrame成功地在内部使用该函数将多个文件加载到同一个dask.DataFrame。直到最近，我还在使用自己的代码将几个pandas.DataFrames合并为一个，现在我正在使用dask。在解析文件格式时，我可能会遇到错误和某些条件，我希望将其作为元数据(日志、数据来源等)记录并与dask.DataFrame对象关联。需要注意的是，在合理的

浏览 7提问于2016-01-26得票数 2

回答已采纳

3回答

根据不同列中的相似值减去一行中的数据

python、pandas、dataframe

我在这里有一个大得多的数据文件的样本： import pandas as pd data = {'Name': [27, 27, 30, 30, 43, 43, 50, 62, 62], 'Time': [10, 30, 23.4, 28.6, 10, 15, 20, 25, 50]} df = pd.DataFrame(data) 我希望能够创建一个新的列或一个新的dataframe，它能够减去Name列中每个相同数字的时间值。预期成果： Name Time Bucket 27 20 30

浏览 8提问于2022-01-27得票数 1

回答已采纳

2回答

Julia pandas语法select values from conditional

pandas、syntax、julia

在Python的pandas中，如果我有一个具有n列的DataFrame，并且我想将满足某些条件的行保留在特定的列中，我只需输入：df[df.column1 > 0]，我找不到在Julia pandas中执行此操作的正确语法。

浏览 2提问于2017-11-29得票数 0

6回答

如果pandas.DataFrame中的列是绝对的，什么是一个很好的启发式方法？

python、pandas、scikit-learn

我一直在开发一个工具，可以自动地以pandas.DataFrame格式对数据进行预处理。在这个预处理步骤中，我想以不同的方式处理连续数据和分类数据。特别是，我希望能够只对分类数据应用(例如，OneHotEncoder )。现在，让我们假设我们被提供了一个pandas.DataFrame，并且没有关于DataFrame中数据的其他信息。使用什么好的启发式方法来确定pandas.DataFrame中的列是否是绝对的？我最初的想法是： 1)如果列中有字符串(例如，列数据类型为object)，则该列很可能包含分类数据。 2)如果列中某些值的百分比是唯一的(例如，>=20%)，那么该列很可能包

浏览 4提问于2016-03-06得票数 29

2回答

Python在列中的数字和字符之间插入空格

python、pandas、string、dataframe、space

我有一个多列的dataframe，我想把数字和一个列中有空格的字母分开。在本例中，我希望在第三列中添加空间。你知道怎么做吗？ import pandas as pd data = {'first_column': ['first_value', 'second_value', 'third_value'], 'second_column': ['first_value', 'second_value', 'third_value'],

浏览 10提问于2022-09-08得票数 1

回答已采纳

1回答

如何将计算的列按多列分组？

python、pandas、dataframe

你好，我有下面列出的这张数据。 import pandas as pd db_docks = pd.DataFrame(db_top_25, columns = ['from_station_id', 'to_station_id', 'hour', 'day','dpcapacity_start', 'dpcapacity_end']) 示例数据的图像，因为我不能直接嵌入它我需要做的是创建一个新的dataframe，它按“小时”、“日”和“从_station_id”分组。之后，我需要计算

浏览 4提问于2020-01-31得票数 1

回答已采纳

4回答

更好的Pandas方法来统计不同列中的值的频率

python、pandas

我有一个邮政编码在两列的pandas.DataFrame。我只想用value_counts()计算一下所有邮政编码的出现次数。但对我来说，它们在哪个专栏中并不重要。我需要DataFrame中所有邮政编码列的结果。以下是列中包含邮政编码的初始数据： ZIPCODE_A ZIPCODE_B 0 10000 40000 1 20000 30000 2 20000 20000 3 10000 50000 4 30000 10000 最终和预期的结果将是： ZIPCODE_N 1

浏览 29提问于2021-07-08得票数 2

回答已采纳

2回答

如何按照一定的格式解压熊猫栏？

python、pandas

我的df有一个列unnamed，其第一个元素是 '{company=*, location=world, industry=*, segment=*, feature=*, product=*, basekpi=customer_demand}' 第二个元素是NaN。我想将该列分解为7列( company、location、industry、segment、feature、product和basekpi )。我的expected_df是请你详细说明一下如何做好吗？ import pandas as pd unnamed = ['{company=*, loc

浏览 4提问于2021-04-22得票数 1

回答已采纳

1回答

pandas数据帧的CSV输出中索引列的位置

pandas

我正在尝试重新定位pandas DataFrame.to_csv()输出CSV中的索引列我可以使用columns对非索引列进行排序，但不清楚如何移动索引列。如果我有两列Name和Age以及索引，我希望这些列在生成的CSV Name, Age,index中按以下顺序出现有人知道怎么做吗？

浏览 9提问于2019-07-19得票数 0

回答已采纳

2回答

Python -比较整个数据框会得到与单个元素不同的结果

python、pandas、dataframe

我正在比较两个数据帧的列，我得到的结果与单独比较元素的结果不同。这适用于比较"None“。 import pandas as pd df1 = ["a", None, None, "b"] df1 = pd.DataFrame(df1) df2 = ["a", None, "c", "d"] df2 = pd.DataFrame(df2) print(df1[0] != df2[0]) #[1] is True, why ?? print(df1[0][1] != df2[0][1]) #[1] her

浏览 22提问于2021-01-15得票数 0

回答已采纳

1回答

如何从Pandas中的列中移出数值或非数值

python-3.x、pandas

在阅读Pandas方法时，我只是在做一些测试，看看Pandas dataFrame中的一个列是否具有诸如数字和名称之类的混合值，我希望将该列分隔开来，以便将数字对齐到单独的新列，同时将/removing列从原始列中删除。 ( a)下面是 DataFrame: >>> df Name OXA 0 SAN 109 Yes 1 KENI 122 No 2 REEMA 455 Yes ( b)我尝试用移位将数字移动到一个新的DataFrame(**Nums**): >>> df['Nums'] = df['

浏览 0提问于2018-10-22得票数 0

回答已采纳

4回答

从pandas dataframe中的列中删除特定位置的数字

python、pandas

我在pandas dataframe df中有一个列 import pandas as pd s = {'id': [47035,460,23045,87068,8007,78096], 'st': ['a', 'a', 'd', 'e', 'f', 'a']} df = pd.DataFrame(s) 我想删除仅位于列id中第三个位置的0(或任何其他数字，如果存在)。我怎样才能做到这一点呢？所以在删除之后，我在id列中的值应该是4735，46，2345，876

浏览 102提问于2019-05-05得票数 1

回答已采纳

1回答

在计算复杂度最低的情况下，如何创建一个新的pandas列，该列在另一列的基础上递增一定的数字

python、pandas

我有这一列数字，按值排序 import pandas as pd # initialize list of lists data = [1, 1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 5, 6, 6, 6] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['First']) df.head(19) First 0 1 1 1 2 1 3 1 4 2 5 2 6 3 7 3 8 3 9 3 10 3

浏览 17提问于2021-01-31得票数 0

回答已采纳

1回答

连接3次数据访问更改原始列类型

python、pandas、dataframe

我有3个数据文件，我想要合并成一个数据文件。在进行连接之前，第一个dataframe中的列是串联对象。但是，在我将它们连接起来之后，来自原始dataframe的列现在本身就是DataFrames，而不是Series： type(combined_data['text']) pandas.core.series.Series # Append to the combined_data set as new columns combined_data = pd.concat([combined_data, word_counts_df, keyword_counts_df], a

浏览 3提问于2020-03-21得票数 0

回答已采纳

1回答

有条件大熊猫的平均移动率

python、pandas

我有一个具有以下结构的dataframe： import numpy as np import pandas as pd df = pd.DataFrame( { "date": ["2020-01-01", "2020-01-02", "2020-01-03", "2020-01-04"] * 2, "group": ["A", "A", "A", "A", "B", "

浏览 5提问于2022-04-26得票数 1

回答已采纳

2回答

如何通过搜索列表中给出的关键字值在Python熊猫中添加新列？

python-3.x、pandas、list-comprehension

我想根据已识别的关键字在dataframe中添加新列：这是当前数据(Dataframe= df)： Topic Count 0 This is Python 39 1 This is SQL 6 2 This is Paython Pandas 98 3 import tkinter 81 4 Learning Python 94 5 SQL Working 85 6 Pandas and Work 67

浏览 6提问于2020-09-11得票数 2

回答已采纳

1回答

基于条件的加权和

python、pandas

假设您有这样的数据集： import pandas as pd data = { "id" : [1,1,2,3,4,4,4,4], "weight" : [0.5, 0.5, 1, 1, 0.25, 0.25, 0.10, 0.40], "val" : [55, 325, 532, 55, 29, 89, 38, 85] } df = pd.DataFrame(data) id weight val 1 0.5 55 1 0.5 325 2 1 532 3 1

浏览 13提问于2021-01-19得票数 2

回答已采纳

1回答

如何将来自DataFrame中另一列的简单值添加到聚合的最小值中？

python、pandas

在下面的Pandas DataFrame中，我希望进行聚合计算(最小值)，同时简单地添加另一列中的值。我能够解决这个问题，但我怀疑gb.agg内部有一个更简单的解决方案。 import numpy as np import pandas as pd df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B' : ['

浏览 0提问于2018-02-11得票数 1

回答已采纳