在Pandas中将单元格拆分为多行并进行groupby计数 - 腾讯云开发者社区

我现在使用下面的代码来显示重复的条目。 private static void CheckDataTable(DataTable dt) { for (int i = 0; i <= dt.Rows.Count; i++) { for (int a = i + 1; a < dt.Rows.Count; a++) { if (dt.Rows[i]["ID"].ToString() == dt.Rows[a]["ID"].ToStri

浏览 2提问于2017-08-04得票数 1

回答已采纳

4回答

我如何使用pandas agg对布尔值进行求和，并始终得到结果？

python、pandas、pandas-groupby

我有一个包含bool类型列的数据框。我想使用pandas的groupby和agg函数来获取每个id的True值的数量。我已经做过很多次了，但是结果列的类型似乎取决于数据框。下面是一个示例： import pandas as pd d = {'id': [1, 1, 2, 3], 'bool': [True, False, False, True]} df = pd.DataFrame(data=d) print(df.groupby(['id']).agg({'bool': 'sum'})) 我从这段代码

浏览 0提问于2020-04-03得票数 1

1回答

DataFrameGroupBy中键、值的条件迭代

python、loops、dictionary、pandas、conditional

我在python (2.7)中有一个pandas (v0.12)数据帧data。我对data中的A和B列进行了groupby()，以形成类型为<class 'pandas.core.groupby.DataFrameGroupBy'>的groups对象。我想遍历groups中包含多行的数据帧并对其应用一个函数。我的代码如下，这里的每个数据帧都是键、值对中的value： import pandas as pd groups = data.groupby(['A','B']) len(groups) >> 1

浏览 1提问于2015-02-20得票数 0

2回答

在Python中读取特定Excel单元格数据

python、excel、pandas

我在pandas数据框中有一列，其中每一行都有一个带有多个换行符的字符串。我尝试只使用最后两个换行符来创建一个新列。单元格有不同数量的换行。有没有一个函数可以让我在excel中专门拉出最后两个换行符？下面是我失败的尝试。 text= df['Column_Name'].str.rsplit('\r\n', 3)

浏览 16提问于2019-12-25得票数 0

回答已采纳

2回答

Pandas:按多列分组的值计数

python、pandas、dataframe

我有一个Pandas数据帧，我将其按两列分组: ID和Item。然后我在每个组中保留最后5次出现(最大值)，最后我想计算一个特定type.Specifically出现次数的比率，我想计算每个ID项的“U”计数除以总出现次数。我在最后一步遇到了问题-我不确定如何从下面的一般值计数到每个ID-Item分组的比率。任何建议都将不胜感激--谢谢！ d={'ID':[1,1,1,1,1,2,2,2,2,2],'Item': ['box','box','ball','ball','box',&

浏览 11提问于2018-09-01得票数 1

回答已采纳

2回答

使用[groupby]时中间列的Python Pandas排序

python、pandas

我正在使用python pandas，并希望根据下表的中间列对输出进行排序(我已经显示了我正在获得的输出和我想要获得的输出)。我在pandas中使用groupby函数来获得输出，但是它是按计数列排序的(参见下面的输出表)，而我想要按YOB列排序(请参见所需的输出表)。另外，我如何计算每个国家的平均出生年份？ import pandas as pd xlpath= "C:/Users/Username/documents/Datafile.xlsx" df = pd.read_excel(eval('xlpath')) y = df.groupby(&

浏览 20提问于2019-10-14得票数 0

回答已采纳

1回答

如何根据id将多行合并为一个单元格，然后进行计数？

python、apache-spark、dataframe、pyspark

如何使用PySpark将多行合并为基于id的单个单元格？我有一个包含ids和产品的数据框架。首先，我想将具有相同id的产品合并到一个列表中，然后我想计算每个唯一列表出现的次数。输入示例1： id,product 1,HOME 1,mobile 2,watch 2,mobile 3,HOME 3,mobile 4,cd 4,music 4,video 输出： product,count HOME-mobile,2 mobile-watch,1 cd-music-video,1 使用sql代码的示例2：输入示例： cloths,brad cloths,edu cloths,keith clot

浏览 7提问于2017-12-13得票数 0

回答已采纳

2回答

如何创建一个列来度量另一个字符串列中存在的项数？

python、pandas、dataframe、group-by、pandas-groupby

我有数据，有员工，和他们的水平。 import pandas as pd d = {'employees': ["John", "Jamie", "Ann", "Jane", "Kim", "Steve"], 'Level': ["A/Ba", "C/A", "A", "C", "Ba/C", "D"]} df = pd.DataFrame(data=d) 如何添加一个新

浏览 10提问于2022-01-30得票数 2

回答已采纳

3回答

熊猫-根据索引内所有值的条件过滤多个索引

python、pandas、dataframe

我正在尝试使用类似于下面的多个索引来过滤数据。 import numpy as np import pandas as pd data = pd.DataFrame(np.random.rand(8), index=[list('AABBCCDD'), ['M', 'F']*4]) data['Count'] = [1,2,15,17,8,12,11,20] 在给定的外部级别索引中，“M”和“F”的“计数”都大于10，因此对于示例dataframe，应该选择所有&

浏览 1提问于2018-04-16得票数 5

回答已采纳

2回答

在Pandas上创建具有变化窗口的滚动平均值

python、pandas

我有一个Pandas数据帧，如下所示。我希望创建一个7天滚动平均温度。我知道如果是每天一次阅读(dataset['rolling_temp'] = dataset.iloc[:,3].rolling(window=7).mean())该怎么做，但问题涉及到每天随机读取一次。即1天可以是多行。任何帮助都将不胜感激！ day temperature 1 1 18.0 2 1 19.0 3 2 18.0 4 3 17.0 5 4

浏览 1提问于2020-05-29得票数 0

1回答

从存储在DataFrame中的列表中删除项

python、pandas、list、nlp

我有一个DataFrame，其中包含一些(文本)清洁广告在一栏和一些非常基本的描述相同的广告在另一栏。我还将术语频率以‘关键字’：频率格式存储在字典中。任务是从df中的列表中清除低于某个频率切点水平的所有术语。 import pandas as pd adset = {"ID": ["(1483785165, 2009)", "(1538280431, 2010)", "(1795044103, 2010)"], "Body":[['price', '#', &#

浏览 1提问于2021-11-12得票数 2

回答已采纳

4回答

将函数应用于可返回多行的pandas DataFrame

python、pandas、dataframe

我正在尝试转换DataFrame，这样一些行将被复制给定的次数。例如： df = pd.DataFrame({'class': ['A', 'B', 'C'], 'count':[1,0,2]}) class count 0 A 1 1 B 0 2 C 2 应转换为： class 0 A 1 C 2 C 这与使用count函数聚合的情况相反。有没有在pandas中实现它的简单方法(不使用for循环或列表理解)？

浏览 6提问于2012-10-24得票数 19

回答已采纳

1回答

使用分组变量计算多列中的值

python、pandas

我有一个pandas数据帧，其中包含如下数据： levels char_1 char_2 a dog dog a cat dog b cow cat b dog dog 我想对levels列执行group_by操作，并计算某个值在char_1列或char_2列中出现的总次数生成的数据帧将如下所示： levels char count a dog 3 a cat 1 b dog 2 b cow 1 b cat 1 我已经尝试过使用数据透视表，但是我

浏览 20提问于2020-07-03得票数 0

2回答

python熊猫过滤和聚合多个列并写入CSV

python、pandas、pandas-groupby

我想读取一个CSV文件并在多个列上计数/聚合我的输入数据如下 unique_identifier,date,flag1,flag2,flag3 a1,7/1/2017,FALSE,TRUE,FALSE a2,7/1/2017,FALSE,TRUE,FALSE a3,7/1/2017,FALSE,TRUE,FALSE a4,7/1/2017,TRUE,FALSE,FALSE a5,7/1/2017,FALSE,FALSE,FALSE a6,7/2/2017,FALSE,FALSE,TRUE a7,7/2/2017,FALSE,FALSE,TRUE a8,7/2/2017,FALSE,TRUE,

浏览 11提问于2017-07-03得票数 1

回答已采纳

1回答

pandas中的多行可以有一个唯一的索引吗？

python、pandas

pandas中的多行可以有一个唯一的索引吗？示例： index country value 1 NL 'hi' 2 NL 'wet' 3 SWE '4' 4 SWE 'maybe' 因此，在本例中，我不能将NL设置为索引，因为它不是唯一的。在pandas中，一个索引不能有多行吗？

浏览 1提问于2016-12-18得票数 3

1回答

在两列上执行group by后，获取级别1的组数

pandas、pandas-groupby

我正在对两列执行group by操作，需要计算level-1中值的数量我尝试了以下几种方法： >>> import pandas as pd >>> df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': [1, 2, 0, 4, 3, 4], 'C': [3,3,3,3,4,8]}) >>> pr

浏览 12提问于2019-06-24得票数 1

回答已采纳

1回答

统计SPARKSQL中的重复行数

pyspark、apache-spark-sql、spark-dataframe、pyspark-sql

我有一个要求，我需要计算配置单元表的SparkSQL中的重复行数。 from pyspark import SparkContext, SparkConf from pyspark.sql import HiveContext from pyspark.sql.types import * from pyspark.sql import Row app_name="test" conf = SparkConf().setAppName(app_name) sc = SparkContext(conf=conf) sqlContext = HiveContext(sc) df =

浏览 3提问于2018-02-01得票数 11

回答已采纳

1回答

SQL Server Integration Services与WF4

ssis、workflow-foundation-4

我必须将数据从excel导出到SQL，要求如下: 1. excel中的模式不同于Sql中的模式。与excel中的一行一样，将根据业务逻辑和单元格中的值在SQL中作为多行插入。2.在sql中插入数据之前，我必须应用业务规则。在某些情况下，数据对于sql中的插入无效。我可以在WF4中使用SSIS吗？LIke与SSIS将提取并加载数据，转换将由Wf4/

浏览 2提问于2012-10-15得票数 1

3回答

如何在列中找到具有类似名称的单元格，并使用Python和Pandas DataFrame对它们进行总结

python、pandas、dataframe

我有一个包含数据的巨大CVS文件，我需要以非常具体的方式按列总结单元格。我的DataFrame是： import pandas as pd df = pd.DataFrame({'country': ['Brazil','Brazil','Brazil','Brazil','Brazil','Brazil','Chile'], 'city': ['Salvador','Salvador','Teresina&#

浏览 1提问于2020-09-26得票数 0

回答已采纳

1回答

python:为另一个变量的每个值打印一个变量的最大值

python、pandas、group-by

给定此pandas数据帧，我正在尝试打印categ下每个值的最大时间值。例如，由于A=6的最大时间，B=9的最大时间和C=9的最大时间，我想打印像time=9:2，time=6:1这样的东西，你会怎么做？ import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split import xgboost as xgb import datetime import seaborn as sns from sklearn.

浏览 1提问于2021-07-22得票数 0

2回答

熊猫用第一个可用值的分裂来填充nan值。

python、pandas、dataframe

我正在尝试将DataFrame中的nan值替换为第一个可用值在以下所有nan值之间的拆分。在下面的例子中： import pandas as pd df = [100, None, None, 40, None, 120] df = pd.DataFrame(df) 我想得到： [33.33, 33.33, 33.33, 20, 20, 120] 如果我能找到一种方法来计算列中每个值后面的nan值的数量，那么我就可以运行一些计算来实现拆分。

浏览 2提问于2019-06-25得票数 3

回答已采纳

1回答

如何对与Pandas创建的每个组相关的一系列数据求和？

python、pandas、pandas-groupby

在Python pandas数据框中，假设我使用pandas groupby()方法对数据进行分组，结果如下：我如何从Third列中分别计算每个组(这里是A和B)的值的总和，这样我就可以在一个单元格中获得每个主要组的总和值？例如，我可以将12+32+43放在组A的新单元格中，将145+231+123放在组B的另一个单元格中。我的代码是： import pandas as pd data = pd.read_excel('file.xlsx') mydf = data.groupby[['First','Second']].sum()

浏览 0提问于2018-08-05得票数 0

1回答

在多个条件上选择

python、pandas、plot

我制作了这个数据帧，其中包含datetime64值形式的日期。我想要做的是一个有点愚蠢的例子，但它说明了我在多个标准上选择的观点。我想:对于2018年:绘制一个按月分组的条形图，其中包含不同的值。所以我想为2018年创建一个图表，在x轴上显示12乘以3条线。我希望有人知道这是如何工作的。提前谢谢你 import pandas as pd import numpy as np import random date_expected = np.arange('2006-01', '2008-06', dtype= 'datetime64[D]

浏览 15提问于2019-02-14得票数 1

回答已采纳

2回答

熊猫:将多行数据帧放入一个单元格中

python、python-3.x、pandas

我想将多行数据合并到一个单元格中，我已经尝试过多种方法将所需的输入合并为输出格式，但无法成功。下面是我的输入格式和期望输出格式，任何帮助都是非常感谢的！输入数据期望输出数据 import pandas as pd data = pd.DataFrame({"Text1": ["1_1" , "1_1" , "1_1" , "1_2" , "1_2" , "1-3" , "1-3" , &#

浏览 1提问于2022-05-03得票数 0

回答已采纳

2回答

我需要字符的共现数据帧

python、pandas、dataframe、embedding

import pandas as pd corpus = pd.DataFrame([[1, 'A B C A D B A'], [2, 'B A B B C B A']], columns=['id', 'sequence']) corpus 预期输出 A B C D 1 3 2 1 1 2 2 4 1 0 我有一个看起来像上面的数据帧。我需要计算每个字符的共现次数。

浏览 6提问于2021-10-09得票数 1

回答已采纳

2回答

如何根据一个参考列在Python中聚集行/行？

python、pandas、row、cell

假设我们在Pandas中有这样一个DataFrame： 0 1 2 3 4 0 Date Description ABC DEF 1 LOREM ISPUM 1

浏览 2提问于2022-08-21得票数 0

2回答

如何使用pandas识别表格中的区域？

python、pandas

我有一个带有表格的文件(.csv文件)。该表由许多子“区域”组成，如下例所示： ? 正如您所看到的，还有一些数据可以组合在一起(蓝色组、橙色组等)。现在.。颜色只是为了使概念清晰，但在.csv中没有由颜色标识的组。实际上，没有颜色来标识组，并且组的维度(行)可以改变。没有模式可以预测下一组在哪里有1、2、3、4或更多行。问题是，我需要打开该表，并使用pandas的数据帧导入它。在我的算法中，应该识别一个组，将其复制到另一个数据帧中，然后保存。如何使用pandas对数据进行分组？我在考虑将组编入索引，如下表所示： ? 但在这种情况下，我不能按顺序访问具有相同索引的单元格

浏览 43提问于2020-12-12得票数 0

回答已采纳

1回答

熊猫与独特的火柴融合在一起

python、pandas、dataframe、merge

我正试图解决合并两个数据集的问题。让我们看看一个例子： borrowed_money = {'name': ['Alex', 'Alex', 'David', 'David', 'David', 'Mike', 'Mike'], 'sum': [10,10,30,25,10,20,30]} intersted_in = {'name': ['David', 'Alex

浏览 2提问于2019-04-04得票数 2

回答已采纳

1回答

pandas -获取重复行的计数(跨多列匹配)

pandas

我有一个类似下面的表-唯一的ID和名称。我想返回任何重复的名字(基于匹配的第一个和最后一个)。 Id First Last 1 Dave Davis 2 Dave Smith 3 Bob Smith 4 Dave Smith 如果我没有ID列，我已经设法返回了所有列的重复计数。 import pandas as pd dict2 = {'First': pd.Series(["Dave", "Dave", "Bob"

浏览 192提问于2019-12-08得票数 1

回答已采纳

2回答

在Pandas dataframe中查找重复值的计数和排序

python、pandas

我有一个有很多栏目的Pandas dataframe，其中两个是“电影标题”和“年龄”，我想找到平均年龄最低的前5部电影，但只包括至少有100次收视率的电影(所以至少有100行)。例如： movie title age Title 1 10 Title 2 12 Title 2 12 Title 3 13 Title 3 13 Title 3 13 应成为： movie title # of ratings avg age Title 1

浏览 3提问于2016-04-02得票数 4

回答已采纳

1回答

计数数组在PySpark中每个类别包含字符串的次数

pyspark

我从spark数组“df_spark”开始： from pyspark.sql import SparkSession import pandas as pd import numpy as np import pyspark.sql.functions as F spark = SparkSession.builder.master("local").appName("Word Count").config("spark.some.config.option", "some-value").getOrCreate() np

浏览 19提问于2018-12-16得票数 3

回答已采纳

1回答

对Pandas数据帧中的列进行分组和排序

python、pandas

我有一个有很多列的Pandas数据框，其中之一是“电影标题”，我想找到出现在最多行的前5个电影标题，并将它们按降序排列。例如： movie title Title 1 Title 2 Title 2 Title 3 Title 3 Title 3 应该变成： movie title count Title 3 3 Title 2 2 Title 1 1 它可以在同一数据帧中，也可以在新的数据帧中。我可能错过了一个简单的解决方案，因为我对Pandas非常陌生。谢谢你的帮忙!

浏览 0提问于2016-04-02得票数 1

1回答

Pandas groupby，然后按组排序

python、pandas

我有一个新闻文章及其相关概念和情绪(NLP检测到)的数据集，我想按2个字段进行分组:概念和来源。下面是一个简化： >>> df = pandas.DataFrame({'concept_label': [1,1,2,2,3,1,1,1], 'source_uri': ['A','B','A','A','A','C','C','C'],

浏览 5提问于2020-06-08得票数 0

回答已采纳

1回答

使用pandas绘制线条(颜色、属性定义)图

python、pandas、matplotlib

我尝试使用pandas grouby数据集绘制具有不同属性(颜色、线型等)的多行。我的代码绘制了多个源代码的所有蓝线。如何在每个组中应用线路属性？我的代码是bleow。 from pandas import Series, DataFrame import pandas as pd import matplotlib.pyplot as plt xls_file = pd.ExcelFile(r'E:\SAT_DATA.xlsx') glider_data = xls_file.parse('Yosup (4)', parse_dates=[0]) each

浏览 0提问于2015-07-07得票数 0

2回答

使用时间戳的Python多行图

python、pandas、graph

我试着用python熊猫绘制图表，到目前为止我还能读取sqlite数据库。我无法使用时间戳生成图形。我想用python熊猫绘制多行图。我想要月份(X轴)和数值(Y轴)图的不同线。以下是我的数据帧(Df)输出：这是我的密码 import sqlite3 from pylab import * import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.dates as mdates import datetime as dt conn = sqlite3.con

浏览 2提问于2015-03-19得票数 0

回答已采纳

1回答

如何使用python大熊猫群或.DataFrameGroupBy对象创建唯一的组合列表

python、python-2.7、pandas

是否有更有效的方法使用熊猫群或pandas.core.groupby.DataFrameGroupBy对象创建一个独特的列表，系列或数据，在这里，我想要两个独特的组合N列。例如，如果我有列:日期、名称、购买的项目--我只想知道唯一的名称和日期组合--这很好： y = x.groupby(['Date','Name']).count() y = y.reset_index()[['Date', 'Name']] 但我觉得应该有个更干净的方法 y = x.groupby(['Date','Name'])

浏览 1提问于2014-08-27得票数 4

3回答

使用Pandas筛选组

python、pandas

我正在尝试使用Pandas向组中添加过滤器。在下面的棒球数据中，我希望计算出从入选列中最初的“N”到最后的“Y”所需的平均时间。本质上，我希望计算在导入列中包含'Y‘且有多行的每个组的长度。任何提示都会有帮助！ playerID yearid votedBy ballots needed votes inducted category needed_note 2860 aaronha01 1982 BBWAA 415 312 406 Y Player NaN 3743 abbotji01 200

浏览 3提问于2014-04-20得票数 1

2回答

如何在Pandas组中进行分组和合计

python、pandas

您好，我有以下DataFrame： # Import pandas library import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # initialize list of lists data = [['tom', 10,1], ['nick', 15,0], ['tom', 14,1], ['jason', 15,0], ['nick', 18,1], ['jaso

浏览 7提问于2020-06-22得票数 0

回答已采纳

1回答

Python中每个用户的排名

python、python-3.x、pandas、pandas-groupby

我有大量来自移动用户的博客&我需要创建一个名为'hop‘的新专栏。因此，在下面，用户47294872934从印度(小时0)到英国(小时15)。因此，他们的第一个地点是印度，第二个是英国。所以，我想要一个这样的新专栏， hour hop userid country 47294872934 India 0 1 UK 15 2 82718927392 Portugal 4 3 Spain 2

浏览 0提问于2018-10-29得票数 1

回答已采纳

1回答

如果在文本之间有两个空格，如何在excel中溢出单元格

excel、cells

我想在excel中分割单元格。我有一个列A，有许多行，文本之间有两个空格，例如 2加布里埃205.10变型机V 3361 3。必须分成5列。

浏览 3提问于2017-12-12得票数 0

回答已采纳

1回答

Pandas DataFrame中的多步聚合

python、python-3.x、pandas

在Pandas中，如何在同一个数据集中进行多步/顺序聚合？好像每个步骤都是下一个步骤的“子查询”。在SQL中，我可以这样想： SELECT x.A, COUNT(x.B) as B_COUNT, SUM(x.C_SUM) as C_SUM FROM ( SELECT df.A, df.B, SUM(df.C) as C_SUM FROM df GROUP BY df.A, df.B ) x GROUP BY x.A 在Python3.4和Pandas0.19.2中工作，我有这样一个数据框架： import pandas import numpy numpy.rand

浏览 0提问于2016-12-30得票数 1

回答已采纳

2回答

熊猫逗号分离的层次群和

python-3.x、pandas、pandas-groupby、hierarchical-data、multi-index

我有以下分层数据的数据格式。可以有一个级别和可变深度的多行。我试图得到a结果，在col_2中，我们看到实例的所有次级的聚合和。使用简单的groupby不能工作，因为它不理解层次结构。我尝试将col_1划分为多个列，名为级别-1到级别-6(深度)，因此将组按级别-1到级别-6，但结果仍然不正确，尽管数据是多索引的。分离前的代码： df.groupby(["col_1"], as_index=False).sum() 分离后的代码： df.groupby(["level-1","level-2","level-3","le

浏览 3提问于2020-04-24得票数 1

回答已采纳

1回答

在pandas中使用group by从组中获取不同的记录

python-3.x、pandas、group-by

假设我有这样的数据帧 >>> df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4],'value':[1,2,3,1,2,3,4,1,1]}) >>> df id value 0 1 1 1 1 2 2 1 3 3 2 1 4 2 2 5 2 3 6 2 4 7 3 1 8 4 1 现在我希望每个组中除了最后3条记录之外的所有记录都使用组id，这意味着我想删除所

浏览 0提问于2020-06-18得票数 0

3回答

Pandas计算唯一行

python、python-2.7、pandas、counter

我有一个pandas数据框架，类似于： ColA ColB 1 1 1 1 1 1 1 2 1 2 2 1 3 2 我想要一个具有与相同功能的输出。我需要知道每一行出现的次数(所有列都是相同的。在这种情况下，正确的输出应该是： ColA ColB Count 1 1 3 1 2 2 2 1 1 3 2 1 我尝试过这样的东西： df.groupby(['ColA','ColB']).ColA.count() 但是这给了我一些难看的输出，我在格式化时遇到了麻烦

浏览 2提问于2016-03-16得票数 15

回答已采纳

1回答

将熊猫数据Number转换为Networkx对象时的边数不同

python、dataframe、networkx

我正在使用networkx从一个txt文件构建一个电子邮件网络结构，其中每一行代表一个“边缘”。我首先将txt文件(3列：{‘#发件人’、‘收件人’、'time'})加载到Python中，然后使用以下代码将其转换为networkx对象： import networkx as nx import pandas as pd email_df = pd.read_csv('email_network.txt', delimiter = '->') email = nx.from_pandas_dataframe(email_df, '

浏览 1提问于2017-09-19得票数 0

回答已采纳

1回答

如何实现熊猫群对象的聚合功能？

pandas、signature

下面是这个问题的设置： import numpy as np import pandas as pd import collections as co data = [['a', 1], ['a', 2], ['a', 3], ['a', 4], ['b', 5], ['b', 6], ['b', 7]] varnames = tuple('PQ') df =

浏览 0提问于2014-09-04得票数 2

2回答

将熊猫数据从多列导出到嵌套字典

python、pandas、dataframe

这是一个类似的问题通过组合多行值将熊猫导出到字典但在这种情况下我想要一些不同的东西。 from pandas import DataFrame df = DataFrame([ ['A', 123, 1], ['B', 345, 5], ['C', 712, 4], ['B', 768, 2], ['B', 768, 3], ['A', 123, 9],

浏览 0提问于2020-02-05得票数 5

回答已采纳

2回答

比较Pandas中的相对开始日期

python、pandas、time-series

我想使用Pandas数据透视表的输出创建一个相对开始日期的表。数据透视表的列是月份，行是帐户，单元格是动作的运行总数。例如： Date1 Date2 Date3 Date4 1 1 2 3 N/A 1 2 2 第一行的第一个实例是Date1。第二行的第一个实例是Date2。新表的格式将使列现在是相对于第一个操作的月份，如下所示： FirstMonth SecondMonth ThirdMonth 1 1

浏览 1提问于2019-10-30得票数 1

4回答

在DataFrame中放置重复项以保持行中最少的空值

python、pandas

使用此DataFrame： d = {'A' : pd.Series(['AA', 'AA', 'AA', 'BB','CC'], index=['a', 'b', 'c', 'd','e']), 'B' : pd.Series([1., 2., 3.], index=['b', 'd','e']), 'C

浏览 7提问于2017-05-03得票数 8

回答已采纳

2回答

某些单元格有多行时如何读取excel文件

python、excel、pandas

我必须读取多个大的excel文件来尝试清理数据。最后一个问题是，有些单元格中有多行，或者我猜有些单元格跨越了多行。它是这样的： Index Col1 Col2 Col3 1 row1 row1 row1 2 row1.1 3 row1.2 4 row2 row2 row3 当我使用Pandas.read_excel(文件名)或Pandas.ExcelFile，然后使用sheet.parse(sheetname)时，它当然会读取索引2和3，其中大部分是空白行。根据Col1的跨度，我该如何将索引2和索引3合并为1？为了清楚起

浏览 28提问于2021-11-04得票数 1

回答已采纳