Pandas:列出现在一个df中，而不出现在另一个df中_从pandas df中选择行，其中索引出现在另一个df中的某处_根据另一个df中的值填充新的pandas df - 腾讯云开发者社区

、、、

假设我有以下pandas df import pandas as pd d = [0.0, 1.0, 2.0] e = pd.Series(d, index = ['a', 'b', 'c']) df = pd.DataFrame({'A': 1., 'B': e, 'C': pd.Timestamp('20130102')}) 现在我有了另一个数组 select = ['c', 'a', 'x'] 显然，元素'x'在我

浏览 1提问于2022-02-26得票数 0

回答已采纳

1回答

将csv列/行从1, 1，1,2，2，2，3,3,3到1，2，3,1，2，3，3，2，2，3，3，3重新排序

、、、、

我需要重新排序一个csv文件，该文件通过从0到184000的id列对数据进行分组。不幸的是它的0,0,0,0,0,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3等等..。我需要1, 2, 3, 1, 2, 3, 1, 2, 3等等。 0, 1, 2, 3等的第一个实例，制作第一个系列，第二个实例，0, 1, 2, 3，下一个等等。有人建议使用Python和Pandas，但我想不出这一点。我可以读取csv，列出列和行的数据，但是找不到根据我的需求对其进行排序的方法。我一直在看pandas.Series，但我觉得我的术语搞错了. 那么两件事，它是什么叫我想做的事情，谁知道我可以

浏览 1提问于2020-11-15得票数 1

回答已采纳

7回答

检查熊猫数据索引中是否存在值

、、

我相信有一个显而易见的方法来做到这一点，但现在想不出任何光滑的东西。基本上，我不想提出例外，我想让True或False来看看熊猫df指数中是否存在一个值。 import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) 我现在的工作是： sum(df.index == 'g')

浏览 2提问于2014-05-08得票数 203

回答已采纳

2回答

用两个印刷品匹配相同的单词

、、

我使用os来列出目录中的文件名。我还使用熊猫在CSV文件中列出了一列的内容。我已经打印了两者的结果，现在我想匹配出现在两个打印中的名称，并标识哪些名称是唯一的一个打印。下面是我的代码，它获取CSV文件的名称和内容。 import os, sys import pandas as pd path = "/mydir/csvfile" dirs = os.listdir( path ) for file in dirs: print file fields = ['Column'] df = pd.read_csv('/mydir/csv_

浏览 1提问于2016-08-03得票数 2

回答已采纳

1回答

我能以某种方式在团队中，在潘达斯中应用增量值吗？

、、、

如果我在Pandas中有一个很大的数据，那么假设df item_serial_number, barcode 12312313-123123123 ABC 12312313-123123124 ABC ... 44312313-123123125 DEF 55512313-123123126 DEF 此df列出具有不同物理大小的设备。因此，每种设备的不同数量-- ABC或DEF --适合于其类型的盒子。我在一个dataframe bf中列出了有多少种设备适合它们的盒子： barcode, items_per_box ABC 3 DEF 2 ... 我需要分配每个设备到一个编号

浏览 1提问于2021-03-04得票数 2

回答已采纳

2回答

在减去列值的同时，如何合并Pandas中的两个数据聚合？

、、

我正在研究一个基本的库存系统，并且很难找到解决这个障碍的方法。我有两个Pandas数据格式，它们都共享两列: PLU和QTY。PLU充当一个项目标识符，QTY是一个dataframe中项目的数量，而是另一个数据中的销售数量。以下是两个非常简单的数据示例： final_purch： PLU QTY 12345678 12 90123456 7 78901234 2 pmix_diff： PLU QTY 12345678 9 90123456 3 789

浏览 6提问于2022-06-27得票数 0

回答已采纳

11回答

在pyspark dataframe中显示不同的列值。

、、、

有了Pandas，您如何实现与Pandas df['col'].unique()相当的功能。我想列出列中的所有唯一值。不是SQL类型方式(寄存器模板然后是SQL查询不同的值)。另外，我不需要groupby，然后是countDistinct，而是想在该列中检查不同的值。

浏览 21提问于2016-09-08得票数 176

回答已采纳

1回答

我如何制作一本字典，其中有熊猫数据列表作为一个值？

、、、

我想把熊猫的资料放进字典里，而不是反过来。我试图将数据块列表作为一个值放在字典中，Python返回一个错误而不作任何解释。我想做的是：我将信使聊天日志csv文件导入到熊猫的数据中，并设法将其按日期划分，并将它们都列在一个列表中。现在，我想迭代这个列表，并将它分割得更多:如果聊天停止超过15分钟，它就会被分割成块。我想列出另一个列表，列出这些特定日期的聊天块，然后将它们放在字典中，其中键是日期，值是这些块的列表。然后，Python突然返回一个错误。下面是我被困住的地方，并返回错误。 import pandas as pd from datetime import datetime #

浏览 3提问于2017-11-23得票数 1

回答已采纳

3回答

熊猫元素的比较与创造选择

、、

在dataframe中，我希望将列的元素与值进行比较，并对传递比较到新列的元素进行排序。 df = pandas.DataFrame([{'A':3,'B':10}, {'A':2, 'B':30}, {'A':1,'B':20}, {'A':2,'B':15}, {'A'

浏览 5提问于2016-05-24得票数 2

回答已采纳

2回答

复制熊猫DF N次

、、

所以现在，如果我重复一个列表，即x = [1,2,3]* 2 I get x as [1,2,3,1,2,3]，但是这并不适用于Pandas。因此，如果我想复制熊猫DF，我必须列出一个列、一个列表和多个： col_x_duplicates = list(df['col_x'])*N new_df = DataFrame(col_x_duplicates, columns=['col_x']) 然后对原始数据执行连接： pd.merge(new_df, df, on='col_x', how='left') 这现在重复熊猫DF

浏览 3提问于2014-01-27得票数 6

回答已采纳

4回答

将一列的值逐列列出

我想我有一个相对简单的问题，但我想不出如何解决。我有以下数据框架： a <- c("A","B","C","C","D","D","E") b <- c(1,2,3,4,5,6,7) c <- data.frame(a,b) 现在，我想要一个新的dataframe，在单元格上列出b的所有值，如下所示 A;1 B;2 c;3,4 D;5,6 E;7 谁能给我指明正确的方向？我在用一个列表示max(b)，另一个使用一个列表示min(b)，然后将这些列粘贴在一起，但这给了

浏览 13提问于2014-02-10得票数 0

回答已采纳

2回答

在python中创建短表和窄表，并在列中列出

、

我目前有一个要压缩的数据集。例如，假设一个列是mother，另一个列是child。母亲可能有一个以上的孩子，但每个孩子只有一个母亲。因此，在我的理想输出中，每个母亲将有一行，母亲作为一列，而孩子的列表作为另一列。相反，我的当前数据每个孩子有一行，母亲是复制的。我可以在R中这样做，基于这个非常有用的。例如： library(data.table) dt <- data.table(mother = c("Penny", "Penny", "Anya", "Sam", "Sam", "Sam")

浏览 1提问于2019-03-15得票数 1

回答已采纳

1回答

如何在绘制数据之前删除某些值

、、

我第一次用蟒蛇。我有一个csv文件，有几列数据:位置，高度，密度，日等.我正在绘制高度(i_h100) v密度(i_cd)，并设法将高度限制为低于50的值，代码如下。我现在想把y轴上的值限制在一定的“日”范围内，比如说(85-260)。我想不出怎么做。 import pandas import matplotlib.pyplot as plt data=pandas.read_csv('data.csv') data.plot(kind='scatter',x='i_h100',y='i_cd') plt.xlim(right

浏览 0提问于2019-06-21得票数 1

回答已采纳

2回答

熊猫`.to_pydatetime()‘不在DataFrame里工作

、、

我有像'03-21-2019'这样的字符串，我想将其转换为本地Python对象:即datetime.datetime类型的字符串。通过pandas转换非常容易。 import pandas as pd import datetime as dt date_str = '03-21-2019' pd_Timestamp = pd.to_datetime(date_str) py_datetime_object = pd_Timestamp.to_pydatetime() print(type(py_datetime_object)) 有结果 <class

浏览 10提问于2019-10-28得票数 6

1回答

熊猫:按(OR)对行进行过滤--不相互包容

、、

我正在寻找一种通过字符串中的替代方案过滤pandas行的方法。我有许多不同的术语，我想要搜索，所以将他们放在几个变量，而不是列出他们，每次我需要访问他们。我现在做的是： df = df[df["A"].str.contains("BULL|BEAR|LONG|SHORT", case=False)] 相反，你可以做如下的事情： bull = "BULL|LONG" bear = "BEAR|SHORT" leverage = bull + bear df = df[df["A"].find(leverage,

浏览 1提问于2015-06-25得票数 1

回答已采纳

2回答

潘达斯柱间交叉值的检测

、

假设我有以下数据： df = pd.DataFrame({'a': [10, 20, 30, 40, 50], 'b': [0, 10, 40, 45, 50]}, columns = ['a', 'b']) 我想列出以下指数： I-1< bi和ai >= bi 以检测某个值在某个时态序列中何时跨越另一个值。是否有一种Pandas惯用的方法来实现这一点而不迭代所有的元素？我尝试创建一个带有标志的新列，通过这样做来表示交叉： df['t'] = (df['a'].shift(1

浏览 5提问于2019-12-18得票数 4

回答已采纳

1回答

是否有方法保存已被Python中的另一个函数修改的CSV文件？

、、、、

我刚开始使用Python编程，我正在尝试制作一个CLI，允许用户使用Pandas和Click预定义的命令来过滤csv数据。我现在有选项供用户列出原始数据并按颜色筛选数据。我的list()和color()函数似乎按照我希望的方式工作。我想添加一个save()函数，它允许用户在数据过滤后将数据导出到一个新的CSV文件中，但是我想不出如何将已经过滤的数据传递给save()函数。这是我目前的代码。 #!/usr/bin/env python import click #imports click for CLI commands import pandas as pd #import for p

浏览 6提问于2022-11-02得票数 1

1回答

Pandas多标准中的样式设置

、、

在Pandas数据帧上，我想在特定列上应用样式，在从不同列值中获取的多个条件上应用样式。 table = product sales revenues fruit 10 6 eggs 15 12 fruit 16 8 如果产品是水果，我希望销售价值(收入没有修改)在低于17时以红色显示，如果产品是鸡蛋，则适用另一个标准(=低于20)。因此，只有图10应该以红色显示。我尝试了style.apply和style.applymap，但是找不出一个单独处理不同列的样式函数。提前感谢您可以提供帮助的元素。

浏览 8提问于2021-07-04得票数 0

1回答

将pandas数据帧的行放入列表形式

、、、

我有一个熊猫数据框架的形式 T1 T2 0 A B 1 C D 2 B C 3 D E 4 F A 我想生成另一个pandas数据帧，它列出了T1中的每个唯一项，并且T2有自己的行，并且有一个列和一个列，其中一个列包含唯一项的名称，另一个列包含它在原始数据帧中与其共享一行的项的列表。例如，在本例中，我将查找以下形式的内容： Name List 0 A [B, F] 1 B [A, C] 2 C [D, B] 3 D [C, E] 4 E [D] 5 F [A] 有没有人能建议一种合适

浏览 0提问于2020-07-31得票数 4

1回答

在没有内存错误的情况下将一个巨大的数据帧列表合并成一个数据帧？

我有一个巨大的数据帧(时间序列)列表(列表中超过5500个条目，每个条目的大小为750x2)。如何在不出现内存错误的情况下将其合并到单个数据帧中？我试过使用pandas.merge、pandas.concat，但什么都不起作用

浏览 0提问于2017-11-29得票数 0

3回答

比较python中的两个列表并将结果保存在单独的列表中

、、、、

到目前为止我的代码是： import csv myIds = ['1234','3456','76'] countries = [] # open the file with open('my.csv', 'r') as infile: # read the file as a dictionary for each row ({header : value}) reader = csv.DictReader(infile) data = {} for row in reader: fo

浏览 2提问于2020-04-22得票数 1

回答已采纳

1回答

使用两个数据帧并将其中一列更新到其他datafarame pandas时出现切片复制错误

、

我正在尝试比较2个df，并通过创建一列将一个数据框的值填充到另一个数据框中我使用了以下代码 df['location']=df1['location'] for i in range(0,len(df)): for j in range(0,len(df1)): if df['Name'][i]==df1['Name'][j]: df['location'][i] =(df1['location'][j]) 下面列出了df 我得到了

浏览 5提问于2020-05-10得票数 1

回答已采纳

2回答

将多条Python转换为并发DataFrame并与源数据合并

、、、、

如果这是一个基本的问题，我很抱歉。我觉得这应该很容易，但我想不出来。我有下面列出的代码，它本质上查看CSV文件中的两列，并匹配类似于0.7的职称。为此，我使用difflib.get_close_matches。但是，输出是多个单行，每当我试图转换为DataFrame时，每一行都是它自己的DataFrame，我不知道如何合并/连接它们。所有代码以及当前和期望的输出都在下面。任何帮助都将不胜感激。现行守则是： import pandas as pd import difflib df = pd.read_csv('name.csv') aLists = list(df[

浏览 4提问于2022-06-14得票数 2

回答已采纳

1回答

如何在不键入每个数据帧名称的情况下连接多个数据帧

我希望将多个DataFrame连接在一起，而不是在concat函数中列出所有的名称。我已经以字符串元素列表的形式获得了dataframe的名称列表。有没有什么方法可以把它传递给concat函数？ df_1 = pandas.read_csv('some_file_1') df_2 = pandas.read_csv('some_file_2') df_3 = pandas.read_csv('some_file_3') some_list = ['df_1','df_2','df_3'] pa

浏览 12提问于2019-04-30得票数 1

回答已采纳

4回答

Pandas -查找在每个类组中显示的唯一值

、

我有一个python pandas表，如下所示： class | id _____________________ A 12311894945 A 12311760566 A 12311433981 A 12299990440 A 12291758744 B 12311894945 B 12311760566 B 12311433981 B 12299990440 B 12291758744 C 1229

浏览 0提问于2021-03-05得票数 3

1回答

熊猫-使用列表来填充多个索引的最后一级的附加值

、、

所以我有一个数据列出每个河站的“STA”(任意长度)和“Z”(RS)。指标是“河流”、“河段”、“RS”、“堰厅”。我需要做的是，对于每个'RS'，在'STA‘列表中的每一个项目添加一个与'RS’相对应的额外行。这一行需要有“STA”项的“Weir”值，“Weir”值为0或NaN。我一直在尝试DF.groupby(level=0)中嵌套的i、df的不同组合，以及附加、堆栈、熔融等不同的组合，但都找不出。现在，如果我想用'Z‘作为'Weir Elev’的值，我将如何执行这个操作？

浏览 0提问于2020-06-04得票数 0

1回答

输出到Excel时，Pandas合并单元格

、、、

我有两张桌子。表1是按周/天列出的，表2是按周列出的。当我在pandas中合并两个表并输出到Excel时，如何才能在表3而不是表4中获得结果？要点是在Excel中只显示同一周的col2的1个值，而不是每天重复显示Col2值。这个表实际上很大，有更多的维度，所以我正在寻找一个可扩展的解决方案，而不是专门针对这个小表。我正在考虑pandas合并函数和工作表函数，但遇到了麻烦。谢谢! 表1 ? 表2 ? 表3 ? 表4 ?

浏览 330提问于2021-08-10得票数 0

回答已采纳

4回答

熊猫一种热编码:将频率较低的类别捆绑在一起

、、、

我正在对一个包含大约18个不同类型值的分类列进行一次热编码。我只想为那些值创建新列，这些值显示的值超过某个阈值(假设为1%)，并创建另一个名为other values的列，该列的值为1如果值不是那些频繁的值。我在用Pandas和Sci-kit学习。我已经探索过熊猫get_dummies和sci的one hot encoder，但是我想不出如何将不那么频繁的值绑定到一个列中。

浏览 5提问于2017-04-10得票数 6

回答已采纳

1回答

窗口数据框中的Python Boto3列表实例

、

我正在尝试使用Boto3在一个表中列出我的EC2实例。 instances = ec2.instances.filter( Filters=[{'Name': 'instance-state-name', 'Values': ['running']}]) instance_count = sum(1 for _ in instances.all()) RunningInstances = [] for instance in instances: id = instance.id name = self.g

浏览 2提问于2018-04-26得票数 0

2回答

根据值0的出现情况对Pandas中的列进行编码

、

我有一个Pandas数据框，它的列是这样的， df = pd.DataFrame() df['A'] = [1, 1, 0, 1, 1, 0] 我想用这样的值创建另一个列， [1, 1, 1, 2, 2, 2] 我们的想法是从值1开始，当我得到一个1时，仅当最后一个值为0时，才递增该值。换句话说，如果我有一个0，那么在下一步中递增该值。我使用应用程序来完成此操作，如下所示： k = 1 def fn(row): global k a, b = row['A'], row['x'] if a == 1 and b =

浏览 9提问于2019-07-09得票数 1

回答已采纳

1回答

合并数据帧，其中列具有默认值和重写

、、

我有一个Pandas数据帧，列出了各种系统的阈值： METRIC SYSTEM_NAME YELLOW RED 16 pagins NaN 500.0 1000.0 17 preadsec NaN 5000.0 10000.0 18 swapins NaN 250.0 500.0 19 cpupcent foo 30.0 90.0 20 pagins bar 456.0 123.0 我想将这个df合并到另一个包含这些

浏览 0提问于2018-08-13得票数 0

2回答

Python和Pandas对象分配

、、

最近，我开始学习python进行数据分析，并且在使用DataFrame和Series时，我在试图理解对象分配的一些情况时遇到了问题。首先，我理解更改一个对象的值，不会改变第一个对象中赋值的另一个对象。典型的： a = 7 b = a a = 12 到目前为止，a = 12和b = 7。但是，当我使用Pandas时，我有以下情况： import pandas as pd my_df = pd.DataFrame({'Col1': [2, 7, 9],'Col2': [1, 6, 12],'Col3': [1, 6, 9]}) pd_colnam

浏览 2提问于2020-01-18得票数 1

回答已采纳

5回答

多个熊猫数据帧中列值的频率

、、

我有多个熊猫数据帧(超过70个)，每个都有相同的列。假设每个数据帧中只有10行。我希望在每个数据帧中找到列A‘值，并列出它。示例： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name'

浏览 11提问于2020-09-06得票数 0

回答已采纳

1回答

取消透视列pyspark dataframe，其中value是字典列表

、、、、

我已经从字典列表创建了一个pandas数据帧，并使用json_normalize取消了一列的透视。现在我必须将代码转换为使用pyspark而不是pandas。 df = pd.json_normalize(list_json,'Messages',['ID']) ID, Active, Description, Priority 21122, true ,Test description1, 2 21233,true ,Test description1, 2 21233,true ,test2 , 3 在Pyspark中，我想不出一个类似的函数。我已经使用

浏览 0提问于2021-03-10得票数 0

1回答

Python Pandas -选择等于的数据框列

、

这段SQL代码的Pandas等价物是什么？ Select id, fname, lname from table where id = 123 我知道这相当于Pandas中的SQL 'where‘子句： df[df['id']==123] 这将选择特定的列： df[['id','fname','lname']] 但我想不出怎么把它们结合起来。我在网上看到的所有示例都选择有条件的所有列。我希望选择具有一个或多个条件的有限数量的列。

浏览 7提问于2017-08-31得票数 11

回答已采纳

2回答

熊猫：.resample()、.rolling()等链式方法的组合

、、、

我想构建一个pandas.DataFrame的扩展--让我们称之为SPDF --它可以在简单DataFrame所能做的事情之外做一些事情： import pandas as pd import numpy as np def to_spdf(func): """Transform generic output of `func` to SPDF. Returns ------- wrapper : callable """ def wrapper(*args, **kwargs):

浏览 2提问于2018-07-11得票数 6

回答已采纳

1回答

将特定数据导出到csv文件

、、

初学者python。请跟我慢慢来:) 我有一个整合脚本，它以‘打印’文件列表结束，无论它们是整合还是突破候选文件。虽然它打印良好，我想采取这些打印和创建2个单独的csv文件。该脚本所做的是读取dataset/daily文件夹中的数百个CSV文件，并创建数据框架，然后找出哪些股票是整合者或突破候选人。我正在尝试做的是让脚本导出两个单独的列表，一个列出合并程序，另一个列出数据中的突破股票符号，但这样做有很多问题。你可以在底部看到这些线条。任何帮助都将不胜感激。 import os, pandas def is_consolidating(df, percentage=2.5):

浏览 13提问于2021-03-20得票数 0

1回答

如何将熊猫DataFrame转换为count表？

、

我有一个包含列的DataFrame，我称之为A、B、C、D等等。我只关心A和B列。我想得到另一个DataFrame，其中列是A中的唯一值，行是B中的唯一值，每个单元格都包含原始DataFrame中包含这对A和B值的行数。我可能可以通过迭代行和计数，然后构造新的计数表来做到这一点，但我觉得有一种更有效的方法来使用pandas函数(groupby？pivot?)但我想不出确切的配方。举个例子： index A B C D 0 m x 2 3 1 m x 0 1 2 n x 1 1 3 m y 5 9 4 n z

浏览 3提问于2020-11-23得票数 1

1回答

使用Pandas滤波功能后的SettingWithCopyWarning

、

我的代码的目标是用一个过滤的版本覆盖一个数据文件。以下代码返回下面的警告：代码： df = df[df.col>1] df.col2 = df.col2.astype(float) 错误： /root/.virtualenvs/data_tools/local/lib/python2.7/site-packages/pandas/core/generic.py:2177: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[r

浏览 2提问于2015-10-16得票数 1

回答已采纳

1回答

导入多个excel文件并合并为单个pandas df，源名称为列

、、、

我正在尝试用python将一堆xlsx文件合并成一个单一的pandas数据帧。此外，我还想包含一个列，它列出了每一行的源文件。我的代码如下： import pandas as pd from pandas import ExcelWriter from pandas import ExcelFile import glob import os # get the path for where the xlsx files are path = os.getcwd() files = os.listdir(path) files_xlsx = [f for f in files if f[-4

浏览 12提问于2019-11-09得票数 1

回答已采纳

3回答

将数据表合并到同一列

、、

我有两个不同的数据(学生的表现)。 dict1 -第一学期的表现 dict2 -第二学期的表现我需要连接两个df，以便学期的子列出现在学科的列中。 import pandas as pd dict1 = {'Students': ['A', 'B', 'C'], 'Dicsipline1': ['a', 'na', 'a'], 'Dicsipline2': ['a', 'na', 'a']} dict

浏览 8提问于2022-01-13得票数 3

回答已采纳

2回答

从pandas列和行数据创建字符串

、

我感兴趣的是生成一个由pandas行和列数据组成的字符串。给定以下pandas数据帧，我只对从具有正值的列生成字符串感兴趣 index A B C 1 0 1 2 2 0 0 3 3 0 0 0 4 1 0 0 我想创建一个新列，该列追加一个字符串，该字符串列出一行中哪些列是正数。然后，我将删除数据来自的所有行： index Positives 1 B-1, C-2 2 C-3 4 A-1

浏览 1提问于2018-06-19得票数 1

1回答

Python:使用熊猫创建二分图的边列表

、、

我有一个简单的文件，按名称列出文本，然后列出作为文本一部分的单词： text,words ANC088,woods dig spirit controller father treasure_lost ANC089,controller dig spirit ANC090,woods ag_work tomb ANC091,well spirit_seen treasure 在使用pandas时，我有这样的解决方案，尽管很简单，它可以为一个二分图的两边获取一个节点列表，一边列出文本，另一边列出与文本相关的单词： import pandas as pd df = pd.read_csv(ope

浏览 4提问于2015-07-02得票数 0

回答已采纳

1回答

潘达斯DataFrame指数的运算

、

如何轻松地对Pandas DataFrame索引执行操作？假设我创建了一个类似于这样的DataFrame： df = DataFrame(rand(5,3), index=[0, 1, 2, 4, 5]) 我想找出平均抽样率。我现在这样做似乎不太对。 fs = 1./np.mean(np.diff(df.index.values.astype(np.float))) 我觉得一定有更好的方法，但我想不出来。谢谢你的帮助。

浏览 2提问于2013-10-01得票数 1

回答已采纳

3回答

将pandas DataFrame中的每小时时间序列拆分为特定日期和所有其他日期

、、、

我在熊猫DataFrame中有一个每小时频率的时间序列： import pandas as pd import numpy as np idx = pd.date_range(freq="h", start="2018-01-01", periods=365*24) df = pd.DataFrame({'value': np.random.rand(365*24)}, index=idx) 我有一个日期列表： dates = ['2018-03-20', '2018-04-08', '2018-07-1

浏览 0提问于2019-09-02得票数 2

1回答

pandas数据帧单元的numpy数组的元素平均值

、、、

我有一个2x1的pandas数据帧，其中2个单元格包含numpy数组： >>> import numpy as np >>> import pandas as pd >>> a0 = np.array([[1, 2], [2, 2]]) >>> a1 = np.array([[3, 2], [1, 1]]) >>> df = pd.DataFrame([[a0], [a1]]) 我可以计算两个数组的元素平均值，如下所示： >>> np.mean(df[0]) array([[ 2. ,

浏览 7提问于2018-01-24得票数 1

回答已采纳

1回答

熊猫:如何对数据中至少出现n次重复项目的数据进行筛选

、、、

我有一个包含重复条目的Pandas DataFrame；有些条目被列出了两次或三次。我想对它进行筛选，以便它只显示至少n倍列出的项。 DataFrame包含3列：“可乐”、“可乐”、“colC”。在确定项目是否被多次列出时，应该只考虑'colB‘。注意:这不是drop_duplicates()。正好相反，我想删除在dataframe中小于n次的项。最终结果应该只列出每一项。

浏览 4提问于2015-10-03得票数 15

回答已采纳

1回答

dataframe列上的日期偏移量

、、

我得到了一个Pandas和一个包含datetime64[ns]数据类型的称为过期的列。df.['expiration'][0]给了Timestamp('2010-12-31 00:00:00')。我想从这个专栏中减去一个日历日，但不知道怎么做。我尝试了pandas.tseries.offsets.DateOffset(days=1)，但这使错误不能在日期时间/时间增量操作[<DateOffset: kwds={'days': 1}>]中使用非绝对DateOffset。 THis显然是因为它只在时间索引上工作。所以我试着 import

浏览 2提问于2014-12-08得票数 1

回答已采纳

1回答

用于过滤CSV文件的CSV字典

、、、、

我正在使用Python 3.6和pandas和numpy。我有两个CSV文件，都不包含任何标题(所以索引是内置的)。一个是包含计算机名称的单列列表: PC001 PC002 PC003 ... 另一个文件是系统的导入文件。它是一个csv文件。而pc名称是第三列: addprinter，终端，PC001，某物，某物添加打印机，终端，PC002，某物，某物添加打印机，终端，PC003，某物，某物... 现在，导入文件包含数千个条目，我只需要将该行复制到一个新的csv (将其命名为-be-importd.csv)，该csv包含来自hostnames.csv的pc名称我用下面这句话来“接近”： np

浏览 3提问于2018-02-06得票数 1

回答已采纳

2回答