在pandas数据帧中查找具有匹配列子字符串的行对_在Pandas数据框中查找列子集处具有相同值的行子集(N行_查找Pandas中具有相同列值的数据帧的行 - 腾讯云开发者社区

、、

我在一个自动化消息的平台上收集见解，我想根据这种类型的消息出现的频率对它们进行分组。其中一些消息在语法上是相似的，其他消息则不是。例如，我的pandas数据帧目前看起来像这样： message | count -------------------------------------------|------- "Happy Birthday!" | 50 "Good luck on your first day of school!"

浏览 24提问于2021-07-20得票数 0

2回答

替换Python DataFrame列中的字符

、、、

下面显示的简单数据帧replace不起作用。 NewPhone列包含与原始列相同的值。 import pandas as pd SF = pd.read_csv(r"xxx.csv") SF['NewPhone'] = SF['Phone'].replace("(",'xxx') print(SF['NewPhone'])

浏览 0提问于2018-05-23得票数 4

1回答

从多个片段拼凑序列的算法

、、

我正在开发一个实时嵌入式系统。我试图创建一个详细的时间分析。我收集了运行时数据，记录了每个中断的开始和停止时间。每一次数据突发看起来都像这样 ISR# time ----- ---- 1 34 end 44 4 74 3 80 end 93 end 97 ... 我的输出通道带宽有限，我的高精度定时器很快就会溢出一个字，所以我用大约150微秒的脉冲串收集数据，然后慢慢地流出来。从这些数据中，我能够收集每一次中断所花费的时间，以及通话和抢占的次数。我想做的是把一个典型帧的完整执行序列组合在一起，大约2毫秒长。我突然意识到

浏览 6提问于2010-10-28得票数 1

2回答

Python pandas dataframe sort_values不起作用

、

我有下面的pandas数据帧，我想按'test_type‘排序 test_type tps mtt mem cpu 90th 0 sso_1000 205.263559 4139.031090 24.175933 34.817701 4897.4766 1 sso_1500 201.127133 5740.741266 24.599400 34.634209 6864.9820 2 sso_2000 203.204082 6610.437558 24.466267 34.83

浏览 1提问于2016-09-20得票数 0

回答已采纳

2回答

在Pandas中以不同的时间间隔合并和填充两个数据帧

、、

我有两个数据帧我想在Pandas中合并。它们都有一个我正在合并的日期时间列，但是，一个每分钟和5分钟有行(取决于年份)，而另一个dataframe每15分钟有行。如果我执行一个外连接，我可以合并它们，但是每15分钟才会有来自两个数据帧的数据。我想复制15分钟的数据，并用这些数据填充每1或5分钟的行。因此，12:00AM的数据将填充12:14之前的所有行(包括12:14然后，12:15 to会被复制，并填写到12:29 to等。这有意义吗？我如何才能做到这一点？看起来很相似，但我不确定如何为我的确切场景实现，特别是考虑到我的一个数据帧在不同的年份从5分钟到1分钟的间隔。

浏览 0提问于2014-12-19得票数 4

4回答

向量化或加速PANDAS列上的Fuzzywuzzy字符串匹配

、、、

我正在尝试在充满组织名称的PANDAS列中寻找潜在的匹配项。我目前正在使用iterrows()，但它在大约有70,000行的数据帧上非常慢。在查看了StackOverflow之后，我尝试实现了一个lambda row (apply)方法，但这似乎几乎不能加快速度。数据帧的前四行如下所示： index org_name 0 cliftonlarsonallen llp minneapolis MN 1 loeb and troper llp newyork NY 2 dauby o'connor and zaleski llc carmel IN 3 wegner c

浏览 4提问于2018-10-04得票数 14

3回答

将熊猫字符串列拆分为一个数组，并将该数组与另一个数组匹配。

、、

我有一个Pandas dataframe，看起来像这样： var1 var2 0 A_B_C_D 123 1 E_F_G_H 456 2 I_J_K_L 789 我希望通过在'_‘上拆分var1来查询数据帧，然后将其与我定义的另一个数组进行匹配。假设这个数组是array_to_match_to = ['A', 'B', 'C', 'D']，那么我想过滤数据帧，只得到行0。此外，我想匹配，无论顺序，所以匹配'D'，'A'，'B

浏览 4提问于2017-06-09得票数 2

回答已采纳

2回答

使用regex将一列中的字符串中的文本仅提取到python dataframe中的另一列时出错

、、

我正在尝试从pandas dataframe中列的行中的字符串数据中仅提取文本部分到新列中。当我尝试这样的东西时： import pandas as pd import re df = pd.DataFrame({"Id": [1,2] , "Text" : ["This is 20/06/2019; 00:13:45; Time stamp", "This is another 23/04/2019 11:23:35 Time stamp"]}) print(df) 我得到了一个数据帧，如下： Id

浏览 20提问于2019-06-18得票数 2

回答已采纳

2回答

pandas -将df.index从float64更改为unicode或字符串

、、、、

我想将数据帧的索引(行)从float64更改为字符串或unicode。我以为这能行得通，但显然不行： #check type type(df.index) 'pandas.core.index.Float64Index' #change type to unicode if not isinstance(df.index, unicode): df.index = df.index.astype(unicode) 错误消息： TypeError: Setting <class 'pandas.core.index.Float64Index'&g

浏览 5提问于2016-02-13得票数 71

回答已采纳

1回答

带有orient=“read_json”的pandas表

、、

我已经丢弃了一个扩展基于this answer的json编码器的数据帧字典。我只是改变了转储数据帧的方式，出于我自己的目的，将表的“记录”改为orient=的“表”。不知何故，我无法从json读取数据帧；准确地说，pandas似乎可以正确读取它(没有引发异常)，但它充满了NaN值。有没有人可以检查我是否做错了什么，或者这是不是熊猫的bug (可能指的是多索引数据帧)？我使用的是pandas版本1.1.4。下面的代码足以(我希望)测试pandas是否在我的机器上是KO的，或者我是否以某种方式弄乱了数据帧的格式。我还尝试用一个包括两个索引的虚拟数据帧来重现它，并且没有遇到问题。还要注意

浏览 13提问于2020-12-03得票数 0

回答已采纳

1回答

pandas :在dataframe中索引数千行

、、

最初，我的数据集中有100k行。我使用pandas将csv读取到一个名为data的数据帧中。我尝试使用.loc进行51行的子集选择。我的索引标签是数值0，1，2，3等等。我试着使用这个命令- data = data.loc['0':'50']，但结果很奇怪，它从0到49999的所有行，看起来像是在取行，直到索引值从50开始。类似地，我尝试使用这个命令- new_data = data.loc['0':'19']，结果是从0到18999的所有行。这会不会是熊猫身上的一个虫子？

浏览 2提问于2018-09-20得票数 0

1回答

按列对Pandas DataFrame排序

、、

如何按列对pandas数据帧进行排序？我在这里读到了关于sort_values的。当我跑的时候 df = pd.DataFrame([(2,'a'),(1,'b')],columns = ['num','let']) df df.sort_values(by='num', axis=1, ascending=True, inplace=True) 我获得错误KeyError：'num‘

浏览 1提问于2017-10-05得票数 0

1回答

将多个列合并为单个数组列的DataFrame转换

、

我是python的新手。在Python版本3.7.4中，我有一个pandas数据帧，如下所示(有4列)： df = pd.DataFrame({'Patient_Key': [2333836, 2319735], 'DX1': ["N184", 'Z6827'], 'DX2': ['D649', 'N184'], 'DX3': ['E785'

浏览 4提问于2021-07-24得票数 0

1回答

Python Pandas DataFrame数据标识

、、、

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

1回答

创建一个每个值只有1行的新数据帧

、

我正在尝试用原始数据帧(Dataframe 1)中的行填充pandas数据帧(Dataframe 2)。我在下面创建了一个模拟的Dataframe 1： Ref Number Name 1 Alpha 2 Alpha 3 Alpha 4 Alpha 5 Beta 6 Beta 7 Beta 8 Charlie 我想删除在以前的行中出现值名称的行。也就是说，Dataframe 2应该如下所示 Ref Number Name 1

浏览 20提问于2017-07-07得票数 1

回答已采纳

1回答

具有部分字符串匹配的两个Pandas数据帧之间的映射/压缩

、、、、

我有两个数据帧，每个数据帧大小约为1,000,000行。两者共享一个公共的'Address‘列，我用它来连接数据帧。使用这个连接，我希望将信息从dataframe1移动到dataframe2，我称之为“details”。 df2.details = df2.Address.map(dict(zip(df1.Address,df1.details))) 然而，address列并不表现出完全的通用性。我尽了最大努力清理，但仍然只能移动大约40%的数据。有没有办法修改上面的代码以允许部分匹配？这一次我完全被难住了。数据非常简单，如所述。两个小数据帧。虚构的样本数据如下： df1 Addr

浏览 1提问于2019-04-02得票数 0

3回答

串联多个子串的Pandas过滤

、、、、

我需要过滤pandas数据帧中的行，以便特定的字符串列至少包含所提供的子字符串列表中的一个。子字符串可能包含不常见的/ regex字符。比较不应该涉及正则表达式，并且不区分大小写。例如： lst = ['kdSj;af-!?', 'aBC+dsfa?\-', 'sdKaJg|dksaf-*'] 我现在像这样应用这个遮罩： mask = np.logical_or.reduce([df[col].str.contains(i, regex=False, case=False) for i in lst]) df = df[mask] 我的数据帧很

浏览 1提问于2018-01-31得票数 41

回答已采纳

1回答

Pandas append函数添加新列

我想将一行附加到我的数据帧中。下面是代码 import pandas as pd citiesDataFrame=pd.read_csv('cities.csv') citiesDataFrame=citiesDataFrame.append({ 'LatD': 50, '"LatM"' : 70, '"LatS"' : 40, '"NS"': '"S"', '"LonD"': 200, '&#

浏览 40提问于2020-11-25得票数 0

1回答

在ValueError中输入数据结果:替换的长度必须等于序列长度

、

我有一个包含以下列的数据框 missing_df.columns.tolist() 它返回一个列表： ['order_id', 'customer_id', 'date', 'nearest_warehouse', 'shopping_cart', 'order_price', 'delivery_charges', 'customer_lat', 'customer_lo

浏览 13提问于2020-10-17得票数 0

回答已采纳

2回答

从训练数据中删除异常值

、、、

假设我有一个pandas数据帧，我使用以下内容来删除异常值： y = df['Label'] df = df.drop(['Label'], axis=1) new_df = df[(np.abs(stats.zscore(df)) < 3).all(axis=1)] 由于我不想在流程中包含'Label'列，如何也删除异常值标签？谢谢

浏览 17提问于2020-10-01得票数 1

回答已采纳

2回答

移除行包含Pandas dataframe中的非英语单词。

、、、

我有一个由4行组成的熊猫数据框架，英文行包含新闻标题，有些行包含像这个这样的非英语单词。 **SheÃ¢â‚¬â„¢s the Hollywood Power Behind Those ...** 我想要删除所有的行，像这个，所以所有的行，至少包含非英语字符在Pandas数据帧。

浏览 11提问于2020-11-25得票数 6

回答已采纳

1回答

根据另一个数据帧中的位置从主数据帧中提取子序列

、、、、

我要提取数据帧'B‘中第一个和最后一个位置所指示的子序列。我想出的算法是：标识位于A位置中的B行，找出位置的相对位置(即移动位置以使它们从0开始)，使用相对位置作为范围提取子序列。上述算法的问题在于运行时。我需要另一种方法来比现有的方法更快地编译代码。期望输出： first last sequences 3 5 ACA 8 12 CGGAG 105 111 ACCCCAA 115 117 TGT 使用的数据帧： import pandas as pd A = pd.DataFrame({'first.sequence': ['AAAC

浏览 1提问于2022-09-25得票数 4

回答已采纳

2回答

为什么dataframe对象要转换为TimeSeries对象

、、

假设我有一个数据框架。有多个列(例如：‘，'B')使用以下代码，我希望仅基于一列就生成一个新的数据格式： df2 = df1['A'] 但是，当我这样做时，数据帧突然被转换为TimeSeries。 In [5] print type (df2)<class 'pandas.core.series.Series'> 非常odd...can有人向我解释为什么会发生这种事.？

浏览 3提问于2015-12-14得票数 0

回答已采纳

1回答

按列的总和对数据进行升序排序

我有一个数据帧，看起来像这样： v1 v2 v3 v4 v5 v6 .. .. .. .. .. .. .. .. .. .. .. .. 有100行。我希望在col v5和v6中按个人的sum将数据排序为升序。我试过使用下面的代码，但是没有用： datatestt <- rowSums(df(V5, V6)) 上面的代码给了我一个错误，我怎么排序我的数据呢？

浏览 0提问于2019-11-30得票数 0

2回答

在两个不同的Pandas数据帧上循环

、、

我有两个不同的数据帧，我正在尝试比较。因此，我的第一个数据帧有10行，第二个有2000行。我尝试做的是将我的第一个df中的第一行与另一个df中的全部2,000行进行比较。然后对我的第一个df中的下一行执行相同的操作。这是我目前拥有的代码。它在前2,000中工作得很好，然后当我应该递增时，它崩溃了。 i = 1 j = 1 for u in userFrame.iterrows(): for d in dbFrame.iterrows(): if userFrame['tag'][i] == dbFrame['tag1'][j]:

浏览 0提问于2016-02-12得票数 2

5回答

删除特殊字符模式中的正则表达式

、

现在我在pandas数据帧中得到了一个字符串，如下所示 "[""www.abccc.com"]"", "[""www.gsfa.com"]"" 所以我想做的就是用正则表达式的'‘替换“”和“” 我尝试了几种组合来首先抓住模式，例如： r' \["[""] ' r' [\"[""] ' r' [\"[\""] ' 不是所有的都能工作..。当我在regex101中使用以下代码时

浏览 2提问于2020-07-30得票数 1

2回答

从引号中解开.csv行

、、

.csv文件如下所示 col1, col2, col3 "a, b, c" "d, e, f" 我想解开引号中的行以正确读取pandas/Python中的文件。如R中的重复问题所述，可以读取.csv数据两次: 1)展开辅助数据帧的第一列中的数据，以及2)调用辅助数据帧的第一列上的读取函数。对熊猫来说，最优雅的方式是什么？

浏览 0提问于2018-12-15得票数 1

1回答

pandas在csv上提高OutOfBoundsDatetime，而不是在sql上

、、、、

我有一个运行pandas版本0.25.2的服务。此服务从数据库读取数据并将快照存储为csv df = pd.read_sql_query(sql_cmd, oracle) 查询的结果是一个包含一些非常大的日期时间值的数据帧。(如3000-01-02 00:00:00)之后，我使用df.to_csv(index=False)创建csv快照并将其写入文件在安装了pandas 0.25.3的不同机器上，我将csv文件的内容读入数据帧，并尝试将date列的数据类型更改为datetime。这将导致OutOfBoundsDatetime异常 df = pd.read_csv("xy.csv

浏览 18提问于2019-11-08得票数 1

回答已采纳

1回答

在Pandas中，我们可以按名称和正则表达式选择列吗？

、

假设我的Pandas数据帧如下： import pandas as pd df = pd.DataFrame( dict(ID = [1, 2, 3], xz = [0, 1, 1], yz = [4, 5, 6], yx = [7, 11, 18], xy = [10, 10, 11]) ) 如果我想选择名称中包含x的所有列，我可以执行以下操作： df.filter(regex = 'x', axis=1) 如果我还想按列名进行选择，我会执行以下操作，但这将不起作用。 df.filter(ite

浏览 0提问于2020-05-23得票数 0

2回答

在列表中检查panda dataframe列的匹配项

、、

我有一个包含两列的pandas dataframe，一个文件id号和一个来自该文件的关键字列表。我本质上希望能够遍历每一行，看看所选的关键字是否在文件关键字列表中，以及它是否打印出文件id。或者我可以创建一个包含所有正匹配的新数据帧，并从那里打印文件id。经过研究后，我想使用df.loc[df['key words'] == key_word, :]，这将给我一个新的数据帧，所有积极的匹配。这样做的问题是没有肯定的匹配，因为我忘记了我的“关键字”列在每一行都有一个关键字列表。有人能帮我找到解决方案吗？非常感谢编辑:我无法提供我的表的片段，因为数据是敏感的，但这是它的一般概念：

浏览 4提问于2020-06-05得票数 0

1回答

如何使用Python比较太大而无法放入内存的数据帧？

、、、

我有可能很大的数据帧，大约有10列和1e6行，具有不同的维度。假设行在两个数据帧中都是唯一的。由于这些数据帧不能加载到内存中，我如何找到一个数据帧中存在于另一个数据帧中的所有行？我目前只处理较小的数据帧，但我很快就会弄清楚这一点。我非常喜欢使用pandas，但我愿意使用不同的包(xarray?)如果有显著的好处。如果您推荐一个不同的包，请提供一些代码来进行比较。下面是我如何与内存中适合的pandas数据帧进行比较： import pandas as pd def row_intersection(df1, df2): noNA = df2.fillna(0) retur

浏览 23提问于2021-09-02得票数 0

回答已采纳

1回答

基于最后一行中值的Dataframes

、

我如何根据最后一行的每一列中的值在R中子集CSV？例如，我读取一个名为mnist.csv的CSV文件，它的维数为400x600。 columns 1 2 3 4 .......... 600 rows: 1 2 3 4 . . . 400 0 0 0 1 1 1 ...3 3 3 我想要创建的数据只有最后一行中值为0的列和行，而最后一行的值是1的另一个数据

浏览 0提问于2018-03-20得票数 0

回答已采纳

3回答

如何从pandas数据帧中删除方括号

、、、

在将str.findall()应用于pandas数据帧的列之后，我想出了方括号中的值(更像是list)。怎样才能去掉方括号？ print df id value 1 [63] 2 [65] 3 [64] 4 [53] 5 [13] 6 [34]

浏览 2提问于2016-07-01得票数 21

回答已采纳

3回答

如何创建一个用随机字符串填充列的pandas数据帧？

、

我想创建一个包含2列x行的Pandas数据帧，其中包含随机字符串。我找到了生成带有随机int和随机字符串生成器的pandas数据帧的代码。我仍然没有看到一条清晰的路径来创建一个带有随机字符串的pandas数据框架。用于随机int数据帧的代码 import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) 随机字符串的代码 import string import random def id_gener

浏览 60提问于2019-06-01得票数 4

回答已采纳

3回答

删除R中行编号为NA.x的行

、、

很抱歉没有提供模拟数据集，但这是我的问题的屏幕截图：你看到的是我的数据帧的一个子集。我正在尝试从我的数据帧中删除实际行号中包含NA, NA.1, NA.x ...NA.6的行。我尝试返回到我的原始.csv文件并删除数据结束处的大约200个空白行，但这没有帮助。有什么想法吗？

浏览 1提问于2017-03-03得票数 0

2回答

Python-循环trhough df并输出与行一样多的dfs

、

我的python代码生成了一个pandas数据帧，如下所示： enter image description here 我需要将其转换为另一种格式以实现以下目的:循环遍历数据帧中的每一行，并输出与表中的行一样多的数据帧。每个dataframe都应该有一个额外的列: timestamp，并且命名为"Type“列中的值。举个例子，我会有 enter image description here 我正在为从哪里开始而苦苦挣扎-我希望这里有人能给我一些建议？

浏览 23提问于2021-06-21得票数 0

1回答

查找二进制文件中所有字节字符串的出现

、、

我正在编写python脚本，以便在一个大型二进制文件中搜索几个不同的字节字符串，到目前为止，它工作得很好，但是，我遇到了一些异常。以下是我迄今所做的工作： for i in range(0, fileSizeBytes): data.seek(readOffsetIndex, 0) # Change the file index to last search. print('Starting Read at DEC: %s' % str(readOffsetIndex))

浏览 0提问于2018-03-08得票数 5

回答已采纳

1回答

如何在两个数据帧之间高效地匹配字符串

、、

浏览 14提问于2020-04-12得票数 1

回答已采纳

1回答

从具有相同索引和列的两个pandas数据帧执行计算的最快方法

、、

我有两个pandas数据帧，每个都有相同的索引和列。我想创建第三个pandas数据帧，其中包含其他两个细胞的乘积。这是我目前的解决方案，但它太慢了。 import pandas as pd new_df = pd.DataFrame(columns=df1.columns, index=df1.index, data=[]) for col, values in new_df.iteritems(): for idx, value in values.iteritems(): foo = df1.loc[idx][col] bar = df2.l

浏览 10提问于2019-05-11得票数 1

回答已采纳

1回答

在Python的pandas中，为什么转换后的数据要多占用4倍的空间才能将变量加倍

、

我对pandas DataFrame中的一些变量执行了一些简单的z变换。在数据帧中总共216列中，我转换了其中的196列，然后将其中的197列连接到原始的216列上，总共有412列。然后，我使用to_csv函数将新数据帧写入CSV文件。原始数据约为300MB，而新数据集为1.2 is。添加不到两倍的列会导致最终文件的大小增加大约4倍，这似乎很奇怪。代码是： import pandas as pd full_data = pd.read_csv('data.csv') names = full_data.columns.tolist() names = names[16

浏览 0提问于2012-10-16得票数 0

回答已采纳

3回答

将一行中的字符数计算为新列

、

我有一个pandas数据帧，它大约有100列，我想计算一行每列中的字符数。在Excel中，我会做类似(Len(Concat(A2:CA2))的事情 df['newcolumn'] = ? in Pandas Python

浏览 9提问于2019-07-10得票数 2

回答已采纳

1回答

Pandas -当只查看某些列时，查找两个数据帧之间的异常行

、、

我有两个dataframes -一个是由用户从powerapp编辑的。另一个是直接来自onedrive的。列标题几乎相同，我需要比较两个dataframe，并向来自powerapps的dataframe中添加任何新行。以下是两个示例数据帧： Powerapps数据帧： Send/Collect Hospital Courier Kit Manufacturer Status 0 Send Nuffield Ipswich

浏览 1提问于2018-08-31得票数 4

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

1回答

将请求文本响应加载到Pandas数据帧中

、、

正在尝试将请求响应中的文本加载到Pandas数据帧中。 url = "https://api.semrush.com/" parameters = {"type": "phrase_organic", "key": "*****", "phrase": phrase, "database": "us", "display_limi

浏览 8提问于2019-02-23得票数 4

回答已采纳

1回答

合并R中非常宽的数据帧中的列

假设我有一个数据帧，如下所示： set.seed(123) df<-data.frame(ID=letters[1:10], A1=rnorm(10),A2=rnorm(10,1,3), B1=rnorm(10),B2=rnorm(10,1,3), C1=rnorm(10),C2=rnorm(10,1,3), D1=rnorm(10),D2=rnorm(10,1,3), E1=rnorm(10),E2=rnorm(10,1,3)) 我想要的是将A-E中的*1和

浏览 8提问于2016-08-30得票数 1

回答已采纳

1回答

如何使用正则表达式删除python pandas DataFrame中的行？

、、

我有一个模式： patternDel = "( \\((MoM|QoQ)\\))"; 我想删除pandas dataframe中列df['Event Name']与此模式匹配的所有行。哪种方法是最好的？数据帧中有超过100k行。

浏览 8提问于2016-10-10得票数 26

回答已采纳

1回答

Python :在PCA转换后合并/连接Dataframe生成NAN

、、、

import pickle import numpy as np import pandas as pd from sklearn.externals import joblib from sklearn.decomposition import PCA PCA = joblib.load('pcawithstandard.pkl') with open('collist.pickle', 'rb') as handle: collist = pickle.load(handle) for chunk in pd.read_csv

浏览 17提问于2019-02-19得票数 0

回答已采纳

2回答

从名称向量组合数据帧

、、

我有一个问题，我认为很容易解决，但我没有设法找到解决办法。我有大量希望按行绑定的数据帧。为了避免列出所有数据帧的名称，我使用"paste0“快速创建数据帧名称的向量。问题是，我无法使rbind函数从这个名称向量中识别数据帧。更确切地说： df1 <- data.frame(x1 = sample(1:5,5), x2 = sample(1:5,5)) df2 <- data.frame(x1 = sample(1:5,5), x2 = sample(1:5,5)) idvec <- noquote(c(paste0("df",c(1,2)))) &

浏览 1提问于2015-07-17得票数 2

回答已采纳

2回答

如何在Pandas中展平groupby操作的结果？

、

使用Pandas数据帧，有没有一种方法可以扁平化groupby操作的结果，而不必使用临时数据帧，然后将其合并到原始数据帧中？假设我需要创建一个依赖于聚合操作的"result“列，就像这个场景： import pandas as pd df = pd.DataFrame({'box': [1,1,1,2,2,3,3,3,3], 'item': ['apple', 'durian', 'pear', 'orange', 'banana', 'apple',

浏览 82提问于2020-05-04得票数 2

回答已采纳

2回答

如何在pandas中选择与字符串列表匹配的行，而不仅仅是一个特定的字符串？

、

假设我们有一个dataframe- df和一个标记为'A‘的列。对于选择与一个字符串匹配的行-'some_ string '，df‘a’.str.concludes(‘some_string’)效果很好。我的问题是，是否有一个相应的方法可以传递给包含字符串列表的方法，以便可以获得部分匹配？我可以给它一个字符串列表而不是'some_string‘吗？我试图避免使用for循环和切片数据帧并将其连接成新的数据帧。假设数据帧是 pd.DataFrame(np.array([['cat', 2], ['rat', 5], ['

浏览 9提问于2019-03-08得票数 2

回答已采纳