从pandas dataframe中删除少于3个字符的所有行_Pandas从dataframe中删除所有单个字符_如果'id‘出现少于2次，则删除pandas dataframe中的行 - 腾讯云开发者社区

python、pandas、dataframe

我有一个数据集，它有时包含由于大小而无法插入到SQL中的无关注释。注释与我正在做的事情无关，但格式不好，所以我不能常规地通过查找代表其开头的符号来找到它们。我需要的是找到每个长度超过250个字符的单元格，并将其替换为保留积分(如果您可以按列执行此操作)，因为在一天结束时，我希望在每个文件中保留两列，所以我可以在dataframe.columns中调用x: if x != (column_name to )来做这件事下面的示例代码 import numpy as np import pandas as pd data = {'country': ['Italy&#

浏览 6提问于2020-03-05得票数 0

回答已采纳

1回答

用大量字符串加快PyArrow Parquet到Pandas的数据格式

python、pandas、parquet、ray

我有一个熊猫DataFrame我想经常查询(射线通过一个API)。我试图加快它的装载，但它需要大量的时间(3+s)把它变成熊猫。对于我的大多数数据集，它是快速的，但这个不是。我猜是因为其中90%是字符串。 [742461 rows x 248 columns] 它在磁盘上大约是137 on。为了消除磁盘速度这一因素，我将.parq文件放置在tmpfs挂载中。现在我试过： pyarrow/parquetReading 用pyArrow Parquet (read_table)阅读，然后把它扔给熊猫(读到桌子上是即时的，但使用to_pandas需要3s)，玩了几乎所有我在pyArrow上能想到的

浏览 8提问于2020-05-28得票数 4

2回答

熊猫数据-使用WildCards选择行

python、pandas

我是蟒蛇的新手。我的问题有点含糊不清。如果单元格中的任何字符串与特定通配符规则匹配，我希望从dataFrame中选择行。让我们假设这个例子：表到屏幕： df=pd.DataFrame({'Column':[ 'select rows in pandas DataFrame using comparisons against two columns', 'select rows from a DataFrame based on values in a column in pandas', 'use a list

浏览 5提问于2017-02-12得票数 2

回答已采纳

4回答

大熊猫:如何移除比符号更大的东西

python、pandas

假设我有下面的示例DataFrame from pandas import Series, DataFrame df = DataFrame({'A':['1', '<2', '3']}) 我想将A列从字符串转换为整数。在“<2”的情况下，我想简单地去掉'<‘符号，并将1(最近的整数小于2)放在第二行。最有效的方法是什么？这只是一个例子。我正在处理的实际数据有数十万行。谢谢你提前帮忙。

浏览 2提问于2014-03-24得票数 2

回答已采纳

1回答

如何根据字符串模式条件删除/删除/过滤pandas数据帧中的行？

python、pandas、database、dataframe

浏览 13提问于2020-10-28得票数 0

回答已采纳

1回答

将值附加到Pandas系列中

pandas、add、series

我想从文件中提取一个特定的行。有许多文件，因此产生了许多行/值。我想把所有的值都放入一个Pandas DataFrame中。为此，目的是将名为"11“的行放入一栏"11”(系列)，将名为"22“的行放入下一栏/系列"22”，将"33“行放入最后一栏/系列。目的： 11 22 33 file1 0.4 4.1 6.2 file2 0.5 4.3 6.1 file3 0.6 4.6 6.1 file4 0.8 4.1 6.7 ... ...

浏览 2提问于2017-03-24得票数 2

回答已采纳

2回答

在应用函数之后，如何用多行替换熊猫中的一行？

python、pandas、dataframe、text-processing、data-processing

我有一个熊猫数据，它只包含一个列，其中包含一个字符串。我想要向每一行应用一个函数，该函数将将字符串按句子拆分，并将该行替换为从函数生成的行。示例dataframe： import pandas as pd df = pd.DataFrame(["A sentence. Another sentence. More sentences here.", "Another line of text"]) df.head()输出 0 0 A sentence. An

浏览 3提问于2022-02-15得票数 2

回答已采纳

3回答

如何将这两种模式结合起来，并加以否定呢？

vim

在VIM中，我想删除任何不是2或3个字符的行。 :g/^..$/d :g/^...$/d 删除2或3行字符。如何将两者合并为一个，并否定它，即“不要删除2或3字符行”

浏览 0提问于2020-08-19得票数 5

回答已采纳

1回答

如何删除随机抽样的数据行，以避免再次抽样？

python、python-3.x、pandas、numpy

我有12行x5列的dataframe (df)。我从每个标签中取样1行，并创建一个由3行x5列组成的新的dataframe (df1)。我需要在下次从df中抽取更多行时，不要选择已经在df1中的行。那么，我如何从df中删除已经采样的行呢？ import pandas as pd import numpy as np # 12x5 df = pd.DataFrame(np.random.rand(12, 5)) label=np.array([1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3]) df['label'] = label #3x5 df1

浏览 0提问于2016-12-12得票数 1

回答已采纳

3回答

使用Python读取大型csv文件

python、dataframe、csv、parsing、dask

我使用Dask读取了2.5 to的csv文件，Python给了我错误。这是我写的代码： import pandas as pd import numpy as np import time from dask import dataframe as df1 s_time_dask = time.time() dask_df = df1.read_csv('3SPACK_N150_7Ah_PressureDistributionStudy_Data_Matrix.csv') e_time_dask = time.time() 以下是我从Python得到的错误： dask_df

浏览 0提问于2021-06-17得票数 0

2回答

将大型Pandas Dataframe从“稀疏”浮点数转换为int

python、pandas、numpy、dataframe、nan

我正在接收来自具有大量列(~20000)的上游组件的Pandas DataFrame，所有这些组件都具有dtype float64，并且大多数条目是NaN (这是一袋文字编码文档)。示例： 1 2.0 NaN 1.0 NaN NaN NaN 1.0 NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 2 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 3 NaN NaN 1.0 NaN 4.0 NaN 1

浏览 3提问于2020-10-02得票数 1

回答已采纳

2回答

如何修复ImportError: DLL加载失败:找不到指定模块

python、python-3.x、pandas

我已经在Windows8.1上安装了Python3.6.5和pycharm社区版本2020.1.2，pro..it在numpy上工作完全正常，但当我导入熊猫时，它显示error....please帮助我摆脱这个问题.它只是显示了这个..。C:\Users\india\Desktop\final\venv\Scripts\python.exe C:/用户/印度/桌面/最终/测试.py回溯(最近一次调用)：文件“C:/用户/印度/桌面/最终/测试.py”，第1行，导入熊猫文件"C:\Users\india\Desktop\final\venv\lib\site-packages\panda

浏览 2提问于2020-06-09得票数 1

1回答

将熊猫DataFrame作为PickledObjectField存储在Django Model中是不是一种坏做法？

python、django、pandas

我在Django模型中存储一个熊猫DataFrame作为PickledObjectField。我需要根据特定的逻辑访问和修改这个DataFrame。Pandas使这项工作变得容易得多，我有一个使用Pandas选择和过滤器的engine类。我是否应该有一个单独的模型，将每一行存储在DataFrame中，然后使用django-pandas读取，执行操作并更新模型？这里的关键是，将通过添加/删除一些行来修改DataFrame，因此，如果要将其存储在模型中，则删除所有记录并重新填充模型会更容易。 DataFrame少于100行，所以我不担心可伸缩性。

浏览 0提问于2018-12-15得票数 0

1回答

删除大熊猫中的行直到第一次出现特定值

python、pandas

我想删除用户第一次发生的行以及DataFrame中每个唯一用户的前一行。例如，我有下面的Dataframe，我想获得另一个dataframe，它首先删除"val“列1中的行，并为每个用户删除其前面的行。 user val 0 1 0 1 1 1 2 1 0 3 1 1 4 2 0 5 2 0 6 2 1 7 2 0 8 3 1 9 3 0 10 3 0 11 3 0 12 3

浏览 0提问于2019-07-06得票数 0

3回答

您是否可以对Pandas数据进行示例，并修改原始数据以删除采样的行？

python、pandas、dataframe、random

我要求的可能不是计算效率/价格低廉。本质上，我想要做的是随机从我的熊猫dataframe中选择一行，然后修改原始的DataFrame，使该行基本上是从数据中“弹出”的。到目前为止，我尝试的是接受DataFrame的转置，然后在我想要删除的“列”上应用pop()。列的索引是由随机数选择的。 import pandas as pd from random import randrange df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]), columns=['a',

浏览 10提问于2022-04-21得票数 1

1回答

如何读取csv文件，跳过描述(在几行中)到dataframe？

python、pandas、dataframe、csv

我有几个csv文件。每个csv文件都有其跨几行的描述(15行在几个文件中，100行在其他几行中等等)。我想把csv文件读入数据格式。我尝试使用pandas.DataFrame('file1.csv')将数据读入数据。不管怎么说，我得到了以下错误。 Traceback (most recent call last): File "snowdepthData.py", line 5, in <module> depthDF = pd.DataFrame('Alaska_SD_Sep2019toOct2020.csv') F

浏览 2提问于2021-02-13得票数 1

回答已采纳

1回答

按日期索引对齐多个熊猫系列

pandas、dataframe、time-series

我有n个pandas series。他们大多拥有相同数量的数据，但并非总是如此。 print(str(len(dfS1))) print(str(len(dfS2))) print(str(len(dfS3))) print(str(len(dfS4))) 3025 3026 3025 3026 我需要确保每一天行都正确地对齐，例如： dfj = dfS1.join(dfS2, how='outer', rsuffix='_1').join(dfS3, how='outer', rsuffix='_2').join(dfS4,

浏览 0提问于2019-02-06得票数 0

回答已采纳

3回答

如何删除带有pandas的df的最后两行

python、pandas、rows

这是我正在使用的代码。我想删除文件的最后两行。实际上，我正在处理一个更大的文件，最后两行出现了波动。一旦我让它在这个小的格式上工作，我将在我的主要源代码中实现它。 import pandas as pd data = {'name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'year': [2012, 2012, 2013, 2014, 2014], 'reports': [4, 24, 31, 2,

浏览 6提问于2018-12-05得票数 6

回答已采纳

1回答

使多索引Pandas Dataframe不对称

python、pandas、dataframe

我有一个多索引的dataframe，大致如下所示： import pandas as pd test = pd.DataFrame({('A', 'a'):[1,2,3,4,5], ('A', 'b'):[5,4,3,2,1], ('B', 'a'):[5,2,3,4,1], ('B','b'):[1,4,3,2,5]}) >>> Output A B a b a b 0 1 5 5 1 1 2 4

浏览 0提问于2020-01-10得票数 1

回答已采纳

1回答

熊猫不会打开奇怪的TSV文件

python、pandas、csv

这里的TSV文件来自，它来自，不会在Pandas上打开。我尝试过几件事:使用标签分隔符，用read_excel打开它(网站上说它与所有现代系统兼容)。将熊猫作为pd导入 path = "C:..\\WEOApr2022all.xls" dataframe = pd.read_csv(path, sep="\\t", encoding='windows-1252') 错误: chunks =self._reader.read_low_memory(Nrow)文件"pandas_libs\parsers.pyx"，第805行，在p

浏览 9提问于2022-09-02得票数 1

回答已采纳

2回答

删除和替换Nan值，并将其替换为熊猫数据中行的平均值

python、pandas、dataframe

我有一个很大的DataFrame，看起来像： c1 c2 c3 0 NaN 1.0 NaN 1 NaN NaN NaN 2 3.0 6.0 9.0 3 NaN 7.0 10.0 ... 我想： 1-删除所有"Nan“值的行。就像样本中的第二行。 2-将其他行中的所有"Nan“值替换为行的平均值。注意:在行中，我们有不同的"Nan“值。你能帮我一下吗？谢谢。而且，这个链接没有解决我的问题：下面是我的DataFrame示例： import pandas as pd import numpy as np df = pd

浏览 3提问于2022-02-08得票数 1

回答已采纳

1回答

TypeError:当我在熊猫查询中使用Series.str.len()时，无法理解的类型：'numpy.ndarray‘？

python、pandas

我遇到了一个问题，当我在熊猫查询方法中使用Series.str.len()时，实际上我的env中不支持Series.str的所有函数，而是在其他envs中工作，所有这些env都有几乎相同版本的熊猫和numpy。(我相信Series.str.xxxxx以前能在我所有的env中工作) Env1 Python 3.9.7 numpy==1.21.4 pandas==1.3.4 当我运行pd.DataFrame(columns=['core_text']).query("core_text.str.len()>1")时，文件回溯(最近一次调用)：文件"&

浏览 5提问于2022-01-13得票数 1

2回答

使用日期索引在pandas中删除一行，python

python、pandas

我正在尝试删除由python中的pandas创建的dataframe中的最后一行，但似乎遇到了麻烦。 index = DateRange('1/1/2000', periods=8) df = DataFrame(randn(8, 3), index=index, columns=['A', 'B', 'C']) 我尝试了drop方法，如下所示： df.drop([shape(df)[0]-1], axis = 0) 但它一直说label不包含在轴中。我也尝试使用索引名称，但它似乎仍然不起作用。任何建议都将不胜感激。谢谢！

浏览 0提问于2012-07-10得票数 5

回答已采纳

1回答

如何根据Pandas中特定值中的一列转换仅在一列中具有唯一值的DataFrame

python、pandas

我有一个这样的DataFrame： item_id item_price 1 10.0 1 5.0 1 6.0 1 7.0 2 2.0 3 3.0 4 5.0 我试图得到一个DataFrame，item_price列只包含一系列唯一的值。然后删除其他不符合这种条件的行，如下所示： item_id item_price 2

浏览 0提问于2018-11-19得票数 1

回答已采纳

2回答

连接Pandas DataFrame中的行

python、pandas、dataframe

我对熊猫的DataFrame对象有个问题。我读过csv文件，我的DataFrame是这样的：我想用符号‘|’连接行之间的行，应该是这样的： Pandas有这样的功能，用特定的分隔符连接行，或者我应该如何实现

浏览 0提问于2019-12-02得票数 0

2回答

如果每个值相等，则删除pandas数据帧行

python、pandas

如果我有一个pandas dataframe，它有一个包含浮点值的行，并且该行中的所有值都是相等的，我如何从dataframe中删除该行？

浏览 0提问于2019-11-30得票数 2

1回答

Pandas DataFrame有多行而不是多列

python、pandas

这可能是一个非常简单的问题，即使在相当长的一段时间后，我也无法管理我想要的东西。我有一个pandas DataFrame，我想从一行向新的Dataframe添加几个cols。在这种情况下，应该添加更多的值，然后将此DataFrame附加到另一个one。不知何故，我的"df_row“总是显示为一列。然后，当我将它添加到df_result中时，它也只有一列，而不是6列。错误在哪里？ Thx #Create empty df df_result = pandas.DataFrame(columns= ["filename, class, x, y, lbl, pred, c_p

浏览 8提问于2019-10-01得票数 0

回答已采纳

1回答

`pandas.DataFrame.to_html()`无表边界‘和’`tr样式‘

python、html、pandas

根据标题，从pandas.DataFrame.to_html()生成“干净的”HTML代码是可能的吗?如果是的话，那么如何？我已经发现，border=...和justify=...参数控制在那里显示的内容，但是显然不管您在那里输入了什么值，您似乎总是得到它们。下面是一个最低限度的工作示例： import pandas as pd import numpy as np df = pd.DataFrame(data=np.arange(3 * 4).reshape(3, 4)) df.to_html(border=0, justify='inherit') 它产生： <

浏览 1提问于2018-07-21得票数 6

1回答

Python Dataframe -在正则表达式匹配之间提取多行

python、regex、python-3.x、pandas、dataframe

我正在处理一个python 3.x项目，它需要读取一个需要过滤的大型TXT文件(例如，删除多个空格、空行、以某些字符串开头的行等)，最后通过REGEX匹配进行拆分。我现在正在做的是使用pandas dataframe来存储每一行(这使得使用pandas startswith()或endswith()删除行变得很容易)。另一方面，通过让文本文件的每一行对应于DataFrame中的一行，我不知道如何在REGEX匹配之间提取数据。下面是一个示例： | 0 | REGEX MATCH | | 1 | data | | 2 | data | | 3 | REGE

浏览 5提问于2017-09-20得票数 0

1回答

用标签和布尔组合设置多索引Pandas

python、pandas

给定多个索引数据，如何选择与索引的一个标签相关的所有行，以及列中具有特定值的行？下面是一个示例dataframe： import pandas as pd index = pd.MultiIndex.from_product([['xy1','xy2','xy3'], ['1','2','3','4','5']], names=['Tag', 'Page']) df = pd.DataFrame([1,1,1,4,5,1,1,61,

浏览 3提问于2019-09-20得票数 0

回答已采纳

2回答

Pandas: Dataframe.Drop - ValueError:轴中不包含labels ['id']

python、pandas

正在尝试从Pandas中的DataFrame中删除列。从文本文件创建的DataFrame。 import pandas as pd df = pd.read_csv('sample.txt') df.drop(['a'], 1, inplace=True) 但是，这会生成以下错误： ValueError: labels ['a'] not contained in axis 以下是sample.txt文件的副本： a,b,c,d,e 1,2,3,4,5 2,3,4,5,6 3,4,5,6,7 4,5,6,7,8 提前谢谢。

浏览 0提问于2017-02-08得票数 8

1回答

使用to_html将数据帧转换为HTML时，如何更改数据帧的数据类型？

python、html、pandas

由于除非我添加dtype =‘DataFrame’，否则熊猫对象(或序列)的列的类型是一致的，所以我想知道在使用pandas.DataFrame.to_html()时如何更改某些行的数据类型。例如，我希望第1-3行显示为int，而第4-5行应显示为浮点数。从to_html的文档中，我了解到我有一些选项，比如CSS样式。但是，我不知道如何使用函数.. import pandas as pd df = pd.DataFrame({'Column1': [2, 3, 4, 5, 6.0], 'Column2': [2, 3, 3, 2, 1.0]}) 下面是我的例子

浏览 20提问于2019-01-23得票数 0

回答已采纳

1回答

如何使用正则表达式删除python pandas DataFrame中的行？

python、regex、pandas

我有一个模式： patternDel = "( \$(MoM|QoQ)\$)"; 我想删除pandas dataframe中列df['Event Name']与此模式匹配的所有行。哪种方法是最好的？数据帧中有超过100k行。

浏览 8提问于2016-10-10得票数 26

回答已采纳

2回答

熊猫:简单的“加入”不起作用？

pandas

我喜欢认为我不是傻子，但也许我错了。有人能给我解释一下为什么这个不起作用吗？我可以使用'merge‘来达到预期的效果。但是我最终需要加入多个pandas DataFrames，所以我需要让这个方法工作。 In [2]: left = pandas.DataFrame({'ST_NAME': ['Oregon', 'Nebraska'], 'value': [4.685, 2.491]}) In [3]: right = pandas.DataFrame({'ST_NAME': ['Oregon&#

浏览 0提问于2012-04-12得票数 20

回答已采纳

3回答

基于2d数组的三维数组填充的有效方法是什么？

python、arrays、python-3.x、pandas、numpy

假设我有一个2d数组。 a = np.array([[0,2,3],[4,2,1]]) 维度为number_of_instances * 3，其中2d数组中的值表示pandas dataframe中的行索引。我有一个dataframe df = pd.DataFrame(np.array([[10, 10, 10, 10], [11, 11, 11, 11], [12, 12, 12, 12], [13, 13, 13, 13], [14, 14, 14, 14]]), columns = list('ABCD')) Out[23]: A B C D 0

浏览 5提问于2019-09-24得票数 1

回答已采纳

1回答

处理大熊猫的重复数据

python-3.x、pandas、dataframe、unique

大家好，我在使用熊猫蟒蛇库时遇到了一些问题。基本上，我是阅读与熊猫的csv文件，并希望删除重复。我什么都试过了，但问题仍然存在。 import sqlite3 import pandas as pd import numpy connection = sqlite3.connect("test.db") ## pandas dataframe dataframe = pd.read_csv('Countries.csv') ##dataframe.head(3) countries = dataframe.loc[:, ['Retailer coun

浏览 2提问于2019-11-18得票数 3

回答已采纳

1回答

对`pandas.series.drop()的一些误解

python、pandas

我想在pandas.DataFrame中删除一些特定的行，而我尝试过的pandas.Series.drop().What如下所示： In[1]: a_pd = pd.DataFrame(np.array([[1,2,3], [2,'?','x'],['s','d',4]]), columns=list('abc')) a_pd Out[1]: a b c 0 1 2 3 1 2 ? x 2 s d 4 In[2]: a_pd['b

浏览 4提问于2016-10-05得票数 0

回答已采纳

2回答

在python中用dataframe拆分字符串

python、dataframe

我有一个数据框架，其中一个列是用破折号分隔的字符串。我想在冲刺之前得到这个角色。你能帮我吗？ import pandas as pd df = pd.DataFrame() df['a'] = [1, 2, 3, 4, 5] df['b'] = ['C-C02','R-C05','R-C01','C-C06', 'RC-C06'] 愿望的输出是：

浏览 4提问于2022-06-13得票数 0

回答已采纳

2回答

在R中是否有类似于complete.cases的等效Python函数

python、pandas

我正在删除pandas数据框架中的一些记录，该数据框架在4列框架中包含不同的NaN组合。我已经创建了一个名为complete_cases的函数来提供满足以下条件的行的索引:行中的所有列都是NaN。我已经尝试过下面的函数： def complete_cases(dataframe): indx = [] indx = [x for x in list(dataframe.index) \ if dataframe.loc[x, :].isna().sum() == len(dataframe.columns)] retu

浏览 32提问于2019-07-30得票数 1

1回答

如何根据所有行值为正、一行值为负、两行值为负值来排列Pandas数据。所有行值都为负值，

python、pandas、dataframe

如何根据所有行值为正、一行值为负、两行值为负值来排列Pandas数据。所有行值都为负值， df=pd.DataFrame({ 'x':[1, 2, 3, -1, -2, -3], 'y':[-1, 3, 2, -4, 3, -2], 'z':[1 , 1, 5, 2, 1, -1]}] 预期输出 index x y z 1 2 3 1 all positive 2 3 2 5 4 -2

浏览 2提问于2020-12-06得票数 0

回答已采纳

2回答

Pandas，忽略NaN的滚动最大值

pandas

我想要计算过去3个滚动行中的最大值，如果我看到它们，则忽略NaN。我假设skipna会这样做，但它没有。我怎么能忽略NaN，还有skipna应该做什么？在这段代码中 import pandas as pd df = pd.DataFrame({'sales': [25, 20, 14]}) df['max'] = df['sales'].rolling(3).max(skipna=True) print(df) 最后一列是 sales max 0 25 NaN 1 20 NaN 2 14 25.0

浏览 95提问于2021-04-29得票数 1

回答已采纳

3回答

删除某个列号后包含全零的所有行

python、pandas

在pandas dataframe中，如何删除某一列后面有零的所有行。例如 from pandas import DataFrame df = DataFrame({'a' : [0,1,1,0,0,0,0], 'b' : [0,1,-1, 1,0,0,0], 'c': [1,4,5,6,7,0,0]}).T df： 0 1 2 3 4 5 6 a 0 1 1 0 0 0 0 b 0 1 -1 1 0 0 0 c 1 4 5 6 7 0

浏览 2提问于2015-01-29得票数 1

1回答

根据另一个数据帧中的位置从主数据帧中提取子序列

python-3.x、pandas、string、list、dataframe

我要提取数据帧'B‘中第一个和最后一个位置所指示的子序列。我想出的算法是：标识位于A位置中的B行，找出位置的相对位置(即移动位置以使它们从0开始)，使用相对位置作为范围提取子序列。上述算法的问题在于运行时。我需要另一种方法来比现有的方法更快地编译代码。期望输出： first last sequences 3 5 ACA 8 12 CGGAG 105 111 ACCCCAA 115 117 TGT 使用的数据帧： import pandas as pd A = pd.DataFrame({'first.sequence': ['AAAC

浏览 1提问于2022-09-25得票数 4

回答已采纳

1回答

如何在不重新创建实例的情况下向pandas.DataFrame添加数据

python、pandas、dataframe

我正在尝试为pandas开发自定义数据帧访问器，但面临着不确定如何解决的问题。我的访问器应该从自定义源加载数据，我计划将这些值分配给调用访问器的DataFrame。但是当我将新创建的dataframe分配给dataframe实例时，我得到的结果是什么都没有发生。我认为这是因为我创建了dataframe的新实例，而不是重用旧实例。有没有什么很好的方法来保存数据帧实例并在其中加载信息？下面是我的代码，我现在是如何实现的： import pandas import numpy @pandas.api.extensions.register_dataframe_accessor("

浏览 14提问于2019-10-07得票数 1

回答已采纳

1回答

如何合并2个数据帧中的2行

python-3.x

我正在尝试通过执行左连接来将数据集中的行与另一行合并 import pandas as pd import numpy as np #df = pd.DataFrame(np.array([, , [3656, 2532, 3652],["AFF", "KK", "DD"]]), columns=['Grp', 'A', 'B','C']) # intialise data of lists. data = {'Grp':[36, 25, 36,36],

浏览 18提问于2019-09-19得票数 0

回答已采纳

16回答

熊猫获取的行不在其他数据帧中

python、pandas、dataframe

我有两个熊猫数据框，它们有一些共同的行。假设dataframe2是dataframe1的一个子集。如何获取dataframe1中不在dataframe2中的行？ df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 = pandas.DataFrame(data = {'col1' : [1, 2, 3], 'col2' : [10, 11, 12]}) df1 col1 col2 0

浏览 256提问于2015-03-06得票数 325

回答已采纳

1回答

如果我删除了带有pandas的行，它将保留在Excel中

python、excel、pandas、save

如果我删除了带有pandas的行，它将保留在Excel中 def sort_wickelfalzrohr(d): # Filter settings filt_with_isolation = (df_read['KZ'] == 'R-R') & (df_read['D'] == d) & (df_read['IsoOf'].isna() == False) filt_without_isolation = (df_read['KZ'] == 'R-R')

浏览 18提问于2020-05-11得票数 0

回答已采纳

3回答

如何将文本从CSV中的括号中拆分，并使用它创建另一列

python、regex、pandas

我对Python世界完全陌生，所以我已经为这个问题挣扎了几天了。我提前感谢你们。我一直在尝试将一个行和列文本分成三个不同的部分。为了更好地解释我自己，我在这里这是我的熊猫数据来自csv： In2 df = pd.read_csv('raw_csv/consejo_judicatura_guerrero.csv', header=None) df.columns = ["institution"] df Out2 institution 0 1.1.2. Consejo Nacional de Ciencias (CNCOO00012

浏览 0提问于2020-05-25得票数 3

回答已采纳

3回答

基于另一个数据帧按组创建新的数据帧

python、pandas、dataframe

我没有太多和熊猫打交道的经验。我有一个熊猫数据框，如下所示。 df = pd.DataFrame({ 'A' : [1,2,1], 'start' : [1,3,4], 'stop' : [3,4,8]}) 我想创建一个新的dataframe，它遍历各行并附加到生成的dataframe。例如，从输入dataframe的第1行生成一个由数字1、2、3和对应的列组成的序列，并命名为1 A seq 1 1 1 2 1 3 2 3 2 4 1 4 1

浏览 32提问于2017-07-14得票数 0

回答已采纳

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0