如何在pandas dataframe列python中将所有数字==加1为0_如何在pandas dataframe中将短划线(-)的所有实例替换为字符串中间的数字零(0)？_如何在dataframe python3的每一列中将字符串映射为数字ID - 腾讯云开发者社区

python、pandas

我有一个pandas DataFrame，其中有几列包含如下所示的对象列表： Index A B C 0 [1,2,3,] [4,5,6,...20] [1,2,3,...,64] 1 [1,2,3,] [4,5,6,...20] [1,2,3,...,64] .. .. n [1,2,3,] [4,5,6,...20] [1,2,3,...,64] 当然，数字只是供参考。我想对列'C‘的前32个值求和，假设是'10’。我尝试

浏览 0提问于2020-04-30得票数 1

1回答

列在Pandas Dataframe追加期间意外下降。

python、pandas

下面是我的代码，它简单地组合在一起，并平均设置行。为了我的一生，我不明白为什么在最终结果中会有一列被删除。 import pandas as pd def group_rows(dataframe1): incr = 10 dataframe3 = pd.DataFrame() for i in range(0,len(dataframe1.index),incr): tmp = dataframe1[i:i+incr].mean() dataframe3 = dataframe3.append(tmp, ignore_index=Tr

浏览 2提问于2017-03-30得票数 1

回答已采纳

2回答

列在叠加条形图中的变化顺序

python、pandas、data-visualization

我使用下面的代码从Python中的熊猫数据帧(data是DataFrame对象)生成一个堆叠的条形图。 data.plot(kind='bar', stacked=True, figsize=(15, 10), x='Species', fontsize=16, rot=0) 下面是上下文的。我想改变列的顺序。seaborn.barplot函数有x_order参数，这完全符合我的意愿。但是，它不像pandas.DataFrame.plot函数那样直接支持堆叠条形图。重新排序列的最简单方法是什么？

浏览 2提问于2015-08-14得票数 1

回答已采纳

2回答

如何将数字添加到基于另一列的列中？(字典)

python、pandas、dataframe

我有一个字典，其中的值需要添加到dataframe中的列中。字典看起来像这样： {1:123, 2:345, 3:678} 数据框的列如下所示： col1 1 2 3 我想要这样的结果： col1 1123 2345 3678 这是我正在使用的代码(替换函数) file['col1'] = file['col1'].replace(dict) 但replace()不幸地删除了第1列中的值。

浏览 0提问于2019-07-02得票数 1

1回答

我正在尝试使用Python 2将数据框中的列字符串转换为浮点型

python、database、data-mining

我是数据分析的新手，正在寻找帮助。我正在使用python从头开始创建我的Knn算法。我需要将我的数据帧中的一列字符串转换为浮点数。我正在使用python 2。这是数据帧的外观。 sepal_length sepal_width petal_length petal_width CLASS_LABEL 0 6.1 2.9 4.7 1.4 versicolor 1 6.0 2.7 5.1 1.6 versicolor 2

浏览 17提问于2019-01-20得票数 1

回答已采纳

10回答

如何在Pandas中获取数据中的行号？

python、pandas

如何使用Pandas在包含某一列中某个值的dataframe中获得行号？例如，我有以下数据： ClientID LastName 0 34 Johnson 1 67 Smith 2 53 Brows 如何找到'LastName‘列中有'Smith’的行号？

浏览 11提问于2017-04-03得票数 75

回答已采纳

1回答

熊猫数据帧中所有列的平均值？

python-3.x、pandas、python-3.4

我正在尝试计算DataFrame的所有列的平均值，但看起来在第6行的B列中有一个值会阻止计算C列的平均值。为什么？ import pandas as pd from decimal import Decimal d = [ {'A': 2, 'B': None, 'C': Decimal('628.00')}, {'A': 1, 'B': None, 'C': Decimal('383.00')}, {'A': 3, '

浏览 3提问于2015-11-21得票数 8

回答已采纳

1回答

避免Pandas将None隐式转换为列元组中的NaN

python、pandas

我有一个Pandas DataFrame，它的列用Python tuples标记。这些列标签元组可以不包含任何内容。当我尝试使用以下任一方法向数据框添加列时，标记元组中的None被隐式转换为numpy.nan。方法1-使用dataframe[ NewColumn ] = ...语法添加列 >>> import pandas >>> df = pandas.DataFrame() >>> column_label = ( 'foo', None ) >>> df[column_label] = [ 1,

浏览 1提问于2016-01-05得票数 1

2回答

如何定义从dataframe(Python)计算BMI的函数

python

我需要定义一个函数，它将计算并返回数据的，其中包括列“高度”和“体重”，即每一行的BMI。下面是我写的代码： import pandas as pd def BMI(DataFrame): df=pd.DataFrame return df['Weight']/df['Height']^2 但是，当我试图运行该函数时： data.apply(BMI,axis=1) 当“数据”是我的数据时结果是一个错误： Traceback (most recent call last): File "<input>", line

浏览 0提问于2019-05-30得票数 0

2回答

Pandas:根据一列中字符串的特定组合选择行对

python、pandas、dataframe、numpy

我是python/pandas的新手，一直在努力寻找一个足够具体的示例供我使用。假设我有以下pandas数据帧，由一列事件标记和一列显示每个标记出现的时间组成： df = pd.DataFrame({'Marker': ['S200', 'S4', 'S44', 'Tone', 'S200', 'S1', 'S44', 'Tone'], 'Time': [0, 100, 150, 230,

浏览 7提问于2021-07-10得票数 2

1回答

完成从Pinescript到Python的循环

python、pine-script

Im tryng转换这个公式(WMA移动平均)在Python循环从拼音，但for i to x不存在。我试过for i in range(x)，但似乎没有返回相同的结果。to到底是什么意思？said的文档意味着from i to x，但我在Python中找不到相应的 pine_wma(x, y) => norm = 0.0 sum = 0.0 for i = 0 to y - 1 weight = (y - i) * y norm := norm + weight sum := sum + x[i] * weight

浏览 8提问于2022-05-23得票数 0

回答已采纳

1回答

熊猫的`to_csv`不像打印一样

python、pandas、dataframe

考虑以下操作顺序： float64Create通过将所有列转换为objectInspect来创建具有以下类型的数据框架( int64 )：通过将所有列转换为来创建一个数据框架--新的数据框架持久化新的数据框架预期第二列将如第3步所示:即作为字符串，而不是float64 如下所示： # Step 1 df = pd.DataFrame.from_dict({'a': [3, 2, 1, 0], 'b': [1, 500.43, 256.13, 5]}) # Step 2 df2 = df.astype(object) # Step 3 df2.info()

浏览 3提问于2021-01-02得票数 2

2回答

pandas如何将所有字符串值转换为浮点型

python、pandas

我希望将Pandas DataFrame中的所有string值转换为float，我可以定义一个简短的函数来完成此操作，但这不是Pythonic式的方法。我的DataFrame看起来像这样： >>> df = pd.DataFrame(np.array([['1', '2', '3'], ['4', '5', '6']])) >>> df 0 1 2 0 1 2 3 1 4 5 6 >>> df.dtypes 0 obj

浏览 0提问于2015-09-26得票数 7

回答已采纳

2回答

将Str列转换为在Pandas中不工作的Int

python、pandas

我有以下代码来加载数据 import pandas as pd data = pd.read_csv("Salary-Data.csv") data["Income"] = data["Income"].str.strip() #data["Income"] = data["Income"].apply(pd.to_numeric, errors='coerce') #data["Income"] = data["Income"].astype(int) data 这

浏览 6提问于2022-06-05得票数 0

2回答

如何删除Python中的DataFrame列中的所有特殊字符和字母？

python、pandas、string、character、letter

我在Python中有类似于下面的DataFrame ("col1“是数据类型字符串)： col1 ----- 1234AABY332 857363opx00C*+ 9994TyF@@@! ... 我需要删除所有特殊字符，比如：["-", ",", ".", ":", "/", "@", "#", "&", "$", "%", "+", "*", "(", ")

浏览 5提问于2022-07-11得票数 1

1回答

Python3如何在上实现滑动窗口计数

python、pandas

我想用一个大型的Pandas dataframe来制作一个情节。数据的格式如下 Type Number ...unimportant additional columns Foo 13 ... Foo 25 ... Foo 56 ... Foo 56 ... Bar 10 ... Bar 10 ... Bar 11 ... Bar 23 ... 我需要计算从x到x+i的滑动窗口中列' number‘的元素数，以确定每个滑动窗口桶中的值。例如，如果窗口大小为i

浏览 1提问于2017-03-28得票数 1

回答已采纳

1回答

在两列上执行group by后，获取级别1的组数

pandas、pandas-groupby

我正在对两列执行group by操作，需要计算level-1中值的数量我尝试了以下几种方法： >>> import pandas as pd >>> df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': [1, 2, 0, 4, 3, 4], 'C': [3,3,3,3,4,8]}) >>> pr

浏览 12提问于2019-06-24得票数 1

回答已采纳

2回答

如何引用Pandas中查询字符串中的未命名列？

python、pandas、dataframe

使用DataFrame时，如何引用查询字符串中未命名的pandas.DataFrame.query列？我知道我可以在后面包围那些无效的Python变量名的列名。但是，这并不涉及未命名的列。例如，我想查询DataFrame中的所有行，其中未命名的列包含大于0.5的值。我的代码开始如下： import pandas as pd import numpy as np array=np.random.rand(10,3) df=pd.DataFrame(array) 到目前为止还不错，但是当我尝试使用pandas.DataFrame.query时，应该使用哪个查询字符串来查找第二列中值大于0.5的

浏览 3提问于2021-07-09得票数 2

2回答

如何在sqlite python中提取字符串的数字部分

python、sqlite

我正在处理IMDB数据集，我的电影表的记录如下所示 import sqlite3 import pandas as pd conn=sqlite3.connect('Db-IMDB.db') result1=pd.read_sql_query('select year from Movie order by year',conn) print(type(result1)) print(result1) 我得到的输出如下所示 <class 'pandas.core.frame.DataFrame'> year 0

浏览 0提问于2019-11-03得票数 0

1回答

获取Pandas DataFrame第一列

python、pandas

这个问题很奇怪，因为我知道如何做某事，但我不知道为什么我不能用另一种方法。假设简单的数据帧： import pandasas pd a = pd.DataFrame([[0,1], [2,3]]) 我可以很容易地对这个数据帧进行切片，第一列是a[[0]]，第二列是a[[1]]。很简单，不是吗？现在，让我们有更复杂的数据帧。这是我的代码的一部分： var_vec = [i for i in range(100)] num_of_sites = 100 row_names = ["_".join(["loc", str(i)]) for i in

浏览 4提问于2017-01-31得票数 12

回答已采纳

1回答

如何在Pandas DataFrame的单独列中扣除离散值

python-3.x、pandas

我是Python的新手(4周)，刚刚开始使用Pandas和api get请求。我正在将api数据放入dataframe数据框中，并尝试对pandas数据框中不同列中的金融数据执行基本数学运算(即，打开、高、低、关闭、卷)。我已经写了以下代码(注意:参数和api请求url不是逐字的，它们返回由列分隔的正确的数据集)： import requests import json import pandas as pd payload = {"key": "value"} response = requests.get("URL", params=

浏览 23提问于2019-02-19得票数 1

1回答

为什么Pandas/Numpy会自动将9999999999四舍五入到1.000000e+10？

python、pandas、numpy、python-3.6

我有一个4行的Pandas数据帧，其中一列(名为limit)包含浮点值，其中任何0都必须替换为9999999999 (99999999999万)。该列被设置为float32数据类型，我使用pandas.DataFrame.where方法进行替换。但它并没有像预期的那样工作，因为Numpy的四舍五入是9999999999到10000000000 (100亿)。我在Panda3(Python3.6.8)，iPython版本0.24.2，Numpy版本1.14.0中尝试过。这是替换语句 df['limit'] = df['limit'].where(df[

浏览 35提问于2019-04-24得票数 2

回答已采纳

2回答

ValueError:仅在一行上工作时，列必须与键的长度相同

python、pandas、dataframe、expand

我试图根据一列的拆分向DataFrame添加列。对于两行，所有操作都正常，空列的值为“None”。当我只有一行而DataFrame不能展开时，我希望它也被赋值'None‘。工作实例： >>> import pandas as pd >>> df = pd.DataFrame({'auth':['dbname_user','dbname']}) >>> df auth 0 dbname_user 1 dbname >>> df[[&#

浏览 19提问于2022-08-23得票数 0

回答已采纳

1回答

如何在Pandas函数中使用np.Vectorize()？

python、pandas、numpy、vectorization、apply

我有一个以Pandas DataFrame格式操作的函数。它适用于pandas.apply()，但不适用于np.Vectorize()。请查找以下功能： def AMTTL(inputData, amortization = []): rate = inputData['EIR'] payment = inputData['INSTALMENT'] amount = inputData['OUTSTANDING'] amortization = [amount] if amount - payment &l

浏览 17提问于2022-09-21得票数 0

3回答

如何在Pandas DataFrame中有条件地添加一个热向量

python、python-3.x、pandas、dataframe

我在Python中有以下Pandas DataFrame： import numpy as np import pandas as pd df = pd.DataFrame(np.array([[1, 2, 3], [3, 2, 1], [2, 1, 1]]), columns=['a', 'b', 'c']) df 输出它时，它如下所示： a b c 0 1 2 3 1 3 2 1 2 2 1 1 我需要添加3个新列，如"d“列、"e”列

浏览 4提问于2020-08-13得票数 2

回答已采纳

1回答

聚合空DataFrame时保留列

python、pandas、group-by

我在python 2.7.9的pandas 0.18.0中工作。获取一个示例DataFrame并按几列分组，然后对不同的列求和以得到结果，如下所示： >>> df = pandas.DataFrame([[1,2,3],[4,5,6],[1,2,9]], columns=['a','b','c']) >>> print df a b c 0 1 2 3 1 4 5 6 2 1 2 9 >>> df.groupby(['a','b']

浏览 10提问于2016-07-29得票数 4

4回答

使熊猫DataFrame中的每一个数值为负值

python、pandas、dataframe

如何使每个pandas DataFrame值为负值？我找不到这个答案，认为它可以为学习如何使用pandas DataFrame中的数据提供一个很好的参考。 In [1]: frame Out[1]: position index 0 6 1 7 2 7 3 7 4 8 5 9 6 1 7 1

浏览 4提问于2014-08-14得票数 4

回答已采纳

2回答

pandas.to_numeric -找出它无法解析的字符串

python、pandas、data-science、data-cleaning

将pandas.to_numeric应用于包含表示数字的字符串(可能还有其他无法解析的字符串)的dataframe列将导致如下错误消息： --------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-66-07383316d7b6> in <module>() 1 for column in

浏览 2提问于2016-11-24得票数 16

回答已采纳

2回答

如何在pandas dataframe中使用列表作为值？

python、csv、numpy、pandas、dataframe

我有一个数据帧，它要求列的子集具有具有多个值的条目。下面是一个包含“runtime”列的dataframe，其中包含程序在各种条件下的运行时： df = [{"condition": "a", "runtimes": [1,1.5,2]}, {"condition": "b", "runtimes": [0.5,0.75,1]}] df = pandas.DataFrame(df) 这就形成了一个数据帧： condition runtimes 0 a [1,

浏览 0提问于2014-11-08得票数 8

回答已采纳

1回答

如何在pandas中读取包含多个货币符号的excel列？

python、pandas

当我尝试访问pandas dataframe中的这一列时，抛出如下错误 UnicodeEncodeError：'charmap‘编解码器无法对位置25的字符'\u20a1’进行编码:字符映射到

浏览 24提问于2020-07-31得票数 0

3回答

用pandas.DataFrame设置值

python、pandas

拥有这个DataFrame： import pandas dates = pandas.date_range('2016-01-01', periods=5, freq='H') s = pandas.Series([0, 1, 2, 3, 4], index=dates) df = pandas.DataFrame([(1, 2, s, 8)], columns=['a', 'b', 'foo', 'bar']) df.set_index(['a', 'b'],

浏览 1提问于2016-06-01得票数 8

回答已采纳

3回答

在前一个值重要时如何使用“`apply()”或其他向量化方法

python、python-3.x、pandas

假设我有以下形式的DataFrame，其中第一列是随机数，其他列将基于上一列中的值。为了便于使用，假设我希望每个数字都是前一个平方的。所以看起来就像下面。我知道我可以编写一个非常简单的循环来完成这个任务，但我也知道在python/大熊猫中循环并不是最有效的。如何用apply()或rolling_apply()来完成这一任务？或者，否则做得更有效率？我的(失败)尝试如下： In [12]: a = pandas.DataFrame({0:[1,2,3,4,5],1:0,2:0,3:0}) In [13]: a Out[13]: 0 1 2 3 0 1

浏览 3提问于2017-03-23得票数 4

回答已采纳

2回答

将每一行的值求和为布尔值(PySpark)

python、apache-spark、pyspark

目前，我有一个PySpark dataframe，它有许多由整数计数填充的列。其中许多列的计数为零。--我想找到一种方法来求和有多少列的计数大于零，。换句话说，我想要一种跨行求和值的方法，其中给定行的所有列实际上都是布尔值(尽管数据类型转换可能不是必要的)。我的表中有几个列是日期时间或字符串，所以理想情况下，我应该有一种方法，首先选择数字列。当前Dataframe示例和期望的输出 +---+---------- +----------+------------ |USER| DATE |COUNT_COL1| COUNT_COL2|... DESIR

浏览 2提问于2020-04-24得票数 1

回答已采纳

1回答

下浇铸系列或数据元素逐个元素

python、pandas、numpy、dataframe

考虑一下pd.DataFrame df df = pd.DataFrame([ [1.0, 1.5], [2.2, 3.0] ]) 如果元素是相等的，我想将它们向下转换为int。据我所知，每一列都将以对象类型结束。没关系。 <class 'pandas.core.frame.DataFrame'> RangeIndex: 2 entries, 0 to 1 Data columns (total 2 columns): 0 2 non-null object 1 2 non-null object dt

浏览 1提问于2016-11-11得票数 2

回答已采纳

1回答

熊猫与xlsx合并，CSV在输出中产生空值列。

python、excel、csv、pandas、merge

我使用Python3.4、Pandas 0.16.2和朱庇特笔记本作为我的IDE。我正在导入以下两个数据文件： Lookup = pd.read_excel("LookupMergeOutput.xlsx") Concatenated = pd.read_csv('Concatenated.csv', error_bad_lines = False, na_values='', iterator=True, chunksize=1000) data = pd.concat([chunk for chunk in Concatenated],

浏览 2提问于2015-10-01得票数 2

回答已采纳

2回答

如何在变体dplython中使用regex添加新列

python、pandas

由于熟悉R和dplyr，我试图使用dplython和pandas完成python中的一项任务。我试图在数据框架中创建一个新列，该列使用regex对列进行评估，在模式匹配时，我给出值=1 pattern 0。 import dplython as dp import pandas as pd import re a = {'module_name':'eventOutput','module_tpye':'export'} b = {'module_name':'session','m

浏览 1提问于2019-04-13得票数 3

回答已采纳

2回答

如何在数据框某些行的所有列上使用pandas apply函数

python、pandas、data-manipulation

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

为什么pandas DataFrame.iloc返回的是类别数据类型的标量，而是对象数据类型的系列？

python-3.x、pandas

在pandas 0.23.0和python 3.6.5中，我看到了在DataFrame上使用iloc[int]时不理解的行为。如果DataFrame只有一列，并且该列的类型是“category”，则iloc[int]将返回标量值而不是系列。当"answer“列是一个对象数据类型时，我会得到一个预期的Series： >>> df = pandas.DataFrame({'answer': ['no', 'no', 'yes']}) >>> df['answer'] =

浏览 1提问于2018-08-24得票数 0

3回答

如何将文本从CSV中的括号中拆分，并使用它创建另一列

python、regex、pandas

我对Python世界完全陌生，所以我已经为这个问题挣扎了几天了。我提前感谢你们。我一直在尝试将一个行和列文本分成三个不同的部分。为了更好地解释我自己，我在这里这是我的熊猫数据来自csv： In2 df = pd.read_csv('raw_csv/consejo_judicatura_guerrero.csv', header=None) df.columns = ["institution"] df Out2 institution 0 1.1.2. Consejo Nacional de Ciencias (CNCOO00012

浏览 0提问于2020-05-25得票数 3

回答已采纳

1回答

从随机整数表中找出与列表相比的布尔值

python、pandas、numpy、boolean

投入如下： Panda Dataframe，有500列10行，包含0到10000 (包括)之间的一系列随机整数由0到10000之间的10个随机整数组成的列表我正在寻找的输出是：一个包含500列和10行的Panda Dataframe，它给出布尔值为true或false，这取决于x-th行中的元素是否高于(true)或低于(false)是列表中第x元素的数字。我能够使用下面的函数在excel中解决这个问题： ( =RANDARRAY(10,1,0,10000，TRUE)=IF(RANDARRAY(10,500,0,10000，TRUE)>A1，TRUE，FALSE) 在pytho

浏览 4提问于2022-06-30得票数 1

回答已采纳

2回答

熊猫数据中某些字符后的数字提取

python、regex、pandas、search、extract

我有一个dataframe，其中一个列包含'weak=30'类型字符串，我希望提取=字符串之后的数字，并创建名为digits的新列。我使用re.search来查找数字，但到目前为止，它产生了一个错误。示例数据 import pandas as pd import re raw_data = {'patient': [1, 2, 3,4, 6], 'treatment': [0, 1, 0, 1, 0], 'score': ['strong=42', 'weak=30&#

浏览 1提问于2019-10-10得票数 1

回答已采纳

2回答

如何在Windows环境下使用iPython笔记本解决大熊猫进口错误？

python、windows、pandas、xlwings

在使用iPython的时候，我正在尝试进口熊猫。我的总体目标是使用XLwings。我在Windows 7上，使用Anaconda安装Python、熊猫和所有依赖项。这是我的代码： from pandas import DataFrame 这意味着： ImportError Traceback (most recent call last) <ipython-input-7-26dfcabfb474> in <module>() ----> 1 from pandas import DataFrame

浏览 3提问于2015-06-19得票数 6

回答已采纳

1回答

如何在打开pandas数据帧中的文件内容时维护二进制值

python、pandas、dataframe

我有一个文本文件，它只是一个保存为csv的熊猫数据帧。以下是该文件的内容： combination_output,total_true,frequency,priori-probability 000,0,275,0.0 001,0,25,0.0 010,16,16,1.0 011,14,14,1.0 100,0,0,0 101,0,44,0.0 110,0,0,0 111,247,247,1.0 我的问题很简单:给定包含0或1的三个数字的组合输出，我在上面的文件中搜索这个组合，并返回先验概率(该文件的最后一列)。下面是我如何做的，给出了我应该在该文件中搜索的一个大的组合矩阵： #open t

浏览 9提问于2020-05-18得票数 0

回答已采纳

6回答

Matplotlib中的按列值着色

python、pandas、matplotlib、seaborn

在R中使用ggplot2库，我最喜欢的一个方面是能够轻松地指定美学。我可以快速绘制散点图并应用与特定列相关联的颜色，我希望能够使用python/pandas/matplotlib完成此操作。我想知道有没有什么方便的函数可以让人们使用pandas、dataframes和Matplotlib将颜色映射到值？ ##ggplot scatterplot example with R dataframe, `df`, colored by col3 ggplot(data = df, aes(x=col1, y=col2, color=col3)) + geom_point() ##ideal sit

浏览 1提问于2013-02-15得票数 58

回答已采纳

1回答

Pandas从apply函数返回DataFrame吗？

python、python-2.7、pandas

sdf = sdf['Name1'].apply(lambda x: tryLookup(x, tdf)) tryLookup是当前接受字符串的函数，该字符串是sdf列中Name1的值。我们使用apply将函数映射到sdf DataFrame中的每一行。有没有办法让tryLookup返回我想要与sdf DataFrame合并的DataFrame，而不是只返回一个字符串的sdf？tryLookup有一些额外的信息，我想通过将它们作为新列添加到sdf中的所有行来包括在结果中。因此，tryLookup的返回值如下： return pd.Series({'BEST MATC

浏览 0提问于2017-09-15得票数 4

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

1回答

基于列的熊猫数据分配组

python-3.x、pandas、dataframe

我有一个dataframe df，如下所示： import pandas as pd data = {'A': ['ABCD_1', 'ABCD_1', 'ABCD_1', 'ABCD_1', 'PQRS_2', 'PQRS_2', 'PQRS_2', 'PQRS_2', 'PQRS_2'], 'P':[1, 0, 0, 0, 0, 1, 0, 0, 0]} df = pd.DataFrame(data) df

浏览 5提问于2022-07-17得票数 0

回答已采纳

1回答

熊猫功能变压器发出SettingWithCopy警告

python、pandas、scikit-learn-pipeline

我正在学习如何使用管道，并使用FunctionTransformer构建了一个非常简单的管道，以添加一个新列、一个ordinal encoder和一个LinearRegression模型。但是，当我运行管道时，我得到了SettingwithCopy，并将问题隔离到FunctionTransformer。下面是代码，我省略了所有不必要的代码(比如序数编码器和管道中的回归器)- def weekfunc(df): df['date'] = pd.to_datetime(df.loc[:,'date']) df['weekend']

浏览 1提问于2022-01-03得票数 0

1回答

从URL创建名称

python、pandas

我正在DataFrame中创建一个NAME列，并根据另一列中包含的子字符串设置它的值。有没有更有效的方法来做到这一点？ import pandas as pd df = pd.DataFrame([['www.pandas.org','low'], ['www.python.org','high']], columns=['URL','speed']) print(df.head()) df['Name'] = df['URL'] print(df

浏览 0提问于2020-06-25得票数 3

回答已采纳

1回答

无法识别DataFrame属性

pandas、dataframe、csv

我正在尝试将以下数据帧加载到我的Pandas中。当我尝试访问第一列时，出现了以下错误，有人能告诉我为什么会发生这种情况吗？ table = pd.read_csv('Q34_table.csv') table.Poison AttributeError Traceback (most recent call last) <ipython-input-110-84d86caeb8fa> in <module> ----> 1 table.Poison /Library/Framework

浏览 25提问于2020-11-15得票数 0