也可以选择Pandas数据框中的列_选择pandas数据框中的某些列_根据Pandas中的列值选择数据框列 - 腾讯云开发者社区

python、pandas

我有一个包含uniqueid列的pandas数据框。我想从基于此列的数据框中删除所有重复项，以便所有剩余的观测值都是唯一的。

浏览 0提问于2013-11-01得票数 7

回答已采纳

1回答

如何从pandas数据帧中的文本字符串中提取所有形容词？

python、nlp

我正在将CSV加载到pandas数据框中。数据框中的一列是“评论”，它包含文本字符串。我需要在数据帧的所有行中标识此列中的所有形容词，然后创建一个新列“形容词”，其中包含该评论中所有形容词的列表。我已经尝试使用TextBlobs，并且能够使用发布的代码标记每个案例的词性。 import pandas as pd from textblob import TextBlob df=pd.read_csv('./data.csv') def pos_tag(text): try: return TextBlob(text).tags except

浏览 26提问于2019-07-11得票数 2

回答已采纳

3回答

在pandas中如何将单列数据拆分成多列？

python、pandas

我有以下数据框 # import Pandas as pd import pandas as pd # create a new data frame df = pd.DataFrame({'Name': ['1234567 A: John Larter 123456 451151515 A: Robert Junior 4646466 9865513 A: Jonny Depp 9456561'], }) df 所有数据都堆积在单列上。我需要在sepearte列中每个A:之后获取数据预期的DataFrame

浏览 26提问于2020-03-21得票数 0

2回答

Pyspark :选择特定的列及其位置

pyspark、apache-spark-sql

我想知道如何在数据框中使用编号而不是名称来选择特定的列？在Pandas中就像这样： df = df.iloc[:,2] 有可能吗？

浏览 1提问于2018-06-18得票数 8

回答已采纳

2回答

如何在将数据与其他数据框合并时避免数据框中的列过少？

python、pandas、dataframe

我有两个数据帧df1和df2。 df1 = A B C D 1 2 3 7 . . df2 = A E F G 1 5 4 5 . . 当我通常想要使用pandas合并两个数据框中的特定列时，我会这样做： import pandas as pd df3 = pd.merge(df1[[A,B]],df2[[A,G]], on='A', how='inner') 然而，我感兴趣的是如何避免数据框中的几列并合并其余列。例如，我希望在合并时避免df1中的列C和D，以及df2中的E和F列，这样得到的df3只有A,B,G列。这是逆向工程

浏览 11提问于2020-10-10得票数 3

回答已采纳

1回答

知识库响应数据的qPython类型转换

python、pandas、type-conversion、kdb

当我使用qPython运行Q查询时，我能够返回pandas数据框中的数据。我正在努力解决的是“字符串”列的类型，即在q中以简单或混合(字符)列表的形式表示的列。它们的数据类型是object，值以b‘ab34ounadke’的形式表示。然而，我想要的只是字符串形式的"ab34knadke"-part。我已经看过qPython的文档，但我正在努力完全了解pandas和阅读器组件。任何想法都非常感谢！

浏览 21提问于2018-12-21得票数 1

回答已采纳

3回答

从pandas.dataframe中提取特定列

python、pandas、spyder

我正在尝试使用python读取我的csv文件，将特定的列提取到一个pandas.dataframe中，并显示该数据帧。但是，我没有看到数据框，我收到Series([]，dtype: object)作为输出。下面是我正在使用的代码:我的文档包含: product sub_product issue sub_issue consumer_complaint_narrative company\_public\_response company state zipcode tags consumer\_consent\_provided submitted\_via date

浏览 0提问于2018-02-06得票数 10

回答已采纳

2回答

将pandas选定列转换为二维numpy数组

python、pandas、numpy

我有一个10列N行的pandas数据帧。我想从我的数据框中选择两列，并将它们放入一个维数为(N，2)的NumPy 2D数组中。如何做到这一点？

浏览 0提问于2020-06-08得票数 1

3回答

Python Pandas-查找值超过阈值的第一个实例

python、pandas

我正在尝试根据另一个Python Pandas数据框列查找超过阈值的值的第一个实例。在下面的代码中，"Trace“列对于多个行具有相同的编号。我想要找到"Value“列超过3的第一个实例，然后，我想从该行获取其余信息，并将其导出到新的Pandas数据框中(如第二个示例所示)。有什么想法吗？ d = {"Trace": [1,1,1,1,2,2,2,2], "Date": [1,2,3,4,1,2,3,4], "Value": [1.5,1.9,3.1,5.5,1.1,3.6,1.9,6.2]} df = pd.DataFrame

浏览 24提问于2018-07-29得票数 3

回答已采纳

1回答

Pandas -连接多个名称不同但数据类型相同的excel文件

excel、pandas、xlsb

我有大约50个excel工作表与.'xlsb‘扩展名。我想将一个特定的工作表连接到pandas DataFrame中(所有工作表的名称都相同)。我遇到的问题是，每个工作表中的列名称并不完全相同。我使用pandas编写了一段代码，但它的工作方式是将所有值连接到pandas数据框中的同一列中，但基于列的名称。所以举个例子:有时我有一列叫做: FgsNr，有时叫做FgNr --两列中的数据类型和含义完全相同，我希望把它们放在数据框中的同一列中，但是pandas创建来分离数据框中的列，并将那些列中列出的同名的值堆叠在一起。 files = glob(r'C:\Users\Folder

浏览 29提问于2021-08-10得票数 0

1回答

Pandas中的列名(Python)

python、pandas

Python : Pandas :数据框:列名我有大量的列，列名也很大。我希望看到一些列和行，但视图变得限制在列名的大小上。如何在没有列名的Python中临时查看数据帧(仅显示数据)

浏览 12提问于2018-05-09得票数 2

2回答

基于列表中的数值列和索引从pandas DataFrame创建新列

python、pandas、dataframe

我有一个数据框，其中包含一个数值列和一个包含字符串作为元素的列表。我想在该数据框中创建一个新列，其中数字列中的每个数字都对应于列表的索引。示例： import pandas as pd bar = ['cat','dog','chicken'] df = pd.DataFrame({'foo':[0,0,1,1,2,2]}) 预期输出： foo bar 0 0 cat 1 0 cat 2 1 dog 3 1 dog 4 2 chicken

浏览 13提问于2020-02-27得票数 0

回答已采纳

2回答

如何在Python pandas dataframe中拆分这些数据？

python、python-3.x、pandas

这是我的pandas数据框，在索引列中，我只想保留双下划线(__)之后的值，并删除其余的值。 ?

浏览 19提问于2019-01-18得票数 1

回答已采纳

2回答

如何向具有不同列号的Pandas数据框添加新行？

python、pandas、dataframe、dataset

浏览 1提问于2019-11-12得票数 0

1回答

从多个pandas数据框列绘制图形

python、pandas、plot

我有一个包含许多列(150)的Pandas数据框，其中140列(第10列到第150列)表示一段时间(通过140天)的天气度值。每列表示不同日期的学位。对于我的数据框中的两行(每行代表一个不同的城市)，我希望绘制所有气象点的趋势，从第一列(第10列)到最后一列(第150列)。我不能设法做到这一点，因为它是数据帧。我应该先创建一个透视表吗？一份清单？你知道如何以一种有效的方式来处理它吗？谢谢

浏览 2提问于2019-04-23得票数 1

1回答

Pandas/matplotlib条形图，颜色按列定义

python-2.7、matplotlib、pandas

我正在尝试用python制作条形图，并用数据框列绘制颜色条，这在R ggplot2中非常容易，所以我真的不理解为什么在matplotlib/pandas中这么难，我想知道如何做，希望逻辑，因为我假设它毕竟不会很难这是我想要的一个例子。我在ggplot中做的-我想要的是使用数据框中的属性来定义颜色，属性可以是颜色字符串，即'k'，'r‘。或者数据的一个特征，比如男性/女性等等。这是我尝试生成条形图的代码示例 import matplotlib.pyplot as plt import pandas as pd data = pd.DataFrame({'

浏览 7提问于2014-11-07得票数 4

回答已采纳

1回答

Python - pandas -仅按标量划分数值单元

python-3.x、pandas、divide

我有一个数据框架( pandas格式)，它由数字列和非数字列组成。我只想用标量除以数值单元格，但是如果不显式定义数值列，我就找不到任何自动执行此操作的函数(因为数据框很大，我不能准确地定义数值列)。我找到了pd.divide，但它不工作(我遇到以下错误:/的操作数类型不受支持：'str‘和'int')

浏览 10提问于2020-06-28得票数 0

回答已采纳

1回答

无法在Pandas中创建折线图

python、pandas、dataframe、plot

使用Pandas进行分析的第二天，我现在正在尝试利用它的绘图功能。我在从数据框创建折线图时遇到了问题，该数据框是在对按日期(以年为单位)分组的列求和后得到的。我想要的图应该显示全年订单量的增长，所以日期应该是X轴，订单应该是Y轴。我的导入如下： import pandas import matplotlib.pyplot import seaborn as sns 我有一个包含所有信息的主数据框架，从那个df中，我制作了另一个只包含一列总和的数据框架。 ordersYears = rawData.groupby(rawData['Date'].dt.year)['T

浏览 12提问于2019-12-04得票数 1

回答已采纳

2回答

Pandas loc错误：“Series”对象是可变的，因此无法对其进行哈希处理

python、pandas、dataframe、typeerror、loc

嘿，伙计们，我需要一些帮助来解决处理熊猫数据帧的问题。代码如下： df.drop(df.index[0], inplace=True) df.columns = ['Mic. No.', 'X', 'Y', 'Z', 'Re. Pre.', 'Im. Pre.'] df['Pre'] = df['Re. Pre.'] + df['Im. Pre.'] * 1j df.drop(['Mic. No.', 'Re. Pre.

浏览 45提问于2020-10-11得票数 5

回答已采纳

6回答

在Pandas数据帧中创建value_counts的列

python、pandas

我想从我的一个Pandas数据框列中创建一个唯一值的计数，然后将具有这些计数的新列添加到我的原始数据框中。我试过几种不同的方法。我创建了一个pandas序列，然后使用value_counts方法计算计数。我尝试将这些值合并回我的原始数据帧，但我希望合并的键在Index(ix/loc)中。 Color Value Red 100 Red 150 Blue 50 我想返回如下内容： Color Value Counts Red 100 2 Red 150 2 Blue 50 1

浏览 0提问于2013-07-18得票数 71

1回答

如何在包含分类变量的Pandas数据帧中仅降低数值列的值？

python、pandas

我有一个Pandas数据框架，并希望降低每个数字列的级别，保持分类变量列条目不变。通过"demean"，我只是希望从每个列条目中减去相应列中所有条目的平均值。数据框来自Wisconsin Breast Cancer目录中的569名患者，为每个患者列出了10种不同的数字测量，以及M(恶性)或B(良性)的诊断。 import pandas as pd df = pd.read_csv('data/UWbcd.csv') %load_ext google.colab.data_table. #just for purposes of browsing the d

浏览 35提问于2020-10-22得票数 0

回答已采纳

3回答

如果列不在特定列表中，则从Pandas数据框中删除这些列

pandas

我有一个熊猫数据框架，它有一些列。如果列没有显示在列表中，我想删除这些列。 pandas数据框列： list(pandas_df.columns.values) 结果： ['id', 'name' ,'region', 'city'] 和我期望的列名： final_table_columns = ['id', 'name', 'year'] X次运算后的结果应该是： list(pandas_df.columns.values) ['id', 'name&#

浏览 18提问于2019-07-05得票数 13

回答已采纳

2回答

使用多个Pandas列应用函数？

python、pandas

我需要在我的pandas数据框中创建一列，该列依赖于同一行中的其他项。例如，这是我的数据帧。 df = pd.DataFrame( [['a',],['a',1],['a',1],['a',2],['b',2],['b',2],['c',3]], columns=['letter','number'] ) letters numbers 0 a 1 1 a 1 2

浏览 9提问于2018-11-27得票数 1

3回答

使用pandas读取excel时的精度损失

python、excel、pandas、dataframe、precision

我尝试使用pandas将excel工作表读取到数据框中，但对于浮点列，数据读取不正确。我使用函数read_excel()来完成任务在excel中，该值是225789.479905466，而在数据帧中，该值是225789.47990546614，这给我从excel导入数据到数据库造成了差异。有没有人在使用pandas.read_exel()时遇到同样的问题。将csv读取到dataframe没有任何问题。杰里米

浏览 61提问于2016-05-28得票数 4

2回答

如何同时访问特定列和随机列

python、pandas、dataframe

访问pandas中的列。如何访问pandas数据框中的单列和多个随机列？如果我有6列'a'，'b'，'c'，'d'，'e'，'f‘，我怎么能访问列'a’，剩下的3列是随机的。我尝试使用df.sample()，但它将显示随机列和列'a‘，而不是自动显示。

浏览 7提问于2021-09-03得票数 0

2回答

将列表作为列添加到dataframe的正确方法是什么？

python、pandas

我想将一个列表作为新列添加到数据框中。我正在做： df['Intervention'] = interventionList 它给了我 SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame 我读过Pandas add a series to dataframe column，在那里大家接受的答案非常相似。

浏览 86提问于2020-06-27得票数 3

5回答

Pandas使用动态列名进行聚合

python、pandas、aggregate、pandas-groupby

我有一个脚本，它生成一个具有不同数量的值列的pandas数据框。例如，此df可能是 import pandas as pd df = pd.DataFrame({ 'group': ['A', 'A', 'A', 'B', 'B'], 'group_color' : ['green', 'green', 'green', 'blue', 'blue'], 'val1': [5, 2, 3

浏览 67提问于2019-09-18得票数 22

回答已采纳

3回答

在dataframe列中放置最长字段

python、python-3.x、pandas

我有一个有三列的pandas数据框，都是文本。如何创建一个只包含三列中最长的文本的新列？我将长度定义为简单的字符计数。

浏览 24提问于2019-04-16得票数 1

回答已采纳

2回答

是否删除包含严格且特定的值/ int /字符串的行？

python、pandas、dataframe

我要删除copy_nb列中包含Copy 1的所有行我尝试了pandas Series.str.contains的简单和容易的功能，如下所示： df=df[~df.copy_nb.str.contains("Copy 1", na=False)] 不幸的是，它删除了包含Copy 1、Copy 10、Copy 11等的列。下面是我想要清理的数据框示例： ?

浏览 18提问于2019-04-26得票数 0

3回答

ipython notebook pandas最大允许列数

python、pandas、ipython、ipython-notebook

我有一个包含10列的简单csv文件！当我在notebook中设置以下选项并打印我的csv文件(在pandas数据框中)时，它不会从左到右打印所有列，而是打印前两列和下两列，依此类推。我使用了这个选项，为什么它不起作用？ pd.option_context("display.max_rows",1,"display.max_columns",100) 即使这样似乎也不起作用： pandas.set_option('display.max_columns', None)

浏览 0提问于2014-11-27得票数 20

回答已采纳

1回答

Pandas的`read_sql`在从包含带小数点的数字列的Oracle表读取数据时创建整数列

python、pandas、oracle、read-sql

我有一个Oracle表，其中包含类型为VARCHAR2 (即字符串)和类型为NUMBER (即带有小数部分的数值)的列。并且数值列实际上包含带有小数点的值，而不是整数值。但是，当我通过pandas.read_sql将这个表读入Pandas数据帧时，我收到的数据帧中的数字列是int64。如何避免这种情况，并接收包含完整十进制值的float列？我正在使用以下版本 python : 3.7.4.final.0 pandas : 1.0.3 Oracle : 18c Enterprise Edition / Version 18.9.0.

浏览 3提问于2020-05-28得票数 2

2回答

如何将excel文件中的列引用(A..B)读入pandas dataframe - Python

python、excel、pandas

我有一个没有任何列标题的excel文件。如下所示：我有一个单独的JSON文件，它解释了A列是客户数量，B列是他们bought...etc的产品数量。 { "excel_template": "template.xlsx", "excel_sheets": [ {"sheet_name": "Daily", "id_column": "A", "frequency&

浏览 3提问于2021-11-15得票数 0

2回答

计算数据帧中纬度和经度之间的距离

python、pandas、geopy

我的数据框中有4列，其中包含以下数据： Start_latitude<br> Start_longitude<br> Stop_latitude<br> Stop_longitude<br> 我需要计算纬度经度对之间的距离，并使用计算出的距离创建一个新列。我偶然发现了一个包(geopy)，它可以为我做这件事。但我需要将一个元组传递给geopy。如何在pandas中的所有记录中跨数据框应用此函数(geopy)？

浏览 0提问于2017-06-09得票数 6

回答已采纳

1回答

如何在Pandas Dataframe中查找特定值

python、pandas、dataframe

我已经在pandas中导入了csv格式的数据。谁能告诉我如何在其中一列中找到大于280的值，并将它们放入另一个数据框中。到目前为止，我已经完成了以下代码： import numpy as np import pandas as pd df = pd.read_csv('...csv') 数据部分如附图所示：

浏览 1提问于2017-04-20得票数 4

2回答

如何处理postgresql数据库的pandas数据帧整型列中的NaNs

postgresql、pandas、null、integer、nan

我有一个包含“年份”列的熊猫数据框。但是，由于外部合并，一些行具有np.NaN值。因此，pandas中列的数据类型被转换为float64而不是integer (integer不能存储NaNs?)。接下来，我想将数据帧存储在postGreSQL数据库中。为此，我使用： df.to_sql() 一切正常，但是我的postGreSQL列现在是"double precision“类型，并且np.NaN值现在是null。这一切都是有意义的，因为输入列类型是float64而不是整数类型。我想知道是否有一种方法可以将结果存储在具有nans的整型列中。示例 Ami的回答的结果：

浏览 2提问于2018-05-18得票数 3

2回答

基于所有其他列的条件计数创建新的Pandas列

python、pandas、dataframe、lambda、apply

我有一个大约360列的Pandas数据框。我希望根据在其余列中有多少列的值大于0的计数，将另一列添加到另一帧中。我的所有列的类型都是浮动64。如果这是我的原始数据帧 column A column B column C ...............Column Z 0 1.5 6.77 3.33 3.5 4.5 0 0 0 0 0.98 0 . . . 2.35 4.32

浏览 23提问于2021-02-26得票数 0

2回答

依赖于行号的函数

python、pandas、numbers、row

在pandas中，可以引用函数的行号吗？我不是在说.iloc。 iloc接受一个位置，即一个行号，并返回一个dataframe值。我想访问数据框中的位置编号。例如，如果函数位于下3行2列的单元格中，我想要一种返回整数3的方法，而不是返回该位置的条目。谢谢。

浏览 11提问于2016-08-02得票数 2

2回答

在Pandas中按特定列名对数据帧进行排序

python、pandas

浏览 17提问于2020-08-31得票数 2

1回答

如何在pycharm控制台中设置pandas数据帧输出上下对齐？

python、pandas、dataframe、pycharm

在我使用之前 pd.set_option('expand_frame_repr', False) pycharm控制台中的pandas输出是按行上下对齐：我想查看所有的数据框列，所以我输入： pd.set_option('expand_frame_repr', True) 但在此之后，pycharm控制台中的数据帧的输出不是按行向上/向下对齐，它看起来是这样的：输出非常糟糕，因为pandas数据帧没有按行对齐，那么我如何才能使行再次对齐？

浏览 4提问于2018-04-10得票数 2

2回答

将根据给定需求选择的某些行放入另一个数据帧中

python-3.x、pandas

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

1回答

有条件地删除重复的pandas python

python、python-2.7、numpy、pandas、dataframe

有没有办法有条件地在大约10列和400,000行的pandas数据框中删除重复项(特别是使用drop_duplicates )？也就是说，我希望所有有2列的行都满足一个条件:如果date (column)和store (column) #的组合是唯一的，则保留行，否则删除。

浏览 1提问于2015-05-03得票数 8

2回答

在计算价值时，数据帧中的KeyError‘城市’？

python、pandas、dataframe、geolocation、geopy

在过去的几天里，我在Python语言中处理数据框时遇到了一些问题--我一直在尝试计算我的数据框中“城市”列的坐标值(它大约有10500行，但是当我试图在该列上运行任何函数时，我总是收到一个KeyError：'City‘。背景我一直在输入一个包含大约10500行x 15列的.csv文件，并将其转换为数据帧。然后我在末尾添加了一个额外的列，叫做'City‘，用来保存’City‘列的坐标值。 #inserting my .csv file to convert to a dataframe df = pd.read_csv("/path/to/test.csv")

浏览 9提问于2018-12-06得票数 0

1回答

如何删除具有多个条件的pandas中的列

python、pandas、dataframe

我刚接触python和pandas 在下面的数据框中，我需要删除完全为" None“的列，其中包含"blanks None"，但不删除包含值和None的列 ? 在上表中，我希望删除列A和列C，因为它们完全是“无”或“空白和无”，但是列B至少在3个单元格中有一些有效数据，它不应该被干扰如何在df.drop (pandas)中给出这个条件

浏览 48提问于2021-11-11得票数 0

回答已采纳

2回答

从列中获取字符串的第一个字母

python、pandas

我在和熊猫打架，现在我输了。我有一个类似于下面的源表： import pandas as pd a=pd.Series([123,22,32,453,45,453,56]) b=pd.Series([234,4353,355,453,345,453,56]) df=pd.concat([a, b], axis=1) df.columns=['First', 'Second'] 我想用列' first‘中的值的第一个数字将新列添加到此数据框中: a)将列’first‘中的数字改为字符串b)从新创建的字符串中提取第一个字符c) b)b)结果b另存为数据框中

浏览 1提问于2016-02-22得票数 60

回答已采纳

1回答

Pandas外部合并列序列不固定

python-3.x、pandas

我正在尝试使用pandas合并两个数据帧。我正在进行数据帧的外部合并。我的数据框有以下列： DF1: (ID, X) DF2: (ID, Y, Z) 当我合并这些数据框时，输出数据框中列的顺序发生了变化。对于某些迭代，我得到了 DF_OUTPUT: (ID, X, Y, Z) 有时是这样的： DF_OUTPUT: (X, ID, Y, Z) 如何在输出数据框中保留列的顺序？

浏览 2提问于2018-11-27得票数 0

1回答

Pandas -向DF href添加列

python、python-3.x、pandas、web-scraping、beautifulsoup

我正在做一个网络抓取脚本。生成的pandas数据框非常棒，但是我需要添加一个包含在HTML中的href URL值的unique_id列。 <td><a href="/admin/tasks/edit/82689"> ADDRESS </a> CLIENT </td> 目前Pandas数据框有一个包含'ADDRESS CLIENT‘的列，但是我如何添加一个包含href URL的单独列呢？我目前可以使用以下内容获取逗号分隔的unique_id值列表： unique_id = [a['href'] for a

浏览 1提问于2018-08-06得票数 0

回答已采纳

1回答

从现有数据帧的某些列创建新的pandas数据帧

python、pandas、dataframe

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

1回答

如何在Pandas Dataframe (分类数据)中将列名排序到存储箱中

python、pandas、scikit-learn、jupyter-notebook、sklearn-pandas

我有一个Pandas数据框，它包括173列不同的大学专业(例如category_ACCOUNTING)，在列下面的每一行中都有一个1或0的值来指示学生是否选择该专业。我想将这173列排序为两列- STEM和非STEM专业。如何将分类数据分类到两个分类存储箱中？尝试使用pandas.cut()不起作用

浏览 13提问于2019-08-15得票数 0

1回答

避免Pandas将None隐式转换为列元组中的NaN

python、pandas

我有一个Pandas DataFrame，它的列用Python tuples标记。这些列标签元组可以不包含任何内容。当我尝试使用以下任一方法向数据框添加列时，标记元组中的None被隐式转换为numpy.nan。方法1-使用dataframe[ NewColumn ] = ...语法添加列 >>> import pandas >>> df = pandas.DataFrame() >>> column_label = ( 'foo', None ) >>> df[column_label] = [ 1,

浏览 1提问于2016-01-05得票数 1