以特定顺序从pandas dataframe获取值_Pandas -根据特定的键值从Dataframe中提取值，而不是按顺序_Pandas -根据特定的键值从Dataframe中提取值 - 腾讯云开发者社区

python、python-3.x、pandas、dataframe

我来自一个R背景，并且习惯于通过使用如下语法从数据帧中检索值： r_dataframe$some_column_name[row_number] 我可以用下面的语法给数据帧赋值： r_dataframe$some_column_name[row_number] <= some_value 或者不使用箭头： r_dataframe$some_column_name[row_number] = some_value 例如： #create R dataframe data employee <- c('John Doe','Peter Gynn',

浏览 3提问于2020-08-24得票数 3

2回答

从pandas.DataFrame绘制引导示例

numpy、pandas

我想尽可能高效地绘制一个pandas.DataFrame的引导示例。将内置iloc与整数列表一起使用似乎很慢： import pandas import numpy as np # Generate some data n = 5000 values = np.random.uniform(size=(n, 5)) # Construct a pandas.DataFrame columns = ['a', 'b', 'c', 'd', 'e'] df = pandas.DataFrame(values, colu

浏览 45提问于2015-07-19得票数 25

1回答

从字典创建数据帧

python、pandas、dataframe

为了通过函数迭代列表，我使用了以下代码： tot = {} for i in list: tot["tot{0}".format(i)] = stateagg(i) #previously defined function 它的输出是一个pandas字典，我想知道是否有一种方法可以输出到dataframe，或者可以将其转换回dataframe。我试过了 pd.Dataframe.from_dict(tot, orient = 'index') 这将导致以下错误： ValueError: If using all scalar values, you

浏览 1提问于2021-06-01得票数 0

1回答

rpy2和熊猫: PandasError:未正确调用的DataFrame构造函数

python、pandas、rpy2

我正在尝试从R Dataframe创建一个熊猫DataFrame。我遇到了以下错误，我不知道。追溯(最近一次调用)：文件""，第1行，文件"/Library/Python/2.7/site-packages/pandas/core/frame.py"，第291行，init PandasError('DataFrame构造函数未正确调用！‘)PandasError: DataFrame构造函数没有正确调用！我使用的代码是： import rpy2.robjects as robjects from rpy2.robjects import r rob

浏览 2提问于2015-09-24得票数 0

2回答

熊猫-不同字符串之间的比较总是返回真

python、pandas

我正在尝试将Pandas dataframe的单元格中的值与其下面的单元格进行比较。要从当前行下的行获取值，我使用shift： df['shift_minus_1'] = df['company'].shift(-1) 然而，当我比较这些值时，Pandas返回True，尽管有些值显然不匹配。下面是我用于比较的代码： df['comparison'] = df['company'].shift(-1).values[0] == df['company'].values[0]

浏览 0提问于2018-05-18得票数 1

回答已采纳

2回答

熊猫DataFrame从Numpy数组-列顺序

arrays、pandas、numpy、dataframe、smoothing

我尝试使用Pandas从.csv文件中读取数据，使用Savitsky-Golay过滤器平滑数据，过滤数据，然后再次使用Pandas编写输出csv文件。必须将数据从DataFrame转换为数组以执行平滑操作，然后再转换为DataFrame以创建输出文件。我找到了一个关于从numpy数组()创建数据格式的主题，我使用dataset = pd.DataFrame({'Column1': data[:, 0], 'Column2': data[:, 1]})行来创建我的数据。问题是，当我将列名重命名为第一列的“时间”和第二列的“角度”时，最终dataframe中的顺

浏览 1提问于2020-06-11得票数 1

回答已采纳

1回答

如何使用pandas dataframe或任何其他python库从csv文件中的公式单元格中仅获取值？

python、pandas、csv、dataframe

我有一个csv文件，其中有四列。最后3列包含excel函数公式。现在，如何使用pandas、dataframe或其他python库从csv文件中的公式单元格中仅获取值？例如，具有公式=Sum(A1+B1)的Score列

浏览 2提问于2017-09-15得票数 0

1回答

Polar支持从嵌套字典创建数据吗？

python、dataframe、dictionary、python-polars

我正在尝试从字典( mainDict )中创建一个极值数据，其中mainDict的一个值是dict对象(nestedDicts)的列表。当我尝试这样做时，我会得到一个错误(见下面)，我不知道它的含义。然而，熊猫确实允许我使用mainDict创建一个数据格式。我不确定我是否做错了什么，是否是一个错误，或者这一操作只是不支持北极星。我不太担心找到解决办法，因为它应该是简单的(建议是欢迎的)，但我想这样做，如果可能的话。我在google的Polars0.13.38版上( VScode上的问题也发生在本地，pythonVersion3.9.6和windows 10)。下面是再现问题及其输出的代码示

浏览 6提问于2022-05-25得票数 1

回答已采纳

5回答

熊猫合并如何保持秩序？

python、pandas

我在pandas中有两个DataFrames，试图合并它们。但是熊猫一直在改变顺序。我试过设置索引，重置它们，无论我做什么，我都不能得到返回的输出，使行的顺序相同。有什么窍门吗？注意，我们从贷款顺序'a，b，c‘开始，但在合并之后，它是’a，c，b‘。 import pandas loans = [ 'a', 'b', 'c' ] states = [ 'OR', 'CA', 'OR' ] x = pandas.DataFrame({ 'loan' : loans,

浏览 0提问于2013-11-26得票数 34

11回答

如何在保持列的顺序的同时创建DataFrame？

python、pandas

如何在保持列的顺序的同时，从多个DataFrame数组、Pandas系列或Pandas DataFrame创建一个Pandas？例如，我有这两个numpy数组，我想将它们合并为一个Pandas DataFrame。 foo = np.array( [ 1, 2, 3 ] ) bar = np.array( [ 4, 5, 6 ] ) 如果我这样做，bar列将排在第一位，因为dict没有保留顺序。 pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) } ) bar foo 0 4

浏览 7提问于2016-04-11得票数 52

回答已采纳

1回答

堆叠火花数据-水平等效于熊猫的串接或r

apache-spark、dataframe

是否有一种方法可以将一个dataframe水平地附加到另一个-假设两者都有相同的行数？这相当于pandas concat的axis=1； result = pd.concat([df1, df4], axis=1) 或者R cbind

浏览 1提问于2018-04-10得票数 4

回答已采纳

3回答

使用Pandas对不需要的DataFrame排序

python、pandas

考虑一个基本数据框架(使用Pandas)： testDf = pandas.DataFrame({'c':[1,2],'b':[2,2],'a':[3,4]}) 结果表明： a b c 0 3 2 1 1 4 2 2 而不是： c b a 0 1 2 3 1 2 2 4 为什么是按字母顺序排序的？我想要第二个结果。

浏览 7提问于2016-06-30得票数 4

回答已采纳

3回答

如何从pandas数据帧中提取单元

python、pandas

假设我制作了一个pandas数据帧(我不擅长pandas，这可能效率不高)： import pandas as pd colnames = ['a', 'b'] data = pd.DataFrame(columns=colnames) df_row = ['val1', 'val2'] app = pd.Series(df_row, index=cols) data = data.append(app, ignore_index=True) 我希望以字符串而不是pandas对象的形式访问val1。如果我这样做了： cell =

浏览 2提问于2015-08-25得票数 5

回答已采纳

1回答

状态模型镶嵌图-如何排序类别

python、pandas、statsmodels、mosaic

这是dataframe： import pandas as pd from statsmodels.graphics.mosaicplot import mosaic df = pd.DataFrame({'size' : ['small', 'large', 'large', 'small', 'large', 'small'], 'length' : ['long', 'short', 'short', '

浏览 1提问于2016-09-30得票数 3

回答已采纳

3回答

从具有权重的熊猫DataFrame中随机选择一行

python、python-3.x、pandas

我尝试根据提供的权重从pandas DataFrame中随机选择一行。我尝试使用带有这些参数的.sample()方法，但语法无法正常工作： import pandas as pd df = pd.DataFrame({ 'label': [1,0,1,-1], 'ind': [2,3,6,8], }) df.sample(n=1, weights=[0.5, 0.4, 0.1], axis=0) 标签是1,0和-1，我想为每个标签分配不同的权重，以便随机选择。

浏览 21提问于2020-07-21得票数 1

回答已采纳

1回答

使用特定数字作为参数的奇怪Python Pandas read_sql_query()行为

python、pandas、sqlite、import

我正在使用jupyter笔记本将数据从sqlite数据库导入到pandas中，并且对作为params的特定值有一个奇怪的行为。我尝试通过下面的代码来读入并控制错误： start_id = 1 end_id = a df_input = pd.read_sql_query("""SELECT * FROM table WHERE id>? AND id<?""", conn, params={start_id,end_id}) print("Number of entries to match:",

浏览 10提问于2021-01-29得票数 0

回答已采纳

1回答

如何在Bokeh中导入CSV作为ColumnDataSource，而无需通过Pandas？

bokeh

要在Bokeh中使用数据集，通常也会导入熊猫，并使用熊猫DataFrame作为数据。也可以从Pandas DataFrame创建ColumnDataSource。但是，有没有可能直接从csv文件(或任何其他表格源数据)转到Bokeh，而不使用Pandas作为桥梁创建，以及如何创建？

浏览 1提问于2017-08-14得票数 0

6回答

从熊猫数据中提取值

python、pandas、extract、overlap

我正在使用Pandas，并希望从多个数据文件中提取值。例如，有三个数据格式如下所示。 df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1'], 'B': ['B0', 'B1']}) df2 = pd.DataFrame({'key': ['K1', 'K22'

浏览 9提问于2017-03-22得票数 1

回答已采纳

2回答

Pandas dict to dataframe -列无序？

python、pandas

我进行了搜索，但没有看到与这个特定问题有关的任何结果。我有一个Python字典，正在将我的字典转换为pandas数据帧： pandas.DataFrame(data_dict) 它可以工作，但有一个问题-我的pandas dataframe的列与我的Python字典的列的顺序不同。我不确定熊猫是如何重新排序的。如何保留排序？

浏览 2提问于2015-04-15得票数 1

1回答

高级矮胖/熊猫索引

python、numpy、pandas、scipy

我想执行一个索引操作，比如 ix = [(1,2),(3,4),(5,6)] ar[ix] # this is invalid real life 这就给了我一维数组 array([ar[1,2], ar[3,4], ar[5,6]]) 换句话说，我想指定一组坐标，并在这些坐标处得到一个值向量。这不是一项工作，我对索引ix、对列表、对列表、二维数组的精确性不太在意，pandas.DataFrame很好。我有兴趣在numpy数组和Pandas DataFrames上都这样做。

浏览 2提问于2014-05-08得票数 2

回答已采纳

1回答

熊猫数据串接

python、pandas、dataframe

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

4回答

熊猫:从DatetimeIndex中提取值

python、pandas、datetimeindex

我有一个Pandas DataFrame，它的行和列是DatetimeIndex。 import pandas as pd data = pd.DataFrame( { "PERIOD_END_DATE": pd.date_range(start="2018-01", end="2018-04", freq="M"), "first": list("abc"), "second": list("efg")

浏览 23提问于2022-11-01得票数 1

回答已采纳

4回答

从ordereddict生成pandas数据帧？

python、pandas、dataframe、ordereddictionary

我正在尝试从有序字典创建一个pandas数据帧，以保持值的顺序。但是，由于某些原因，在创建数据帧之后，这些字段又被弄乱了。以下是已排序字典的列表： [OrderedDict([ ('key_a', 'value_a'), ('key_b', 'value_b'), ]), OrderedDict([ ('key_a', 'value_c'), ('key_b', 'value_d'), ]) ] 现在我应该如何从这些东西中创建一个p

浏览 28提问于2017-06-05得票数 21

回答已采纳

1回答

PySpark数据显示错误的值

python、pandas、dataframe、pyspark、spark-dataframe

我刚刚从Pandas转到了PySpark dataframe，发现在PySpark dataframe中打印出相同的列会给出错误的值。下面是一个例子:使用Pandas： df_pandas=pd.read_csv("crime.csv", low_memory=False) print(df_pandas["CRIMEID"].head(5)) Output: 1321797 1344185 1181882 1182632 1195867 而使用PySpark数据帧： df_spark = sqlContext.read.format('csv'

浏览 1提问于2018-02-27得票数 0

回答已采纳

3回答

在Pandas中，如何使用从csv文件导入的dataframe键提取某些值？

python、pandas、dataframe

使用Pandas，我试图使用键提取值，但我一直没有这样做。你能帮我做这个吗？有一个csv文件如下所示： value "{""id"":""1234"",""currency"":""USD""}" "{""id"":""5678"",""currency"":""EUR""}" 我在Pandas中导入了这个文

浏览 3提问于2022-01-02得票数 0

2回答

从熊猫数据帧中提取单个数据

python、pandas、dataframe

如何从给定的Dataframe提取值(string)，从不同的列提取特定的值。例如，我希望得到'Adrs‘where 'Value'=2 import pandas as pd df = pd.DataFrame({'Adrs':["AAA","BBB"],'Value':[1,2]}, index=[0,1]) print(df) print("") df2 = df[df['Value']==2] string = df2.Adrs print(string) 输

浏览 1提问于2016-01-29得票数 0

回答已采纳

1回答

使用类从dataframe中删除列

python-3.x、pandas、dataframe、oop

我正在努力减少数据帧中不需要的数据列，但让它在OOP的范围内工作。数据帧中的列是从'A‘到'M’。示例： import pandas as pd # columns 'A' 'B' and 'C' are what I want kept vibe_df = pd.read_csv('C:Location/Document.csv') vibe_df = vibe_df[['DateTime', 'A', 'B', 'C']] 上面的工作，但是，我

浏览 0提问于2020-08-27得票数 1

1回答

潘达斯有“收缩”窗口函数吗？

python、pandas

Pandas是否有一个pandas.DataFrame.contracting窗口函数，与相反，而不需要先对数据进行排序？这将类似于星火的，而不是。我想应该是和.rolling在一起示例： import pandas as pd testdf = pd.DataFrame({'A': [2, 2, 2, 5, 1, 0, 1, 2, 0, 1]}) testdf['A'].expanding(min_periods=1).apply(lambda x: (x > 2).any()).tolist() # [0.0, 0.0, 0.0, 1.0,

浏览 0提问于2018-07-16得票数 0

回答已采纳

1回答

从JSON url中获取日期字段作为pandas DataFrame

python、pandas

我正在尝试将此API URL放入pandas DataFrame并获取值，但仍然需要像其他值一样将日期作为列添加： import pandas as pd from pandas.io.json import json_normalize import ssl ssl._create_default_https_context = ssl._create_unverified_context df = pd.read_json("https://covidapi.info/api/v1/country/DOM") df = pd.DataFrame(df['res

浏览 27提问于2020-04-08得票数 2

回答已采纳

1回答

存储多对多关系的最佳方式，以便将来快速查询

python、pandas、many-to-many

我有一个数据框，我在其中对一个字段执行多个regex子字符串搜索，以确定此字符串属于哪个“家族”。这是一个相当昂贵的搜索，所以我想将结果保存在一个Pandas列中，以便更快地检索。Pandas有一个很好的isin()方法，用于确定单个检索到的项是否在给定的查询集中，但我不确定如何进行反向操作。下面是一个简单的单行示例： >>> from pandas import DataFrame >>> example = DataFrame({"text": "the quick brown fox jumps over the lazy d

浏览 0提问于2015-08-10得票数 0

1回答

如何从每一列中选择一个特定的索引？

python、pandas

想象一下，我有一个pandas.Dataframe，类似于： x = DataFrame({ 'a': [7,6,8,0,2,5], 'b': [3,4,5,6,7,8], 'c': [3,8,5,6,0,1]}, index=[1,2,3,4,5,6]) 然后，我有一个pandas.Series，它为每个键提供了一个我想要选择的特定索引： y = Series([4,1,6], index=['a','b','c']) 有什么办法可以用最好的熊猫方法

浏览 2提问于2015-05-17得票数 3

回答已采纳

1回答

Bigquery Python API -编写dataframe order by column

python、google-cloud-platform、google-bigquery、google-api-python-client

我正在尝试使用Python API向Bigquery编写一个pandas.Dataframe，按列对记录进行排序： from google.cloud import bigquery client = bigquery.Client(project=project_id) df = pd.DataFrame(...) df.sort_values('date', inplace=True) job_config = bigquery.LoadJobConfig( schema=[ bigquery.SchemaField("date

浏览 17提问于2021-06-30得票数 0

1回答

迭代dataframe中的行并将对象添加到列表中

python、pandas、dataframe

我将一个txt文件读取到一个dataframe中，现在尝试遍历pandas dataframe中的行，并为每个数据条目创建一个学生对象。最终，将学生对象存储在“学生”列表中。我对如何迭代行并将学生对象添加到学生列表中感到有点困惑。有人能帮我创建这个列表吗？谢谢 students = [] import pandas as pd data = pd.read_csv('students.txt') df = pd.DataFrame(data) print(df) 文件输出 firstname lastname status gpa 0 Mike

浏览 42提问于2021-10-31得票数 0

1回答

为什么rank方法的升序参数不起作用？

python、pandas、series、rank

import pandas df = pandas.DataFrame({'a':[1,2,3,4], 'b':[30,40,10,20]}) df['rank'] = df['b'].rank() 按照预期工作。 df['rank'] = df['b'].rank(ascending=True) 生成： TypeError: rank() got an unexpected keyword argument 'ascending' 有人知道我做错了什么吗？

浏览 1提问于2013-08-01得票数 2

2回答

创建一个值依赖于其他列值的新列

python-3.x、pandas

假设我有如下所示的数据文件： import pandas as pd import numpy as np d = {'Column 1': [10, 12,13,43,np.nan], 'Column2':[np.nan,7,np.nan,49,8]} df = pd.DataFrame(d) 我想创建第三列，它的条件是从第2列中获取值，除非它们是NaNs。如下所示：我已经找到了多个主题/解决方案，其中条件依赖于一列中的值，但找不到必须从多个列提供数据的主题/解决方案。

浏览 3提问于2022-01-26得票数 -1

回答已采纳

2回答

比较numpy数组和Pandas数据帧中的值

pandas、numpy、dataframe

我有一个类型为numpy.ndarray和pandas DataFrame的数组，需要一种将每个值相互比较的方法。下面是我尝试过的一种方法。我还使用了pd.get(labels)来提取值，并返回了None。y_test是一个pandas DataFrame，而preds是一个预测的numpy数组。我尝试将它们都转换为列表和numpy数组进行比较： sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True) model.compile(loss='binary_crossentropy',

浏览 31提问于2019-06-28得票数 0

1回答

Python DataFrame追加行删除最后一列

python、pandas

我在pandas中将行添加到数据帧时遇到了问题。从excel表格中读取数据并将其放入DataFrame。下面是一个样例： import pandas as pd df1 = pd.DataFrame({'date': ['22-jun-18', '22-jun-18', '22-jun-18'], 'id': ['1', '2', '3', ] 'name&#

浏览 3提问于2018-06-27得票数 0

1回答

使用排序索引将Python写入Excel

python、sorting、dictionary、export-to-excel

我已经编写了python代码，并且我正在尝试将一个矩阵写入Excel。我已经用python创建了一个字典，并且我使用DataFrame来构造矩阵。问题是，python中的字典不能排序。因此，当我写入Excel时，我得到一个没有排序的矩阵。 from pandas import DataFrame import pandas as pd list = ['6M', '1yr', '2yr', '10yr', '30yr'] Corr = {} for line in list: for line2 in

浏览 1提问于2015-12-15得票数 0

2回答

在矩阵中计数唯一对和存储计数

python、pandas、pivot

我的问题类似于我有成对的数据，如下所示： ID ATTR 3 10 1 20 1 20 4 30 我想计数唯一的对，并将这些频率计数存储在这样的矩阵中： 10 20 30 1 | 0 2 0 3 | 1 0 0 4 | 0 0 1 或者，如果已知ID在{1、2、3、4}中取值，而ATTR在{0、10、20、30}中取值，那么我想要这样的矩阵： 0 10 20 30 1 | 0 0 2 0 2 | 0 0 0 0 3 | 0 1

浏览 1提问于2018-01-23得票数 3

回答已采纳

1回答

pandas数据框中2列的Seaborn散点图

pandas、seaborn、scatter-plot

我有一个dataframe df： sentiment | topic 1 | 1 -4 | 0 2 | 1 -1 | 0 1 | 0 3 | 1 我想做一个散点图，看看情感值是如何根据主题排列的。我的代码： import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df = pd.read_sql_table("df", result) sns.catplot(x="topic

浏览 13提问于2020-01-29得票数 0

回答已采纳

1回答

按选定的更大数据栏分组，创建多行

python、dataframe、matplotlib

我有一个dataframe，示例示例如下： import datetime import pandas as pd ids =[1, 2, 3, 1, 2, 3] vals = [3, 5, 6, 3, 7, 8] lats = [10, 10, 10, 30, 30, 30] ratio = [.1, .4, .2, .3, .4, .5,] df = pd.DataFrame({'ids' : ids, 'vals' : vals, 'lats' : lats, 'ratio' : ratio}) >>&g

浏览 4提问于2022-02-23得票数 1

2回答

主脚本可以使用模块中的导入语句吗？

python、python-3.x

在主要python脚本中可以从python模块生成导入语句吗？ my_module.py import pandas as pd def data(): df1 = pd.DataFrame({'A': range(1, 6), 'B': range(10, 0, -2), 'C': range(10, 5, -1) }) return df1 my_scrpit.py import

浏览 3提问于2020-12-21得票数 0

回答已采纳

1回答

如何向pandas.plot(类别=‘bar)添加一条回归线？

pandas、plot、regression

我想为下面的每一种口味添加一条回归线。我怎么能这么做？我需要用小情节吗？是否可以使用pandas.plot，还是需要使用完整的matplotlib？ import pandas as pd # initialize list of lists data = [[1,157.842730083188,202.290991182781,244.849416438322], [2,234.516775578511,190.104435611797,202.157088214941], [3,198.279130213755,193.075780258345,194.

浏览 1提问于2021-07-21得票数 0

回答已采纳

2回答

熊猫翻滚:如何从左到右或从上到下滚动？

python、pandas

默认情况下，我有一个问题，那就是我正在使用Pandas.DataFrame.rolling()方法。我发现该方法只根据之前的数值或该数值的中心编号来计算数值。现在我需要根据后面的数字来获取值。例如： import pandas as pd datas = pd.DataFrame({"a": [1,2,3]}) datas["c"] = datas["a"].rolling(2, min_periods=1).mean() 数据： a c 0 1 1.0 1 2 1.5 2 3 2.5 如何获取数据，例如： a

浏览 0提问于2018-08-08得票数 2

回答已采纳

1回答

样本大小大于DataFrame长度的采样行

python、pandas、dataframe、random、sample

我被要求根据一个旧变量的数据生成一个新变量。基本上，我们要问的是，我从原始函数中随机获取值(通过使用random函数)，并且至少有10倍于旧的观察值，然后将其保存为一个新变量。这是我的数据集：我想使用的变量是area。这是我的尝试，但它给了我一个module object is not callable错误： import pandas as pd import random as rand dataFrame = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/forest-fire

浏览 1提问于2019-01-05得票数 0

回答已采纳

3回答

pandas txt读取和绘制的问题

python、python-3.x、pandas、dataframe

我正在尝试使用pandas从txt文件中读取值，并使用matploitlib绘制散点图，但在尝试不同的方法时，我总是遇到各种错误我的txt文件摘要... Brain Body 0.37 0.117182754 73 1.349981613 70 0.925010921 0.8 0.007620352 0.15 0.001406136 50 0.419981176 from pandas import* import pandas as pd from sklearn import linear_model import matplotlib.pyp

浏览 0提问于2019-07-25得票数 1

2回答

如何获取matplotlib箱图的箱图数据

python、pandas、matplotlib

我需要获取在Pandas中绘制箱形图所生成的统计数据(使用dataframe创建箱形图)。即Quartile1、Quartile2、Quartile3、下须值、上须值和异常值。我尝试使用以下查询来绘制箱线图。 import pandas as pd df = pd.DataFrame(np.random.rand(100, 5), columns=['A', 'B', 'C', 'D', 'E']) pd.DataFrame.boxplot(df,return_type = 'both') 有没有一

浏览 2提问于2015-11-04得票数 16

回答已采纳

2回答

在Pandas中删除NaN时遇到问题

python、pandas、numpy、nan

我花了很长时间将我的pandas数据集中的列从"object“更改为"int64”。我的DataFrame名为bsblandings。我的bsblandings.info()输出如下所示： <class 'pandas.core.frame.DataFrame'> RangeIndex: 810 entries, 0 to 809 Data columns (total 9 columns): Year 810 non-null int64 Coast 810 non-null object Subregion

浏览 0提问于2019-05-02得票数 0

4回答

潘达斯df的LabelEncoder拟合阶数

python、pandas、scikit-learn

我正在安装一个科学工具-学习在一个熊猫的专栏。如何确定所遇到的字符串映射到整数的顺序？这是决定性的吗？更重要的是，我可以指定这个订单吗？ import pandas as pd from sklearn import preprocessing df = pd.DataFrame(data=["first", "second", "third", "fourth"], columns=['x']) le = preprocessing.LabelEncoder() le.fit(df['x']

浏览 1提问于2016-08-03得票数 13

回答已采纳

2回答

如何从文件夹中选择csv文件中的列？

python、pandas、file、export-to-csv、glob

我正在尝试从我的文件中选择“第三列”，然后将它们组合成一个文件。问题是，当我梳理这些列时，它们与文件夹中的文件的模式不同。例如，我在"First“、”Second“和”Third“文件夹中有三个文件。下面给出的代码总是先读取“第二个”文件，再读取“第一个”文件。有谁可以帮我？ import glob import pandas as pd import numpy as np from tqdm import tqdm extension = 'dat' all_filenames = [i for i in glob.glob('*.{}'.form

浏览 14提问于2020-11-01得票数 0