如何为Pandas Dataframe创建更多的随机行？_如何为pandas dataframe中的每一行创建坐标列表？_我们如何为pandas dataframe的列和行标题着色？ - 腾讯云开发者社区

python、pandas

我想创建一个包含2列x行的Pandas数据帧，其中包含随机字符串。我找到了生成带有随机int和随机字符串生成器的pandas数据帧的代码。我仍然没有看到一条清晰的路径来创建一个带有随机字符串的pandas数据框架。用于随机int数据帧的代码 import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) 随机字符串的代码 import string import random def id_gener

浏览 60提问于2019-06-01得票数 4

回答已采纳

1回答

如何在DataFrame中设置K个随机列值为空？

python、pandas

import pandas as pd df = pd.DataFrame( { 'A': [1,2,3,4], 'B': [10,20,30,40], 'C': [20,40,60,80] }, ) df['A'] = '' print(df) 我想将A列的K个值设置为空值，这些K值应该随机选择。列A的len(df)-K值不会受到影响。我写了这个函数来生成随机行索引，然后如何为这些索引将df的

浏览 31提问于2021-10-07得票数 1

回答已采纳

2回答

创建单个pandas.core.frame.Pandas对象

python、pandas、dataframe

如何将单个数据行创建为pandas.core.frame.Pandas object 因此，当您使用for row in df.itertuples()迭代一个dataframe (df)时，每一行都将是一个pandas.core.frame.Pandas对象。我想要创建一个这种类型的对象。例如： import pandas as pd d = [{'a': 1, 'b': 2}] df = pd.DataFrame(d) print(type(df)) print("a", df.a) for row in df.itertuples()

浏览 7提问于2021-09-15得票数 3

回答已采纳

1回答

如何将熊猫DataFrame中的一行从系列赛转换回DataFrame？

python、pandas

我正在迭代熊猫DataFrame的行，将每个行扩展为N行，每个行都有更多的信息(为了简单起见，我在这里把它变成了一个随机数)： from pandas import DataFrame import pandas as pd from numpy import random, arange N=3 x = DataFrame.from_dict({'farm' : ['A','B','A','B'], 'fruit':['apple

浏览 3提问于2014-04-30得票数 1

回答已采纳

1回答

Python在新列数据帧中生成16个随机数和字母

python、python-3.x、dataframe

我想在dataframe的列中创建一个包含随机数和字母总数16的字符串。 import pandas as pd data = [[ 'Apr 2'], ['Jan 1'], [ 'Jan 18']] df = pd.DataFrame(data, columns = ['date']) 预期结果 ? 我的方法不起作用，因为它为每一行提供相同的随机数字/字母 import uuid; df['id'] = uuid.uuid4().hex.upper()[0:16]

浏览 47提问于2021-09-09得票数 0

回答已采纳

1回答

如何为对创建唯一的ID

python

我有熊猫数据存储两个客户的关系如下所示。如何为关联客户创建唯一的ID？假设有成千上万的顾客。在此示例中，客户ID是未被归类为前缀'A‘和'B’的完全随机数。前缀只是用来解释这个问题。 import pandas as pd # initialize list of lists data = [['A1', 'A1'], ['A1', 'A2'], ['A2', 'A1'], ['A2', &

浏览 4提问于2022-11-28得票数 1

5回答

Pandas:从每行的随机列中选择值

python、pandas、dataframe、random

假设我有如下的Pandas DataFrame： df = pd.DataFrame({ 'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9] }) a b c 0 1 4 7 1 2 5 8 2 3 6 9 我希望生成一个新的pandas.Series，以便从DataFrame的随机列中逐行选择该序列的值。因此，可能的输出是序列： 0 7 1 2 2 9 dtype: int64 (在第0行中随机选择'

浏览 45提问于2019-07-25得票数 4

回答已采纳

1回答

KeyError:当尝试选择dask数据框上的列时：“没有[索引([‘’，'']，dtype='object')]在[列]中”

pandas、dask

我正在使用from_pandas()函数从熊猫数据帧创建一个dask数据帧。当我尝试使用方括号[ ]从dask dataframe中选择两列时，我得到了一个KeyError。根据dask文档，dask dataframe支持像pandas dataframe一样的方括号列选择。 # data is a pandas dataframe dask_df = ddf.from_pandas(data, 30) data = data[dask_df[['length', 'country']].apply( lambda x: myfun

浏览 67提问于2019-10-04得票数 1

1回答

在熊猫DataFrame中生成随机数字id作为列

python、pandas

我想创建一个随机数字Pandas系列并分配给DataFrame。我的DataFrame有一个id列，但是它是字母数字，在从SQL数据库查询数据时会引起一些问题。因此，我想创建一个随机生成的数字列。 import pandas as pd df = pd.DataFrame({'name': ['A', 'B', 'C'], 'id': [1, 2, 3] }) 随机生成的数字id列应该长度为6。预期产出： name id rid A

浏览 7提问于2022-04-02得票数 -1

3回答

从具有权重的熊猫DataFrame中随机选择一行

python、python-3.x、pandas

我尝试根据提供的权重从pandas DataFrame中随机选择一行。我尝试使用带有这些参数的.sample()方法，但语法无法正常工作： import pandas as pd df = pd.DataFrame({ 'label': [1,0,1,-1], 'ind': [2,3,6,8], }) df.sample(n=1, weights=[0.5, 0.4, 0.1], axis=0) 标签是1,0和-1，我想为每个标签分配不同的权重，以便随机选择。

浏览 21提问于2020-07-21得票数 1

回答已采纳

1回答

Pandas DataFrame中的多个条件语句

python、excel、pandas

我正在尝试从一个Excel文件中复制多个嵌套的IF语句，并将其应用于一个Pandas DataFrame，如果可能的话，不会遍历每个单独的值。我有一个10x10000随机数的数据帧，基本上我想通过只复制10行中的第1行来创建一个新的Dataframe： =IF(D16<0.25,1,IF(D16<0.5,2,IF(D16<0.75,3,4))) 此输出为D27格式。在第2-10行： =IF(D27=1,IF(D17<$E$3,1,3),IF(D27=2,IF(D17<$E$3,1,3),IF(D27=3,IF(D17<$E$4,2,4),IF(D27=4,I

浏览 7提问于2018-08-08得票数 0

2回答

如何从熊猫栏中生成3的随机集的X数？

python-3.x、pandas

我有一个如下所示的dataframe列(大约200行)： col1 a b c d e f 我想要创建一个新的数据，与一栏和15套3随机组合的项目在熊猫栏。例如： new_df combinations: (a,b,c) (a,c,d) (a,d,c) (b,a,d) (d,a,c) (a,d,f) (e,a,f) (a,f,e) (b,e,f) (f,b,e) (c,b,e) (b,e,a) (a,e,f) (e,f,a) 目前，我已经创建的代码组合了每一个可能的组合，当我试图将结果附加到另一个dataframe时，内存就用完了： import pandas as pd from itert

浏览 1提问于2020-11-07得票数 1

回答已采纳

1回答

为什么pandas.DataFrames上的简单操作要比numpy.ndarrays上的相同操作慢呢？

python、pandas、numpy、dataframe

为什么pandas.DataFrame的操作这么慢？！看下面的例子。计量：创建一个由随机浮点数填充的numpy.ndarray 创建一个用相同的填充的pandas.DataFrame I度量下列操作的时间 numpy.ndarray的 - Take the sum along the 0-axis - Take the sum along the 1-axis pandas.DataFrame的 - Take the sum along the 0-axis - Take the sum along the 1-axis pandas.DataFrame.values ->

浏览 5提问于2020-05-27得票数 4

2回答

创建pandas数据帧:在numpy上映射函数

python、pandas、numpy、dataframe

我正在创建一个pandas数据帧，并使用numpy来模拟值。我想将随机生成的in分配给pandas中的两列，为此，我编写了一个返回字母数字in的函数。但是，在我当前的代码中，它只调用该函数一次，并为所有行返回相同的ids。我需要为每一行提供唯一的ids，因此需要高效地迭代pandas数据帧。理想情况下，.apply可以做到这一点，但是，我需要在创建pandas数据帧时完成这项工作。下面是我的代码： # Generate alphanumeric lease id and property ids def gen_ids(length): ids = ''

浏览 20提问于2020-07-04得票数 1

回答已采纳

2回答

从dataframe中随机选择列

python、pandas

我的问题很简单:有没有办法从Pandas中的dataframe中随机选择列？为了明确起见，我想随机选择带有附加值的n 列。我知道有一种随机挑选行的方法： import pandas as pd df = pd.read_csv(filename, sep=',', nrows=None) a = df.sample(n = 2) 那么问题是，它是否存在一种寻找随机列的等效方法？

浏览 0提问于2017-08-08得票数 6

回答已采纳

2回答

对时间序列数据进行重采样

python、pandas

我有一些随机的每小时时间序列数据(让我们编造一些)，我如何为每日最大值重新采样，以及为记录的每日最大值所在的小时创建单独的df列？ import pandas as pd import numpy as np from numpy.random import randint import os np.random.seed(10) # added for reproductibility

浏览 25提问于2020-03-03得票数 3

回答已采纳

1回答

将Pandas df列转换为JSON字符串

python、json、pandas

拥有下列熊猫资料： from pandas import * df = DataFrame({'foo':['a','b','c'], 'bar':[1, 2, 3]}) 看上去： bar foo 0 1 a 1 2 b 2 3 c 如何为每一行获取以下字符串模式： {"telemetry":{"a":1}}

浏览 6提问于2020-06-16得票数 2

回答已采纳

1回答

从pandas数据框中挑选特定的索引

python、pandas

我有一个包含数百个条目的pandas数据帧和数组中的随机条目数组。例如： import pandas as pd list1 = [13,2,32,34,15,7,19] list2 = [15,65,95,9,90,88,10] df1 = pd.DataFrame(list1) df2 = pd.DataFrame(list2) cols = [df1, df2] df1.loc[:, cols] 我还有另一个数组，叫做 M =[1, 2, 5, 6, 9] 这些是我想要的pandas数据框的索引，有没有一种方法可以创建一个新的表，只挑选出与数组M给出的索引匹配的行？

浏览 3提问于2018-12-09得票数 1

1回答

熊猫DataFrame:与json.dumps的不寻常行为(额外双引号)

python、pandas、dataframe

我有这个Pandas DataFrame，它有label和time两列 >>> df = pd.DataFrame([{'a':{'tier':'one','app':'frontend'},'time':100}]) >>> df a time 0 {u'tier': u'one', u'app': u'frontend&#

浏览 0提问于2019-09-23得票数 3

回答已采纳

1回答

我如何从熊猫DataFrame的一个子集中取样？

python、pandas

如何从第0行和长度- 100之间的pandas DataFrame中选择随机行？类似于start_state = self.market_data.sample(1)的东西，除了从任何行(即使是最后的100行)中选择。

浏览 0提问于2019-03-30得票数 1

回答已采纳

1回答

如何提取SMOTE后新增的行(imblearn模块)

python、imblearn、smote

是否可以从imblearn的smote函数创建的pandas dataframe中提取新添加的行？

浏览 18提问于2020-06-16得票数 0

回答已采纳

1回答

如何在Pandas dataframe中随机抽样2行之间的元素？

python、pandas、dataframe

我有一个Pandas df，格式如下： ColumnA. ColumnB. IsMatching 0 sadasdsad. asdsadsad True 1 asdsadsadas. asdsadasd. False 2 asdsadasd. asdsadsad. False 3 dfsdfsdfi ijijiiijj. False 4 sdasdsads. asdsadsad True 5 dfsdfsdfi ijijiiijj. False 6 jijijijij. iji

浏览 2提问于2021-03-02得票数 0

回答已采纳

1回答

Python中最有效的数据行操作工具是什么？

python、pandas、performance

我做了很多工作，需要跨行执行操作，使用行中其他列上该行列中的数据。最近，我不得不对120万行数据集(27列，300 Mb)进行一些处理，这些数据集需要对大约30万行进行逐行修改。有些事务被分割成多个记录，我想聚合它们。这包括用延迟删除将它们向上折叠，将5列相加，并在第6列上做加权平均值。一开始我尝试使用Pandas。熊猫花了12+几个小时跑到80,000排(我在办公室用的机器是垃圾)。我可能会看到，如果我删除行，它必须在每一行之后将300 Mb数组重新放置在内存中，但它甚至没有删除行，因为这是在结束时设置的。我通常看到，围绕Pandas的情绪似乎是“不要在dataframe的行上迭代

浏览 0提问于2021-05-13得票数 0

1回答

如何根据另一列中满足的条件填充数据格式列

python、pandas、dataframe、numpy

我想知道如何为下面的dataframe创建一个新列(例如B)，并为每一行定义其值是否为A1: x>2、A2:介于(2，0)、A3:介于(0，-2)或A4: x<-2。 imprt pandas as pd imort numpy as np df = pd.DataFrame({'A':[-4,-3.5,-2.5,-1,1,1.5,2,2.5,3.5]}) 我尝试了下面的代码，但它不起作用。 df['B'] = np.where((df['A']>2), 'A1', np.where

浏览 1提问于2021-12-30得票数 1

回答已采纳

1回答

如何为Pandas Dataframe创建更多的随机行？

python、pandas、dataframe、random

假设我有一个只有一行的Pandas Dataframe，它看起来像这样： Column1 Column2 ...... Column n Row 1 0.123 0.234. 0.156 现在，例如，我想为此多生成10行，一种方法是只复制此行10次。但是，我希望它在数学上和逻辑上是连贯的，例如，生成的10多行遵循正态分布(尽管问题是只有1行)，但不希望所有行都相同。有没有什么合适的方法可以基于这一行生成更多的随机行，这样这些行就不仅仅是普通的重复行了？

浏览 16提问于2019-06-06得票数 0

1回答

在随机森林分类器中打印特定样本的决策路径

python、pandas、machine-learning、scikit-learn、random-forest

如何为特定示例打印随机林的决策路径而不是随机林中单个树的路径。 import numpy as np import pandas as pd from sklearn.datasets import make_classification from sklearn.ensemble import RandomForestClassifier X, y = make_classification(n_samples=1000, n_features=6, n_informative=3,

浏览 0提问于2018-02-20得票数 5

回答已采纳

1回答

在Python语言中向DataFrame添加新数据行的最有效/最快的方法是什么

python、pandas

该程序创建一些随机产品，然后通过随机选择产品来创建订单。目前每个订单只有一个项目；未来的版本将随机化每个订单的行项目数量。我以前从未使用过Python或Pandas，我想确保我的方法是向DataFrame添加新行并从DataFrame中随机选择行的最有效方法。有什么建议吗？谢谢 def get_random_products(count=500): x = 0 df = pd.DataFrame(columns=['product_id', 'SKU', 'price', 'category', 's

浏览 0提问于2021-04-29得票数 0

1回答

如何将列指定为每一行的权重，然后根据这些权重对数据进行抽样？

pandas、dataframe、python-3.5

我正在尝试在dataframe中实现加权随机选择。我使用下面的代码来构建dataframe： import pandas as pd from numpy import exp import random moves = [(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4)] data = {'moves': list(map(lambda i: moves[i] if divmod(i, len(moves))[0] != 1 else moves[divmod(i, len(moves))[1]],

浏览 4提问于2017-04-30得票数 1

回答已采纳

0回答

如何创建具有随机值的简单DataFrame

scala、apache-spark、spark-dataframe

我正在尝试创建一个非常简单的DataFrame，例如3列和3行。我想要这样的东西： +------+---+-----+ |nameID|age| Code| +------+---+-----+ |2123 | 80| 4553| |65435 | 10| 5454| +------+---+-----+ 如何在Scala中创建Dataframe (这是一个示例)。我有下一个程序： import org.apache.spark.sql._ import org.apache.spark.sql.types._ object ejemploApp extends App{ val

浏览 2提问于2017-12-04得票数 1

回答已采纳

1回答

模拟特定行并将其存储到dataframe

python、pandas、dataframe

我在一个范围内生成随机数。一旦计算了随机数并将其附加到列表中，我就创建了一个数据帧。这里我想选择第二行现在，我想三次生成上述逻辑。每次我都想存储第二行。 import pandas as pd import random low_Percent = float(60) high_Percent = float(120) val_List=[] val_List1 =[] # for j in range(3): for j in range(3): for i in range(30): num1 = (random.randint(low

浏览 3提问于2020-05-15得票数 0

回答已采纳

3回答

如何从多个列表中随机选择以填充DFcolumns

python、pandas、dataframe、random

我想根据下面3个列表中的随机值，用3列和20行填充Pandas DataFrame。我不知道我做错了什么。有什么建议吗？ import random import pandas as pd import numpy as np tests= ['TestA', 'TestB', 'TestC', 'TestD'] projects = ['AK', 'AA', 'JH', 'WM'] number = [10, 100, 200, 1000, 2000] df

浏览 2提问于2020-07-15得票数 0

回答已采纳

1回答

在pandas DataFrame中，如何添加显示随机选择结果的列？

python、pandas、numpy

我到处都能看到如何在pandas中随机选择DataFrame行(使用和不使用numpy)。我还没有发现的是如何在DataFrame中添加一列来指示行是否被随机选择。具体来说，我需要 1)按A列中的值分组行 2)每组随机抽取10行，不替换 3)添加一列B，表示是否选择了每一行(TRUE/FALSE)。结果应该是原始的DataFrame (即，未分组)，每一行都添加了TRUE/FALSE列(这意味着，在其组内，该行是在随机选择期间选择的)。我使用的是python 3.6.2，pandas 0.20.3，numpy 1.13.1。响应评论进行编辑：对于这个小样本数据，现在假设随机选择2行，而

浏览 19提问于2018-02-06得票数 0

回答已采纳

1回答

在“部分”Pandas DataFrame中索引特定行

python-3.x、pandas

比如说，我有一个Pandas DataFrame，它有3列和3行，0,1,2 . 1000。然后，假设我从中提取了一个DataFrame，这样它就随机地选择了行1、5、9.999. 现在，如何使用交替的奇数行迭代这个新的的DataFrame行呢？例如，从0到1000的for循环将在新的KeyError中不适当的索引处返回DataFrame。是否有方法获取新DateFrame中保留的行的列表？我对这个网站缺乏经验，所以如果我的问题能被更好的格式化，我很抱歉。谢谢。

浏览 8提问于2022-06-13得票数 0

1回答

如何为Pandas DataFrame指定输入数据类型

python、pandas

我希望将现有的Python转换为Pandas DataFrame对象。如何为每一列指定数据格式并定义索引列？下面是我的代码示例： import pandas as pd data = [[1444990457000286208, 0, 286], [1435233159000067840, 0, 68], [1431544002000055040, 1, 55]] df = pd.DataFrame(data, columns=['time', 'value1', 'value2']) 在上面的示例中，对于现有列，

浏览 2提问于2016-02-25得票数 5

回答已采纳

2回答

随机丢弃重复

python、pandas

在Pandas中，我们可以使用dataframe.drop_duplicates()删除重复数据，默认情况下保留重复数据的第一行。如果是keep_last = True，则保留最后一行。我们如何保持随机行，并使用熊猫drop_duplicate删除重复行？

浏览 3提问于2014-04-04得票数 5

回答已采纳

1回答

为pandas数据帧的每一行随机抽样非空列值

python、pandas、dataframe、random、sample

对于每一行，我想随机抽样k个对应于非空值的列索引。如果我从这个数据帧开始， A = pd.DataFrame([ [1, np.nan, 3, 5], [np.nan, 2, np.nan, 7], [4, 8, 9] ]) >>> A 0 1 2 3 0 1.0 NaN 3.0 5.0 1 NaN 2.0 NaN 7.0 2 4.0 8.0 9.0 NaN 如果我想为每一行随机采样2个非空值，并将它们更改为值-1，一种方法如下： B = A.copy() for i in A.index: s = A.l

浏览 7提问于2021-07-30得票数 0

回答已采纳

1回答

如何使用Python为Pandas dataframe中的每一行在一个范围内生成随机数？

python、numpy、pandas、random

目标：为构造的字段“生日”中的每一行创建一个唯一的随机数。 import pandas as pd import numpy as np df1=pd.DataFrame.from_items([('A', [1, 2, 3]), ('B', [4, 5, 6])]) df1['Birth']= random.randrange(1905,1995, len(df1)) df1 上述代码为所有行生成一个随机数，如下所示： A B Birth 0 1 4 1974 1 2 5 1974 2 3 6

浏览 1提问于2015-11-11得票数 3

回答已采纳

1回答

滑雪板中一次交叉验证的混淆矩阵

python、machine-learning、scikit-learn、logistic-regression、cross-validation

，但我不知道如何创建混淆矩阵，当我使用休假交叉验证时。 # Evaluate using Leave One Out Cross Validation import pandas from sklearn import model_selection from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['p

浏览 0提问于2018-11-10得票数 0

6回答

Pandas数据帧中的随机行选择

python、pandas、random

有没有办法在Pandas中从DataFrame中随机选择行？在R中，使用car包，有一个有用的函数some(x, n)，它类似于head，但在本例中从x中随机选择10行。我也看过切片文档，似乎没有对应的文档。更新现在使用版本20。这里有一个示例方法。 df.sample(n)

浏览 1提问于2013-04-10得票数 209

回答已采纳

2回答

python中每行唯一的随机整数生成矩阵

python

是否有一种方法可以直接对每一行上唯一的随机整数矩阵进行采样？对每一行进行此操作可能会很慢。 import random as rd import pandas as pd N = 1000000 # number of rows/number of draws (try N=1000) M = 100000 # range to sample from K = 3 # size of each sample # note: K<=M numbers = pd.DataFrame(columns=['A', 'B', 'C']

浏览 8提问于2022-04-16得票数 0

回答已采纳

2回答

Pandas Dataframe线条图:显示随机标记

python、pandas、matplotlib

我经常有带有许多观察点的数据帧，并希望使用线形图快速浏览一下数据。问题是，色彩映射表的颜色要么在X个观察值上重复，要么很难区分，例如在顺序色彩映射表的情况下。所以我的想法是向线条图添加随机标记，这就是我被卡住的地方。下面是一个带有一种markerstyle的示例： # -*- coding: utf-8 -*- import pandas as pd import numpy as np import matplotlib.pyplot as plt # dataframe with random data df = pd.DataFrame(np.random.rand(10, 8)

浏览 4提问于2016-08-31得票数 5

回答已采纳

1回答

根据用户输入的列和行填充随机数的Dataframe

python、pandas、dataframe

创建一个程序，该程序具有一个函数，该函数接受两个整数参数并打印Pandas数据帧。这两个参数将分别对应于行数和列数。数据帧应填充0到100之间的随机整数。将随机种子设置为56。这就是我到目前为止所得到的： import random import pandas as pd data1 = random.seed(56) arg1 = int(input('a number1:')) arg2 = int(input('a number2:')) df = pd.DataFrame(data1, arg1, arg2) print(df) 它打印

浏览 44提问于2021-02-09得票数 0

回答已采纳

1回答

Pandas Dataframe中的空白列

python、pandas、dataframe

当转换为Pandas DataFrame时，如何忽略行中的最后一个空格？我有一个CSV文件，格式如下： Column #1 : Type Column #2 : Total Length Column #3 : Found Column #4 : Grand Total 1;2;1;7.00; 2;32;2;0.76; 3;4;6;6.00; 4;1;5;4.00; 我循环遍历'Column #‘行，先创建我的列名(so 4列)，然后解析下面的行来使用';’作为分隔符来创建我的DataFrame。但是，我的一些文件在每一行的末尾都包含一个“；”，如上面所示，

浏览 2提问于2015-07-07得票数 3

回答已采纳

2回答

两个dfs之间的减法得到NaN值

python、pandas、numpy

我有一个17520行1,000列的numpy.ndarray。np.ndarray只有两个值[0,0.05]。我想修改值为0.05的单元格，以便在0和0.05之间随机选择。为了做到这一点，我使用了post Random choice over specific values of a DF推荐的以下函数 import pandas as pd df = pd.DataFrame(df) df.update(np.random.choice([0, 0.05], size=df.shape), filter_func=lambda x: x==0.05) 这个解决方案起作用了，但是，我

浏览 21提问于2019-02-19得票数 0

回答已采纳

2回答

如何寻找大熊猫数据数组最大值的索引

python-3.x、pandas、dataframe、max

把一只dataFrame解析成熊猫。用户可以使用DataFrame.idxmax获得最大值的索引(列)名称，但是，如果行中的所有值都为零(或相等值)，则索引默认返回第一列。因此，如何为筛选所有为零的或所有相等的值，以便不返回列名。我正在使用pandas.DataFrame.idxmax帮助文件。但是，没有筛选器选项。我相信熊猫可以使用loc[df['something']==value]过滤，但我不知道如何达到最大值。 import pandas as pd myArr = {'column0':[1, 1, 0, 1, 1], 'col

浏览 3提问于2019-08-13得票数 0

2回答

如何创建具有指定行数和列数的pandas DataFrame

python、pandas

我是pandas概念的新手，有没有可能创建一个行大小为1，列长度为8的DataFrame。我试过了： import pandas as pd df = pd.DataFrame({'Data':[]}) 但这只创建了一行和一列。

浏览 0提问于2018-11-01得票数 1

9回答

scikit-learn错误:y中填充最少的类只有1个成员

python、scikit-learn、train-test-split

我试图通过使用来自scikit learn的函数将我的数据集分割为训练集和测试集，但我得到了这个错误： In [1]: y.iloc[:,0].value_counts() Out[1]: M2 38 M1 35 M4 29 M5 15 M0 15 M3 15 In [2]: xtrain, xtest, ytrain, ytest = train_test_split(X, y, test_size=1/3, random_state=85, stratify=y) Out[2]: Traceback (most recent call last):

浏览 0提问于2017-04-03得票数 10

3回答

Python/Pandas -将一个熊猫DataFrame划分为10个不相交的、大小相等的子集

python、python-2.7、pandas、dataframe、partitioning

我想把一个熊猫DataFrame分成10个不相交的、大小相等的、随机组合的子集。我知道我可以随机抽取原始熊猫DataFrame的十分之一，使用： partition_1 = pandas.DataFrame.sample(frac=(1/10)) 但是，如何获取其他9个分区？如果我再做一次pandas.DataFrame.sample(frac=(1/10))，我的子集可能不是不相交的。谢谢你的帮助！

浏览 2提问于2016-07-25得票数 6

2回答

获取pandas数据帧中的最大值

python-3.x、pandas、dataframe、time-series

我想要在Pandas Dataframe中创建一个新列，其中包含到此时间点为止的另一列的最大值。例如： time | value | max value 1 2 2 2 4 4 3 3 4 4 3 4 5 6 6 有人知道如何为“最大值”列创建代码吗？谢谢

浏览 6提问于2018-08-10得票数 0

2回答

创建名称中有句点的Pandas系列

python、pandas

我运行了下面的Python代码，它用两个系列(a和b)创建了一个Pandas a，然后尝试创建两个新系列(c和d)： import pandas as pd df = pd.DataFrame({'a':[1, 2, 3], 'b':[4, 5, 6]}) df['c'] = df.a + df.b df.d = df.a + df.b 我的理解是，如果Pandas是DataFrame的一部分，并且该系列名称没有任何空格(并且不与现有的属性或方法发生冲突)，则可以作为DataFrame的一个属性访问该系列。因此，我希望第3行能够工作(因为您就是这

浏览 5提问于2016-03-07得票数 5

回答已采纳