如何从熊猫DataFrame中选择随机行序列？_从DataFrame Pandas中随机选择行_从具有权重的熊猫DataFrame中随机选择一行 - 腾讯云开发者社区

python、pandas、dataframe

我有一个具有随机的、未排序的行索引的DataFrame，这是从原始DataFrame中删除一些“噪声”的结果。 row_index col1 col2 2 1 2 19 3 4 432 4 1 我想在这个数据帧中添加一些pd.Series。该系列具有从0到行的n=number排序的索引。行数等于DataFrame中的行数在尝试了多种方法将该系列添加到我的DataFrame之后，我意识到来自该系列的数据变得混乱了，因为(我相信) Python正在通过索引匹配记录。有没有一种方法可以将Series添加到Dat

浏览 18提问于2019-06-22得票数 1

回答已采纳

1回答

我如何从熊猫DataFrame的一个子集中取样？

python、pandas

如何从第0行和长度- 100之间的pandas DataFrame中选择随机行？类似于start_state = self.market_data.sample(1)的东西，除了从任何行(即使是最后的100行)中选择。

浏览 0提问于2019-03-30得票数 1

回答已采纳

1回答

以动态的方式从随机生成的数据中获取随机样本(而不是硬编码)

python、dataframe、random

我编写了一些代码，这些代码将生成随机生成的索引(500行)的数据。但是，任务是只从最后50行(从随机生成的dataframe)中获得5行随机选择的行。我已经成功地选择了5行，但问题是它们并不是根据需要具体地从dataframe的最后50个索引中选择出来的。另外，你不能使用硬编码。我尝试了以下代码，它应该只从dataframe的最后50行中选择5行： def randomly_generated_dataframe(self, df1, select=5, start_range=50, end_range=1): selected_indices = np.random.random

浏览 0提问于2019-07-20得票数 0

回答已采纳

1回答

大熊猫随机数据对的选择

python、pandas

我有一个很大的文件，有三列。前两个是整数，第三个是字符串。我在用熊猫的时候读到 data = pd.read_csv("edges+stuff.txt", sep=' ', header=None, dtype={0:np.uint32, 1:np.uint32, 2:np.str}) 下面是一些假数据示例： 2 0 Somestuff9 2 0 Somestuff0 1 1 Somestuff5 0 0 Somestuff7 2 0 Somestuff9 2 0 Somestuff5 2 1 Somestuff2 1 1 Somestuff8 1 1 Some

浏览 4提问于2016-08-04得票数 0

回答已采纳

3回答

使用熊猫数据作为查找表

python、pandas、dataframe

给定来自dataframe X的单个行，从dataframe Y检索与查询行完全匹配的所有行的最有效方法是什么？示例:从 [ [0,1,0,1, 1.0], [0,1,0,1, 2.0], [0,1,0,0, 3.0], [1,1,0,0, 0.5], ] 应该回来 [ [0,1,0,1, 1.0], [0,1,0,1, 2.0], ] 假定X和Y具有相同的架构，但Y有一个附加的目标值列。可能有1，0，或多个匹配。即使有数千列，解决方案也应该是有效的。

浏览 0提问于2018-04-24得票数 3

回答已采纳

3回答

从具有权重的熊猫DataFrame中随机选择一行

python、python-3.x、pandas

我尝试根据提供的权重从pandas DataFrame中随机选择一行。我尝试使用带有这些参数的.sample()方法，但语法无法正常工作： import pandas as pd df = pd.DataFrame({ 'label': [1,0,1,-1], 'ind': [2,3,6,8], }) df.sample(n=1, weights=[0.5, 0.4, 0.1], axis=0) 标签是1,0和-1，我想为每个标签分配不同的权重，以便随机选择。

浏览 21提问于2020-07-21得票数 1

回答已采纳

1回答

大熊猫随机数据选择

python、pandas、database、dataframe、numpy

我是潘达斯的初学者。我有一个包含10000种不同用户信息的数据文件。此数据包含5列和10000行。其中一个列是用户所在的区域，它根据用户的居住位置对用户进行划分(它只定义了7个不同的位置，每个位置都有一些用户居住)。例如，在这10000名用户中，有300个用户生活在美国，250个用户生活在加拿大。我想要定义一个DataFrame，它包括五个随机行的用户，分别是:美国、加拿大、洛杉矶、纽约和日本。另外，尺寸需要20*5，你能帮我怎么做吗？我知道我需要用随机的方法 s = df.sample(n=5) 但是，如何定义从具有这些位置的用户中选择5个随机信息并定义维度呢？

浏览 1提问于2022-04-30得票数 0

回答已采纳

2回答

TypeError:无法理解的类型：“切片”熊猫DataFrame栏

python、pandas、dataframe、indexing、series

这可能很简单，但我找不到解释，而且一直发生在我身上。我正在尝试从列Rate1E中选择3.5上的值，并查看熊猫DataFrame energy中符合上述标准的其余行。我以前有个人给了我一个答案，然后简单地改为文字如下： energy = energy.loc[energy[:, 'Rate1E'] >= 3.5] print(energy.loc[:, 'Rate1E']) 然而，我再次发现自己犯了错误： TypeError: unhashable type: 'slice' 在线解决方案表明，.loc是答案。会不会有人知道如何修复代码，或

浏览 0提问于2018-11-14得票数 3

回答已采纳

2回答

如何对查询结果进行随机排序&选择随机行。(MySQL)

php、mysql、random

请注意，我是一个初学者。我有两个问题： 1)如何对查询结果随机排序？查询示例： $get_questions = mysql_query("SELECT * FROM item_bank_tb WHERE item_type=1 OR item_type=3 OR item_type=4"); 2)从表中随机选择行的最佳方法。假设我想从一个表中随机抓取10行。非常感谢，

浏览 2提问于2011-04-08得票数 2

回答已采纳

1回答

熊猫0.22 dataframe.drop比它应该多的行

python、pandas、dataframe

从两个文件中加载两个数据文件(testdf和datadf)，然后使用到目前为止，df = pd.concat([testdf,datadf])生产的df.shape为(48842,15)。现在我需要80%的训练，10%的测试，10%的验证。 trndf = df.sample(frac=0.8)返回的形状(39074,15)是正确的。 tmpdf = df.drop(trndf.index)现在的想法是从dataframe中删除这39074行数据，总共应该留下9768行。然而，tmpdf dataframe形状是(4514,15)，丢失5254行。 df使用默认索引，其编号从0到48841

浏览 0提问于2018-02-10得票数 3

回答已采纳

1回答

大熊猫按指数划分DataFrame

python、pandas、dataframe

我一直在研究熊猫DataFrame， df = pd.DataFrame({'col':[-0.217514, -0.217834, 0.844116, 0.800125, 0.824554]}, index=[49082, 49083, 49853, 49854, 49855]) 我得到的数据如下：如您所见，索引突然跳过770个值(由于我之前进行的排序)。现在，我想将这个DataFrame分解成许多不同的行，其中每个行将由索引只彼此跟随的行组成(在这里，前2行将位于相同的DataFrame中，而最后3行将位于不同的DataFrame中)。有人知道怎么做吗？谢

浏览 3提问于2022-01-12得票数 0

2回答

随机组合熊猫群对象

python、pandas

问题：如何使用熊猫df.groupby()功能创建随机选择的组群？示例：我想将数据随机分组为n大小的随机组，其中n对应于给定列中唯一值的数目。我有一个包含各种列(包括"id“)的dataframe。一些行具有唯一的id，而另一些行可能具有相同的id。例如： c1 id c2 0 a 1 4 1 b 2 6 2 c 2 2 3 d 5 7 4 y 9 3 实际上，这个数据文件最多可以有1000行。我希望能够使用以下标准对此数据进行分组：每个组最多应该包含n个唯一的id。任何id都不应出现在多个组中。应随机选择给定

浏览 2提问于2016-03-28得票数 0

回答已采纳

1回答

按给定行指数计算的熊猫群DataFrame

python、pandas

假设我们有一只熊猫，DataFrame，df，并以某种方式计算了这个DataFrame指数的子样本，我们给这个子样本命名为idx。现在，我希望通过使用df对idx进行分组，即第一个组包含从0到idx[0] (独占)的每一行，从idx[1] (包含)到idx[2] (独占)的下一个组，直到最后一个包含从idx[len(idx)-1]到最后一行的所有行的组。预期输出的结构类似于使用具有固定时间间隔的groupby实现的输出，但不是按照固定的时间间隔将行拆分，而是根据idx拆分行。有什么土生土长的熊猫能做到吗？或者我需要自己迭代df并将其存储到一个新的DataFrame中？出于测试目的，您可以

浏览 0提问于2019-07-13得票数 0

回答已采纳

1回答

需要一种从现有的Dataframe中创建熊猫数据的方法

python、python-3.x、pandas、dataframe

我有一个Dataframe，我从csv文件中获得了 df = pd.read_csv('data.csv') 我想选择这个Dataframe的一些行并创建一个新的Dataframe，但是选择这些行的逻辑很复杂，需要在函数中。此筛选器逻辑仅使用来自该行的数据，而不使用来自Dataframe中任何其他行的数据。那么，如何使用这个过滤器函数来创建一个新的Dataframe，从而从这个Dataframe中选择行呢？

浏览 2提问于2021-12-22得票数 0

1回答

如何使用从列表中随机抽取的方式重新映射熊猫列中的值？

python、pandas、dataframe、dictionary、random

上下文我有一个dataframe，需要将一个列重新映射到不同的值。对于某些值，映射是模棱两可的，每次遇到要映射的值时，都应该从列表中随机选择结果值。例如，应以下列方式对列中的值进行映射： 1➝'a'2➝'b‘或'c'，随机选择3➝'d' 如果有两个带有2的行，那么每次都应该进行随机抽签，以确定值应该映射到b还是c。示例数据以下是一些示例数据： import pandas as pd df = pd.DataFrame({"col1": [1, 2, 3, 4, 5, 6, 7, 8], "col2"

浏览 3提问于2021-10-14得票数 2

回答已采纳

2回答

如何与熊猫DataFrame的数据保持在一起？

python-3.x、pandas

假设我有一个像这样的熊猫DataFrame： CustomerId Product 1 Apple 2 Orange 3 Apple 4 Watermelon ... ... 1000 Apple 假设我在产品栏中有500个苹果。我想继续使用一个DataFrame，它包含500个苹果中的10% (以及其他类别的100%，也就是说，我想要一个有550行的DataFrame )。有办法有效地做到这一点吗？剩下的10%的苹果能随机选择吗？

浏览 0提问于2019-03-16得票数 0

回答已采纳

2回答

熊猫:选择字典中包含特定键的行

python、pandas、dictionary、dataframe

我有一个dataframe，其中一个列都是字典。我想选择字典中包含给定键的行。 >>> df = pd.DataFrame({"A": [1,2,3], "B": [{"a":1}, {"b":2}, {"c":3}]}) >>> df A B 0 1 {'a': 1} 1 2 {'b': 2} 2 3 {'c': 3} >>> df['b' in df['

浏览 0提问于2018-02-27得票数 4

回答已采纳

1回答

熊猫数据--合并的一个特殊案例

python、pandas、dataframe

如何将dataframe1的行合并到dataframe2中？如果其中一个对应的值是NaN，则应该从另一个值中复制该值。如果两者都是NaN，那么NaN。如果没有一个是NaN，那么第一个。 Dataframe1 Dataframe2 提前感谢

浏览 2提问于2017-06-04得票数 1

回答已采纳

1回答

根据现有列值从熊猫数据中随机选择行子集

python、pandas、dataframe、random、sample

我有一个包含多个列的dataframe，并且希望根据特定列的值随机选择相同数量的行。我想用df.groupby‘.’但这不起作用。下面是一个示例：假设我想随机选择每一个GroupID中的一行，我如何做到这一点？例如，假设我为每个GroupID选择一个随机行，结果将得到以下结果：以便根据GroupID中的值输出单个行。例如，假设行按GroupID排序(从asc到desc)，然后从与GroupID 1、2、3等相关的行中选择"n“行数。任何信息都是有帮助的。另外，如果我需要为每个GroupID选择特定的行数(假设GroupID=100为1行，GroupID=200

浏览 8提问于2022-04-13得票数 1

回答已采纳

2回答

如何随机选择一些熊猫数据行？

python、python-3.x、pandas

我有一个熊猫数据中心( dataframe df )，其中包含一个列amount。对于许多行，amount为零。我想随机删除amount为零的行的50%，保留amount为非零的所有行。我该怎么做？

浏览 3提问于2017-01-30得票数 3

回答已采纳

1回答

根据某个条件从pandas系列中随机删除元素

python、pandas

我有一个熊猫系列，有大约1.5亿个浮动元素。我尝试随机删除值位于特定范围(例如，-0.1和0.1之间)之间的所有元素的50%。通常我会(1)从序列中创建一个dataframe；(2)添加一个带有随机数的列；(3)删除那些满足第一个条件(介于-0.1和0.1之间)且其随机数位于较低20%的行。然而，这样做会使我的电脑内存饱和，而且不会起作用，所以我试图找到一种方法，直接从系列中完成，而不需要太多的操作。例如，我有这样的东西(但在现实中要大得多)： 0 0.05 1 -0.05 2 0.03 3 0.12

浏览 12提问于2020-07-06得票数 0

回答已采纳

1回答

如何为熊猫数据帧中的每一组选择n行随机序列？

python、pandas、random

假设我有以下数据框架： raw_data = { 'subject_id': ['1', '1', '1', '1', '2','2','2','2','2'], 'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Brian','Bob','Bill

浏览 2提问于2022-09-26得票数 1

回答已采纳

2回答

熊猫--用其他行随机替换10%的行。

python、pandas

我希望随机选择df中所有行的10%，并将每一行替换为从df中随机抽样的现有行。要随机选择10%的行，rows_to_change = df.sample(frac=0.1)可以工作，我可以使用replacement_sample = df.sample(n=1)获得一个新的随机行，但是如何将它们放在一起以快速遍历整个10%的行呢？ df包含数百万行x ~100 cols。示例df： df = pd.DataFrame({'A':[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15],'B':[1,2,3,4,5,6,7,8,9,10,11

浏览 0提问于2018-04-23得票数 1

回答已采纳

2回答

python -熊猫数据处理

python、pandas

所以我带着另一个关于蟒蛇和熊猫的问题回来了。我有带有以下专栏的table1： ID;COUNT;FOREIGN_ID;OTHER_DATA 1;3;xyz1 2;1;xyz2 3;1;xyz3 table2 ID;FOREIGN_ID;OTHER_DATA 1;xyz1;000001 2;xyz1;000002 3;xyz1;000003 4;xyz1;000004 5;xyz1;000005 6;xyz2;000000 7;xyz2;000000 8;xyz3;000000 9;xyz3;000000 两个表都存储为CSV文件。我将它们加载到dataframe中，然后遍历TABLE1。我必须

浏览 1提问于2018-05-24得票数 0

回答已采纳

3回答

熊猫数据-选择相似的行

python、pandas、dataframe

是否有办法选择“相似”的行(而不是重复的！)在熊猫的资料里？我有一个dataframe，其中包括'school_name'和'district'。我想知道在不同的地区是否有类似的名称的学校。我所能想到的就是选择一个随机的学校名称，并手动检查dataframe中是否存在类似的名称，方法如下： df[df['school_name'].str.contains('english grammar')] 有没有更有效的方法来做到这一点？编辑:我最终要使用字符串将这个特定的数据文件与另一个dataframe匹配，在school_n

浏览 3提问于2020-08-12得票数 0

2回答

过滤大熊猫DataFrame

python、pandas

如果我有以下DataFrame： Name Total Category A 150 c1 A 92 c2 A 13 c9 A 4 c8 B 100 c8 B 12 c7 B 10 c5 C 410 c2 C 222 c1 C 33 c4 C

浏览 2提问于2016-11-06得票数 2

回答已采纳

1回答

如何筛选熊猫DataFrame的前15%的每行？

python、pandas

我有一个熊猫DataFrame，看起来像这样 | | Category | Value | |---:|:-----------|--------:| | 0 | Apple | 0.25 | | 1 | Apple | 0.12 | | 2 | Apple | 0.05 | | 3 | Orange | 0.7 | | 4 | Pear | 0.3 | | 5 | Pear | 0.15 | 现在，我只想保留此DataFrame中满足特定百分比的那些行。这意味着，

浏览 59提问于2020-04-13得票数 1

2回答

使用Python熊猫dataframe列作为通过另一列循环的输入

python、pandas、dataframe、loops

我有两个数据。其中一个看起来是： Year Count 1 3 2 2 3 1 4 5 5 4 另一个看上去像 ID Value 1 100 2 50 3 0 4 25 5 50 我希望在第一个数据中使用计数来循环第二个数据。我希望使用每行中的计数值，从第二个dataframe N倍中的value列中随机选择，其中N是count列中的值，然后将这些值相加，从而在第一个dataframe中生成一个新列： Year Count RandSum 1 3 200 2

浏览 7提问于2022-06-10得票数 1

回答已采纳

2回答

熊猫

python、pandas

我希望能够从dataframe (orig)中删除与派生数据remove (filtered)中包含NaN值的行对应的行。问题是，派生的dataframe有一个已删除的列，该列会导致每一行被删除。要修改这一点，我必须重新插入删除的列。是否有比重新插入从filtered中删除的列更优雅的方法来实现所需的结果？ >>> orig = pd.DataFrame([ [1, 1.0, 'one'], [2, 2.0, 'two'],

浏览 1提问于2018-06-10得票数 2

回答已采纳

1回答

来自列、DataFrame、熊猫的随机值组合

python、pandas

我在熊猫里有下一个DataFrame： A B 1 23 43 446 197 5 99 12 .... 我想要的是另一个DataFrame，它具有相同的A和B列以及随机元素(0 < A_i < A_max，0 < B_i < B_max)，其中A和B元素在某些行中的每个唯一组合在第一个DataFrame中都不存在。

浏览 0提问于2018-06-07得票数 0

回答已采纳

1回答

熊猫DataFrame理解

python、pandas、dataframe、list-comprehension

问题:在DataFrame中添加一个新列，并在类似于列表理解的一行代码中填充来自另一个DataFrame的列的值，这取决于一个条件。示例代码：我用一些瞳孔信息创建了一个名为df的DataFrame。 data = {'name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'year': [2012, 2012, 2013, 2014, 2014], 'reports': [4, 24

浏览 2提问于2019-04-23得票数 1

回答已采纳

1回答

从熊猫数据随机丢弃n组

python、pandas、random、drop

我有一个15466行×125列的数据格式。列"Subject ID“(15466行)包含400个唯一ID，每个ID大约出现40次。我想从我的数据中随机删除10个主题(cca 400行)。到目前为止，我尝试过这个： trial = df.groupby(['Subject_ID']).apply(lambda x: x.sample(10)) 但是我意识到这个函数从每个Subject_ID中随机抽取10行，而不是10个gropups/Subject的

浏览 4提问于2020-05-14得票数 1

回答已采纳

1回答

熊猫数据循环

python、pandas、dataframe

我被下面的代码卡住了。基本上，我正在循环使用循环变量'analyticalname‘和'fedbatchname’的第一列的2个数据格式。如果这两个变量在每个dataframe中找到匹配项，那么我希望根据循环变量的值访问dataframe的元素。但是，当我运行代码时，我会得到一个键错误，它起源于if语句后面的行。本质上，我问的是如何访问基于循环变量的dataframe元素。有什么建议吗？ import pandas as pd analyticaldata = pd.read_csv('SE-HPLC.csv', usecols = ['Sample I

浏览 2提问于2018-10-15得票数 1

回答已采纳

1回答

从while循环返回熊猫数据

python、pandas、while-loop

我有一个while循环，它从一个列表中随机返回三个项。然后再次执行相同的操作，直到列表为空。我想收集这16排熊猫的资料。 from random import randint colors = ['Pink', 'Purple', 'Green', 'Skyblue', 'Blue', 'Grey'] * 8 while colors: lst = [colors.pop(randint(0, len(colors) - 1)) for _ in range(3)] print(

浏览 3提问于2021-01-17得票数 0

回答已采纳

1回答

最好的方法来隐藏熊猫的数据？

python、pandas、dataframe

昨天，我学到了一种艰难的方法，把熊猫的数据保存到csv上供以后使用是个坏主意。我有一个+- 130 k tweet的数据格式，其中一行的dataframe是一个tweet列表。当我将数据保存到CSV，然后重新加载dataframe时，数据文件的行现在是String类型。这会导致各种各样的错误和大量的调试。当然，假设CSV能够保存关于我的数据的数据结构类型的信息是一个愚蠢的错误。我现在的问题是:如何保存数据，以便以后使用，以保存有关列/行的数据类型的信息。

浏览 3提问于2019-11-25得票数 3

回答已采纳

2回答

如何连接熊猫数据帧中行的列值？

python、pandas、dataframe、concatenation

我正在尝试创建一个新列，该列的值是从dataframe的每一行中的其他列中串联的：以下是我目前的尝试 dataFrame['images/0'] = 'https://img.ssensemedia.com/images/b_white,g_center,f_auto,q_auto:best/' + str(dataFrame['sku']) + '_' + '0' + dataFrame['name'] 但这也是在创建一个列，其中包含来自所有其他行的值。如何从行的其他值为每一行创建新列？我哪儿也

浏览 3提问于2022-09-02得票数 0

回答已采纳

5回答

Pandas:从每行的随机列中选择值

python、pandas、dataframe、random

假设我有如下的Pandas DataFrame： df = pd.DataFrame({ 'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9] }) a b c 0 1 4 7 1 2 5 8 2 3 6 9 我希望生成一个新的pandas.Series，以便从DataFrame的随机列中逐行选择该序列的值。因此，可能的输出是序列： 0 7 1 2 2 9 dtype: int64 (在第0行中随机选择'

浏览 45提问于2019-07-25得票数 4

回答已采纳

1回答

如何根据条件删除熊猫DataFrame中的多行？

python、pandas、dataframe

我知道如何使用.drop()方法通过传递轴和标签从数据中删除行和列。这是Dataframe 现在，如果我想删除STNAME等于from (Arizona一直到Colorado)的所有行，我应该如何做呢？我知道我可以通过将行标签2到7传递给.drop()方法来做到这一点，但是如果我有大量的数据，并且不知道开始和结束索引，这是不可能的。

浏览 3提问于2020-05-06得票数 0

1回答

如何根据给定条件删除**行大熊猫/蟒蛇

python、pandas、dataframe

我正在使用Pandas中的dataset，我希望根据给定的条件删除一些行。我的数据集中有一个列，它是一个参与者的共混数，可能的值是0，1，2，3。数据集大约有100万行(和其他30列)，大约500 k参与者=0，大约300 K参与者=1共度，大约130 K参与者=2 comorbidities，大约75k参与者=3 comorbidities。我想随机删除一组参与者，根据他们的共生值，例如，下降200 k与0共患，100 k与1共病。我知道如果想要删除给定数目的所有参与者，例如所有有0的参与者，我可以这样做： dataframe = allpart，列名= CM allpart.drop(al

浏览 1提问于2021-02-15得票数 2

回答已采纳

2回答

熊猫应用语法

python、pandas

我不知道如何将一个简单的函数应用到Panda数据框架中列的每一行。示例： def delLastThree(x): x = x.strip() x = x[:-3] return x arr = ['test123','test234','test453'] arrDF = pandas.DataFrame(arr) arrDF.columns = ['colOne'] arrDF['colOne'].apply(delLastThree) print arrDF 我希望下面的代码为每一

浏览 0提问于2016-06-17得票数 0

回答已采纳

1回答

与切片和聚合表相关的基本熊猫问题

python、pandas

我正在熟悉Pandas，我想通过几个简单的例子来学习逻辑。假设我有以下熊猫DataFrame对象： import pandas as pd d = {'year':pd.Series([2014,2014,2014,2014], index=['a','b','c','d']), 'dico':pd.Series(['A','A','A','B'], index=['a','b','c

浏览 1提问于2015-02-11得票数 1

回答已采纳

2回答

熊猫不填充系列的值

python、pandas

我试图用来自另一个DataFrame列的值来填充DataFrame列中缺少的值。下面是设置： import numpy as np import pandas as pd df = pd.DataFrame({ 'a': [2, 3, 5, np.nan, np.nan], 'b': [10, 11, 13, 14, 15] }) df2 = pd.DataFrame({ 'x': [1] }) 当然，我可以这样做，而且效果很好： df['a'] = df['a'].fillna(1)

浏览 1提问于2018-03-08得票数 1

回答已采纳

2回答

在R中，如何在随机行集中更改特定列的值？

r、dataframe、subset

我一直在阅读另一个关于如何随机地对数据行进行子集的问题，但我很难弄清楚如何将dataframe中的特定列的值更改为行的随机子集。来自： df = data.frame(matrix(rnorm(20), nrow=10)) df[sample(nrow(df), 3), ] 例如，如何用0替换随机选择的X1列行？谢谢!

浏览 6提问于2017-03-15得票数 0

回答已采纳

3回答

您是否可以对Pandas数据进行示例，并修改原始数据以删除采样的行？

python、pandas、dataframe、random

我要求的可能不是计算效率/价格低廉。本质上，我想要做的是随机从我的熊猫dataframe中选择一行，然后修改原始的DataFrame，使该行基本上是从数据中“弹出”的。到目前为止，我尝试的是接受DataFrame的转置，然后在我想要删除的“列”上应用pop()。列的索引是由随机数选择的。 import pandas as pd from random import randrange df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]), columns=['a',

浏览 10提问于2022-04-21得票数 1

2回答

带有嵌套列表到熊猫DataFrame的键

python、python-3.x、pandas、dictionary、concatenation

我有一本字典如下： D = { 'd1': [[a1, a1, a1], [a2, a2, a2], [a3, a3, a3]], 'd2': [[b1, b1, b1], [b2, b2, b2], [b3, b3, b3]], 'd3': [[c1, c1, c1], [c2, c2, c2], [c3, c3, c3]], 'd4': [[d1, d1, d1], [d2, d2, d2], [d3, d3, d3]] } 如何将其转换为数据格式，以便键列表中的列是配对的；嵌套的列

浏览 1提问于2018-09-26得票数 1

回答已采纳

3回答

如何向熊猫DataFrame中的元素添加随机生成的数字

python、pandas、numpy

我试图从熊猫DataFrame (Python)中现有的元素(浮点数)中添加/减去一个随机数。 indices是一个随机子集索引，modify_columns是我希望修改的列的列表。我的DataFrame如下(active_set.loc[indices,modify_columns])： Values 380977 0.0 683042 0.0 234012 0.0 16517 0.0 ... ... 我想从这些值中添加或减去随机生成的整数( -1或1)。我尝试使用(2*np.random.randint(0,2,size=(count))-1)生成这些随机数的数组，并添

浏览 8提问于2020-11-27得票数 1

回答已采纳

1回答

将NumPy数组与熊猫DataFrame连接(连接)

python、pandas、numpy、dataframe

我有一个熊猫数据，有10行，5列和一个0，np.zeros((10,3))的数字矩阵。我想将numpy矩阵连接到熊猫的dataframe，但是在将numpy数组连接到它之前，我想从熊猫的dataframe中删除最后一列。最后，我将得到一个矩阵，它由10行和5-1+3=7列组成。我想我可以 new_dataframe = pd.concat([ original_dataframe, pd.DataFrame(np.zeros((10, 3)), dtype=np.int) ], axis=1, ignore_index=True) 其中original_dataframe

浏览 2提问于2016-09-26得票数 21

2回答

在熊猫DataFrame中高效地查找匹配行(基于内容)

python、pandas、dataframe

我正在编写一些测试，我正在使用Pandas DataFrames来存放一个大型数据集~(60万x 10)。我从源数据(使用Stata)中提取了10个随机行，现在我想编写一个测试，看看这些行是否在我的测试套件中的DataFrame中。作为一个小例子 np.random.seed(2) raw_data = pd.DataFrame(np.random.rand(5,3), columns=['one', 'two', 'three']) random_sample = raw_data.ix[1] 这里的raw_data是： rando

浏览 2提问于2014-07-30得票数 1

回答已采纳

2回答

将伪算法转换为python ->大熊猫代码

python、pandas、dataframe

我正在尝试把伪代码转换成熊猫代码。希望得到任何帮助或指导。总体思路是提出一个函数f，从一个玩具示例数据集中选择行，其中->有100行，5列["X", "Y", "Z", "F", "V"]随机填充0,500之间的数字。除了数据之外，函数的第二个输入是它在选择中应该使用的列cols_to_use，默认情况是使用，它们都是。描述。目标是从示例数据集中选择10行。基于1、2、3、4、5列的函数->选择的第二个参数有5个概率。如果必须使用所有列，则每列选择2行。我们在每个列中选择与前两个值相对应的行。在初

浏览 5提问于2021-10-19得票数 5

3回答

熊猫，串联成DF行

python、pandas、concat、series

我试图向一个空的DataFrame添加一个系列，但在“医生”或其他问题中都找不到答案。因为您可以按行或按列追加两个DataFrames，所以似乎必须在一个系列中缺少一个“轴标记”。有人能解释一下为什么这不管用吗？ import Pandas as pd df1 = pd.DataFrame() s1 = pd.Series(['a',5,6]) df1 = pd.concat([df1,s1],axis = 1) #go run some process return s2, s3, sn ... s2 = pd.Series(['b',8,9]) df1 =

浏览 4提问于2014-01-08得票数 18