如何根据DataFrame1中与此DataFrame1行最相似的n行有效地计算DataFrame2中每一行的平均值？

根据DataFrame1中与每一行最相似的n行，可以使用以下步骤有效地计算DataFrame2中每一行的平均值：

首先，需要计算DataFrame1中每一行与其他行的相似度。可以使用相关性系数、欧氏距离或其他相似度度量方法来衡量行之间的相似度。这可以通过DataFrame1的特征向量表示实现。
接下来，对于DataFrame2中的每一行，找到与其最相似的n行。可以使用排序和切片操作来获取最相似的n行。
然后，从DataFrame2中提取这n行，并计算它们的平均值。可以使用DataFrame的mean()函数来计算平均值。
最后，将每一行的平均值添加到一个新的列中，以便于后续分析和处理。

以下是一个示例代码，演示如何根据DataFrame1中与此DataFrame1行最相似的n行有效地计算DataFrame2中每一行的平均值：

import pandas as pd
import numpy as np

# 假设DataFrame1和DataFrame2已经定义和填充好了

# 计算DataFrame1中每一行与其他行的相似度
similarity_matrix = DataFrame1.corr()  # 使用相关性系数作为相似度度量

# 定义函数，根据相似度矩阵获取最相似的n行
def get_most_similar_rows(row_index, n):
    row_similarity = similarity_matrix.iloc[row_index]  # 获取与指定行的相似度
    most_similar_rows = row_similarity.sort_values(ascending=False)[1:n+1]  # 排序并获取最相似的n行
    return most_similar_rows.index

# 遍历DataFrame2中的每一行，计算平均值
for i, row in DataFrame2.iterrows():
    most_similar_rows = get_most_similar_rows(i, n)  # 获取最相似的n行
    similar_rows_data = DataFrame1.loc[most_similar_rows]  # 从DataFrame1中提取最相似的n行数据
    average_value = similar_rows_data.mean()  # 计算平均值
    DataFrame2.at[i, 'Average'] = average_value  # 将平均值添加到DataFrame2的新列中

# 打印结果
print(DataFrame2)

请注意，以上代码仅为示例，实际应用中可能需要根据具体情况进行调整和优化。另外，根据具体需求，可以选择不同的相似度度量方法和计算平均值的方式。

如何根据DataFrame1中与此DataFrame1行最相似的n行有效地计算DataFrame2中每一行的平均值？

、、

我有两个DataFrames (df1，df2)，每个都包含相同的列但不同的条目。首先，对于df1中的每一行，我根据某些值与df1行中相应列值的相似度，在df2中计算了一个“相似性分数”。然后，我计算df2中相似度得分最高的行的各种列平均值，并将这些平均值存

浏览 34提问于2021-09-04得票数 1

2回答

在两个dataframe之间选择一些值

我有两个数据序列，一个有100个基因的列，另一个有一个由700行组成的列，每一行都有几个用逗号分隔的基因，现在我不知道如何能够根据dataframe 1中的基因列来选择每一行dataframe 2中的基因换句话说，我希望在dataframe 1的基因列中每一行都有基因。<em

浏览 4提问于2021-06-28得票数 1

回答已采纳

3回答

熊猫数据获取行号并添加到列表中

、、

每一行代表一个客户，每一列代表该客户的一些特性。dataframe2 = df[(df['feature2'] > 500)] print(dataframe20

浏览 6提问于2017-09-15得票数 0

回答已采纳

1回答

将数据帧与电子表格隔离，以创建列表

、、

如何将R中的数据帧从大量的数据电子表格中分离出来，并从孤立的数据中创建一个列表？的所有数据为dataframe1，Group2 (第5至6行)中的数据为dataframe2，来自Group3 (第7至9行)的数据为dataframe3，等等。然后我列了一个清单： data.list <- list(dataframe1,<

浏览 0提问于2018-12-11得票数 0

回答已采纳

2回答

如何训练一个模型来预测两个样本是否指向相同的事物？

、、、

两者都具有相同的特性(相同的列名)，它们用文本或类别(变为数字)来表示特定的事物。假设一个ddbb中的每个样本都指向不同的特定事物。此标签是要学习的目标变量。然而，我看到的监督分类示例使用单个数据框架和/或预测某一行特性。当我们不是试图预测一个样本代表什么，而是两个样本之间的关系(特别是现在，如果它们引用同一个对象时)，它是如何工作的？我甚至不知道如何将

浏览 0提问于2021-02-26得票数 0

2回答

在MySQL中，是否有一种方法可以计算每一行的类似结果？

、

我有一个像这样的MySQL表jobs：1 | UI Designer | HTML, CSS, Photoshoptitle LIKE '%UI%' OR title LIKE '%Developer%' OR keywords LIKE '%HTML%' OR keywords LIKE '%CSS%' 我想用最相似的方法来分类结果例如，对于第一行(ID

浏览 1提问于2019-04-13得票数 1

回答已采纳

2回答

Matlab:构造极大的稀疏带矩阵，只需很少的内存和计算

、、、、

我需要构造一个N=570x720= 410400 (图像像素数量)的大型NxN稀疏带矩阵A。数学上，A(m，n) = C1 * exp(-|m-n|^2)；m= 1:N，n= 1:N 不幸的是，由于不必

浏览 2提问于2013-06-11得票数 3

回答已采纳

1回答

如何使用`numpy`将一列和一个矩阵组合成一个更大的矩阵？

、

我试图通过对每一行执行(X - means) / variance来规范化一个矩阵。因为我是用MapReduce实现的，所以我首先计算每一列的平均值和标准方差，然后用以下命令map每一行： matrix.map(lambda X: (X - means) / variance)但是我想忽略每一行X中的第一个元素，它是我的

浏览 1提问于2012-12-24得票数 1

5回答

在没有额外空间的N个排序数组中查找公共元素

、

给定大小为N的N个数组，并且它们都是排序的，如果它不允许您使用额外的空间，如何有效地或以较少的时间复杂度找到它们的公共数据？在这种情况下，我更倾向于使用最简单的解决方案，它给我带来了复杂性，即： pr

浏览 3提问于2013-02-23得票数 7

回答已采纳

3回答

在数据库中存储计算数据的不良做法？

、

将计算过的数据存储在每一行中是不好的做法，还是在应用层对数据库的每次读取进行计算更好。例如，我需要计算食物的每日总营养摄入量。因此，各种portions of energy of foods。我可以根

浏览 0提问于2018-04-01得票数 18

1回答

潘达斯数据集的年度平均数，但未从1月份开始

、、

在下面的dataframe中(小片段显示，实际的dataframe时间跨度从2000年到2014年)，我想计算年平均值，但从一年的9月开始，直到明年的5月。Min_TempS 2000 2 274.725S 2001 2 271.505N 2000 2 254.533

浏览 0提问于2015-09-13得票数 1

回答已采纳

1回答

Pandas GroupBy的绘图结果

、、、、

我开始学习潘达斯，并试图找到最毕达通(或熊猫？)完成某些任务的方法。列A包含布尔值:每行的A值为true或false。换句话说，如何根据A列的值进行分组(真或假)，然后在同一图上绘制B列的值？两个数据集的颜色应该不同，以便区分点。接下来，让我们向这个程序添加另一个特性:在绘图之前，我们希望为每一行计算另一个值，并将其存储在

浏览 0提问于2013-03-17得票数 39

回答已采纳

2回答

一段时间内每个日期具有多个值的滚动平均值

、

我正在尝试根据表格中的值计算表格每一行的滚动平均值，该表格基于向前和向后看特定天数的滑动时间窗口。我的问题在于平均值的计算。而不是直接计算所有值的平均值(预期结果) +------------+-------+---------------------------+ | Date | Value |

浏览 21提问于2020-10-29得票数 0

回答已采纳

2回答

在二部图中，量化成对、成三等重叠

、、、

我正在使用一个邻接矩阵来总结一个两部分图，这样行是图中的一组，列是第二组。如果行和列之间有一条边，则该值为1，如果没有，则为0。因此，我的矩阵如下所示A 0 1 0C 1 1 1我想量化1...S个选定行的行中重叠的分布。因此，例如，在上面的矩阵中，平均成对重叠将是( 0 +1/3+1/3)/3 = 2/9，三个成对重叠(必须有更好<

浏览 0提问于2012-02-28得票数 3

回答已采纳

3回答

嵌套循环在VBA中不正确循环--其中一个工作或另一个工作。

、、、

我有一个项目，我在做复杂的步骤。对于这个步骤，我试图让程序在一定数量的行(我使用For循环)中重复一定次数(我正在尝试使用Do直到循环)。行数比我希望程序循环的次数要大(大得多)。我尝试使用两个循环的原因是，我想搜索I范围中的每一行，寻找各种条件，但我只想更改前n个匹配数。因为我不知道匹配的位置或距离，所以我需要搜索完整的9000+范围。到目前为止，for循环可以

浏览 0提问于2018-07-16得票数 1

回答已采纳

3回答

如何有效地计算numpy 2D数组的块平均值(不规则块)？

、、、

1, 3, 4], [8, 6, 7, 1, 1, 3],现在，这个矩阵中的每一行现在我需要根据这个赋值拆分这个矩阵，并计算块(切片)的平均值。这将产生块均值的3x3矩阵。], [6.5 , 3.

浏览 1提问于2021-03-22得票数 1

4回答

获取SQL中每个X行的平均值

、

，所以我考虑了每一个X行的获取和平均值。我是否有办法这样做，即每2或4行，如下所示：+-----+------+| 3-4 | 6.0 || 7-8 | 4.5 |+-----+------+| 5-8 | 3.5 |另外，是否有任何方法根据我的表中的

浏览 3提问于2014-02-08得票数 3

回答已采纳

1回答

取一排数据的平均值

我是R，所以我知道这可能有一个简单的解决方案，但我想不出答案。我试图读取由空格分隔的数据。有5列1000行。我想取每一行的平均和中位数，然后根据平均值和中位数计算均方误差和偏差。我很难接受个别行的平均值，我也不知道我做错了什么。3.0032159e-01

浏览 6提问于2015-10-20得票数 0

回答已采纳

1回答

基于MATLAB的高效多类加权多数投票实现

、

有几天，我在想如何在matlab中有效地实现m个专家的加权多数投票。这是我想要的一个例子。假设我们有3个具有权重向量的专家假设他们对选项A/B/C/D投票n次，例如，我们得到以下n x m投票矩阵，其中列是每个专家的投票。A B BD B A现在我想计算每一行的加权多数票。我们通过添加投票给每个选项<e

浏览 1提问于2013-03-19得票数 4

回答已采纳

3回答

求平均输入值(以秒为单位)

、、

我希望找到控制器在最后n秒钟内的平均输入值(比如最后的0.1秒)，并完成每一帧的操作。我可以看到如何为过去的n个帧存储最后n个帧的值列表并对每个帧进行平均值，但是我想考虑一个可变的帧速率，因为结果的输出正在驱动一个字符控制器，并且应该感觉精确和一致。我试着存储一个包含每个帧的输入值和增量时间值的值对的列表，然后

浏览 0提问于2017-05-19得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何根据DataFrame1中与此DataFrame1行最相似的n行有效地计算DataFrame2中每一行的平均值？

相关·内容

如何根据DataFrame1中与此DataFrame1行最相似的n行有效地计算DataFrame2中每一行的平均值？

在两个dataframe之间选择一些值

熊猫数据获取行号并添加到列表中

将数据帧与电子表格隔离，以创建列表

如何训练一个模型来预测两个样本是否指向相同的事物？

在MySQL中，是否有一种方法可以计算每一行的类似结果？

Matlab:构造极大的稀疏带矩阵，只需很少的内存和计算

如何使用`numpy`将一列和一个矩阵组合成一个更大的矩阵？

在没有额外空间的N个排序数组中查找公共元素

在数据库中存储计算数据的不良做法？

潘达斯数据集的年度平均数，但未从1月份开始

Pandas GroupBy的绘图结果

一段时间内每个日期具有多个值的滚动平均值

在二部图中，量化成对、成三等重叠

嵌套循环在VBA中不正确循环--其中一个工作或另一个工作。

如何有效地计算numpy 2D数组的块平均值(不规则块)？

获取SQL中每个X行的平均值

取一排数据的平均值

基于MATLAB的高效多类加权多数投票实现

求平均输入值(以秒为单位)

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐