GroupBy，然后使用str.contains标准的均值/中值/模式 - 腾讯云开发者社区

python、pandas、dataframe、numpy

浏览 54提问于2021-08-15得票数 1

回答已采纳

1回答

如何根据Python中的某些条件从数据帧或过滤器中提取值？

python、pandas、dataframe、filter

我有一个从一些文件中提取了值的数据框。如何过滤或提取列1中值u之后的前两行数据。列1值的范围是80，我希望在值u之后捕获。值u可能是列0中新文件后的两个或三个文件，或者根本不存在，如下面的file3中所示。 0 1 2 3 0 file1 value u file1 value u 1 file1 value u file1 value u 2 file1 value 85 file1 th_v 5 3 file1 value 10 file1 th_v 2 4

浏览 13提问于2019-12-16得票数 0

回答已采纳

2回答

每年给定特定邮政编码的值列表(分数)的平均值、中位数和模式

python、dataframe、statistics、mean

我想找出每年的平均值、中值和模式值，给定一个特定的邮政编码--如何实现这一点，我已经从CSV文件中读取数据并将其转换为json文件，并将其定义为DataFrame --我的数据示例不局限于下表--它更大

浏览 3提问于2020-12-24得票数 0

回答已采纳

2回答

当熊猫在列中相同的时候，如何使用它们来重命名行？

python、pandas、dataframe

根据：我的数据是：当医院列中值相同的行在GeneralRepresentation列中有不同的值时，我想使用熊猫来重命名医院。如果医院列中值相同的行在GeneralRepresentation列中具有相同的值，则不会对医院进行重命名。对于没有GeneralRepresentation的医院，保持医院的名称不变。我想要的效果如下：当我在中使用Beny的代码时 g = df.groupby('Hospital')['GeneralRepresentation'] s1 = g.transform(lambda x :x.factorize(

浏览 15提问于2021-12-30得票数 0

回答已采纳

1回答

在数据帧中添加列的通用代码

python

我有两个数据帧。 dataframe1 = Product sample element2 element3 W100 XX1 40 10 W100 XX2 30 40 W100 XZ1 30 20 W100 XZ3 10 20 W100 AB2 20 30 W111 XZ1 15 10 W111 XZ2.1 25 3

浏览 10提问于2020-01-17得票数 1

回答已采纳

1回答

熊猫群行动

pandas、group-by

有特定的df： Start End N Count Avg 1 abc1 10 2 .5 1 abc2 10 2 .5 1 xyz1 10 2 .5 1 xyz2 10 2 .5 1 ijk1 10 2 .5 2 abc1 12 3 .4 2 xyz1 12 1 .1 2 xyz2 12 1 .4 2 ijk1 12 6 .5 2 ijk2 12

浏览 0提问于2018-03-26得票数 1

回答已采纳

1回答

尝试将numpy数组模式值传递给df列

python、pandas、numpy

我创建了一个小程序来查找df的两个特定列的均值、中值和模式值。我使用np.mean和np.median来查找平均值和中值，但是对于模式，我从df创建了一个numpy数组，并计算了该模式。我将它们打印到控制台，这些值似乎很好，但是我希望从numpy数组中获得模式值，它显示在我的df中，其中有四列表示“学生”、“分数”、“平均值”和“中值”。我想知道是否有一种方法可以获得模式值并附加到df的末尾，以便有第五列的标题为“mode”。下面是我的代码来看一看。我不想为此使用像like这样的库，这样如果有其他方法可以绕过它，我也不会使用稀疏。 def mean_median(): df = pd.

浏览 2提问于2021-01-07得票数 0

回答已采纳

3回答

列表中值的Groupby

pandas

我有一个很大的数据集，需要根据一个名为AoIs的列执行计算。例如，对于Name=="P_01"所在的所有点，我希望得到front在AoIs列中的所有持续时间的总和。然后，我想对side和concerns_form执行相同的操作。我按名称对df进行了分组，但我尝试的任何列表操作都失败了。下面是我正在使用的数据片段： Name AoIs duration 0 P_01 NaN 1704.0 1 P_01 NaN 1654.0 2 P_01

浏览 1提问于2019-01-05得票数 0

1回答

大熊猫数据在蟒蛇中聚集时，如何计算每一组动物尾部的和_

python、pandas、pandas-groupby、tail

我有像following.which是熊猫数据帧格式的数据。 A B C D E F G 1 1 2 3 1 4 2 1 1 2 4 5 6 7 1 1 2 3 2 3 2 1 1 2 4 5 6 7 2 1 2 3 2 3 4 2 1 2 3 4 3 3 2 1 2 4 5 6 7 这里agg_lvl='A'，'B'，'C‘ 当数据聚合到agg_lvl时，我想要使用尾部(2)记录来计算G变量的平均值。我的预期产出如下：平均预期产出： A B C G

浏览 0提问于2018-09-05得票数 3

回答已采纳

1回答

如何在熊猫单栏的多列上应用多个操作？

python、pandas、dataframe

我有一个样本数据，如下所示： primaryName averageRating primaryProfession knownForTitles runtimeMinutes 1 Fred Astaire 7.0 soundtrack,actor,miscellaneous tt0072308 165 2 Fred Astaire 6.9 soundtrack,actor,miscellaneous tt0031983

浏览 7提问于2022-08-17得票数 -2

回答已采纳

1回答

以其他列为条件在Dataframe中创建列

python、dataframe

我正在尝试创建一个新列，该列以另一列中的值为条件，取另一列中值的平均值。 pd.DataFrame({"A":[1, 2, 1, 2], "B":[4, 6, 8, 12] 我想要创建一个新的列'C‘，将是 pd.DataFrame({"A":[1, 2, 1, 2, 3], "B":[4, 6, 8, 12, 4], "C":[6,9,6,9,4]} 如果不清楚，当A列中的值相同时，我希望输出B列中值的平均值。因此，C= (4 +6+.)/n其中A == 1和C= (6

浏览 4提问于2017-10-20得票数 1

回答已采纳

2回答

如何使numpy数组切片元素区别开来？

numpy

我将处理一个numpy数组，并使它成为我想要的形式。下面是源数组： a = np.array([ [0, 1], [0, 2], [1, 1], [1, 2], [1, 3], [2, 1] ]) 结果数组类似于:第一列元素保持清晰，第二列元素是相关的第一列元素的平均值。详细解释:在0的第一列中有两个1、三个1和一个2元素。结果表明，ret的第一列没有重复元素0/1/2，ret的第二列元素在a中为0时获得[1, 2]的均值或中值，当索引在a中为1时获得[1,2,3]的均值或中值(忘记它们的类型)。注意，它不确定a的第一列还是第二列被视为索引序列。 ret = np

浏览 1提问于2019-04-04得票数 2

回答已采纳

3回答

根据一行的标签计算该行的平均值

pandas、pandas-groupby

根据其标签计算一行中值的平均值： A = [1,2,3,4,5,6,7,8,9,10] B = [0,0,0,0,0,1,1,1,1, 1] Result = pd.DataFrame(data=[A, B]) 我希望输出是: 0->3；1-> 7.8 pandas有groupby功能，但我不知道如何实现它。谢谢

浏览 0提问于2017-11-13得票数 2

2回答

DataFrame: A列窗口内B列值的平均值

python、pandas、dataframe、mean、binning

如果我在Python中有一个熊猫DataFrame，如下所示： import numpy as np import pandas as pd a = np.random.uniform(0,10,20) b = np.random.uniform(0,1,20) data = np.vstack([a,b]).T df = pd.DataFrame(data) df.columns = ['A','B'] df.sort_values(by=['A']) A B 5 0.057519 0.4654

浏览 2提问于2019-04-03得票数 5

回答已采纳

2回答

在Python中创建“无泄漏”变量？

python-3.x、pandas

我有一个熊猫数据框架，有几千个观察，我想用Python创建“无泄漏”变量。因此，我正在寻找一种计算方法，例如，在第一行没有单一观察的情况下计算一个变量的特定组均值。例如： | Group | Price | leakage-free Group Mean | ------------------------------------------- | 1 | 20 | 25 | | 1 | 40 | 15 | | 1 | 10 | 30

浏览 0提问于2019-03-09得票数 1

回答已采纳

2回答

嵌套的for循环，使用值创建列

python、pandas、for-loop

我是python编程的新手。我将一个csv文件读到一个数据框中，每个月的房价中值作为列。现在，我想创建列来获取每个季度的平均值。例如，创建柱壳‘2000q1’作为2000-01、2000-02和2000-03的平均值，柱壳‘2000q2’作为2000-04、2000-05、2000-06的平均值]... 我尝试使用嵌套的for循环，如下所示，但总是出现错误。 for i in range (2000,2017): for j in range (1,5): Housing[i 'q' j] = Housing[[i'-'j*3

浏览 0提问于2017-03-27得票数 0

2回答

从python的对数正态分布生成随机数

python、numpy、scipy

我需要从Python的对数正态分布中生成伪随机数。问题是，我从模式和对数正态分布的标准差开始。我没有对数正态分布的平均值或中值，也没有任何基本正态分布的参数。采用基础正态分布的均值和标准差。我试着用我的参数来计算这些，但最后得到了一个四次函数。它有一个解决办法，但我希望有一个更直截了当的办法。采用我不理解的参数。我不是一个以英语为母语的人，而且这些文件也没有意义。你能帮帮我吗？

浏览 3提问于2017-01-04得票数 10

回答已采纳

2回答

熊猫:一列中每一个值出现在另一列中的次数

python、pandas

我希望计数子列中值出现在父列中的次数，然后在新列重命名子计数中显示此计数。见下面的预览df。我已经通过VBA (COUNTIFS)完成了这一工作，但是现在需要动态可视化和动画显示，使用从dir输入的数据。因此，我求助于Python和Pandas，在搜索和阅读了答案之后，尝试了下面的代码，比如： \\、、\\、\{e76f}许多其他的.但仍然不能得到预期的预览，如下图所示。任何帮助都将不胜感激。提前谢谢。 #import libraries import pandas as pd import numpy as np import os #get datasets path_dataset

浏览 4提问于2020-06-19得票数 0

回答已采纳

1回答

什么是粉刷-修剪平均过滤器？

python、algorithm、opencv、image-processing、definition

我理解均值滤波器，它取核像素的平均值，也理解中值滤波器，它取核像素的中值(对所有值进行排序，取内核的中间值)。 Alpah-修剪平均滤波器给出了均值和中值滤波器的混合。输出是我不明白这个过滤器是怎么回事。有人能解释清楚这个过滤器吗？

浏览 2提问于2020-09-18得票数 3

回答已采纳

1回答

熊猫枢轴表嵌套集

python、pandas、pivot-table

我正在尝试创建一个支点表，用于统计表单的数量以及从该计数中计算的和、平均值和中位数。但是，表单dtype是绝对的，我不能在非数字值上使用均值和中值函数。我想使用'Form‘：count作为我的值进行聚合。如果我在第一个aggfunc中包含平均值，我就会得到这个错误。 DataError: No numeric types to aggregate 在创建枢轴表时，是否有一种方法可以在枢轴表中嵌套aggfuncts或更改dtype？我尝试过使用.astype(int)，但似乎无法理解该函数的语法。下面的虚拟代码并不完全准确，但我可以继续做下去。 df = pd.DataFrame

浏览 0提问于2019-10-08得票数 0

回答已采纳

1回答

如何在scipy.stats中获取配送模式

python、scipy、statistics、distribution

scipy.stats库的功能是找出拟合分布的均值和中值，而不是模式。如果我在拟合数据后有一个分布的参数，我如何才能找到拟合分布的mode？

浏览 1提问于2020-01-09得票数 6

回答已采纳

1回答

如何在pandas中找到多列的非零中值/均值？

python、pandas、aggregate-functions、median、summarization

我有一个很长的列列表，我想要一次计算出非零中值、均值和标准差。我不能删除基于1列的带有0的行，因为同一列中另一列的值可能不是0。下面是我目前拥有的代码，它计算包括零在内的中位数，平均值等。 agg_list_oper={'ABC1':[max,np.std,np.mean,np.median], 'ABC2':[max,np.std,np.mean,np.median], 'ABC3':[max,np.std,np.mean,np.median], 'ABC4':[max,np.std,np.me

浏览 5提问于2016-08-18得票数 1

回答已采纳

2回答

需要使用使用pandas.str()的字符串列表从列中选择值

python、pandas

需要从字符串列表中搜索字符串列值。搜索列表中的字符串仅是列中值的子字符串。 df = pd.DataFrame(data={'text':['abc def', 'def ghi', 'poi opo', 'aswwf', 'abcs sd'], 'id':[1, 2, 3, 4, 5]}) Out [1]: text id 0 abc def 1 1 def ghi 2 2 poi opo 3 3 aswwf 4 4 abcs s

浏览 0提问于2019-05-28得票数 0

回答已采纳

1回答

应用数据过滤算法计算额定值场平均值

python、pandas、list、dataframe、series

我在这里添加了图像，显示数据中不同的列，所以基本上，我想根据数据类型字段中存在的值戏剧来计算评分字段的平均值，这意味着我将计算类型字段中包含戏剧的行的平均评级，那么如何做呢？

浏览 5提问于2022-11-16得票数 -1

1回答

尝试使用非唯一列的条件来生成伪代码以应用于大熊猫。

python、pandas

我是StackOverflow，python和熊猫的新手，我正在探索编码的思想过程。我从来没有在这里问过问题，所以如果我搞砸了提问的格式，我很抱歉。我的场景是，我有一个产品列表，作为一个数据框架，我将它与另一个名为ordered_products的表(join)合并，使用product_ID作为相互键。我对这个数据集的问题是，有多少订单只有有机产品？现在当有人订购杂货时，一个order_ID可以有多个条目。我正在尝试编写一个循环伪代码： counter = 0 break the table to group by order_id For each group{ For eac

浏览 2提问于2019-12-07得票数 2

回答已采纳

1回答

在Pandas中使用groupby执行多个case when语句的有效方法

python、pandas

我正试着在Pandas中高效地做这样的事情 SQL版本 select account_ID ,sum(case when FAIL = 1 then 1 else 0 end) as Fail ,sum(case when SUCCESS = 1 then 1 else 0 end) as Success ,sum(case when Reason LIKE '%Hard%' or Reason LIKE '%Missed%' then 1 else 0) as Reason from df group by account_ID 熊猫版 a= df.grou

浏览 194提问于2020-08-18得票数 0

回答已采纳

3回答

为什么均值和中值对于分布良好的数据集是相似的？

mean

我曾经读过，当考虑分布良好的变量时，中值和平均值往往是相似的，但无法从数学上解释为什么会这样。

浏览 0提问于2022-03-20得票数 -1

1回答

熊猫从聚集中计算方差

python、pandas、variance

我有一个包含以下列的数据框架：Date、ID和Value。我需要在Value上执行均值、中值和方差，我使用了这样的.agg： df = dataset\ .groupby(['ID', pd.Grouper(key='Date', freq='60T')])['Value']\ .agg(['mean', 'median', 'var'])\ .reset_index() 它成功地计算了平均值，但是当它需要计算中位数时，它只是重复平均值，而不存储或创建var列

浏览 0提问于2019-09-08得票数 2

回答已采纳

2回答

计算熊猫的日平均值

python、pandas、datetime、group-by、pandas-groupby

我有一个函数，它将计算出在同一天的熊猫数据栏"A“中值的平均值。是否有比最后一行中的列表理解更有效的方法来做到这一点？ import pandas as pd import numpy as np def daily_mean(df,date,col): return df[date][col].mean() data = np.random.rand(100) columns = ['A'] times = pd.date_range('20180101',freq='9H',periods=100) df = pd.Da

浏览 0提问于2018-10-01得票数 2

回答已采纳

1回答

遍历列表并生成分组框图

pandas、boxplot

我有一个DataFrame，并希望为选择特定标签的数据(列表框图)制作分组盒图。盒图应该显示值，并添加一行，显示每组框图中值的平均值。 import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(0,30,size=(100, 4)), columns=list('ABCD')) label = ['A','B','C','D','E','F'] df['label'] = np

浏览 1提问于2018-03-16得票数 0

回答已采纳

1回答

如何对熊猫数据帧进行重新采样以模拟平均一周？

python、pandas、dataframe、resampling

我有一个消息数量和发送时间段的数据帧(以10分钟为增量)。下面是一段代码： +---------------------+--------------+ | UnixTime | Num messages | +---------------------+--------------+ | 2019-02-01 00:00:00 | 54 | | 2019-02-01 00:10:00 | 23 | | 2019-02-01 00:20:00 | 36 | +---------------------+----

浏览 31提问于2019-05-29得票数 1

回答已采纳

1回答

来自非数值数据帧的平均值和SD

我想找出数据框架中值的平均值和标准差， > print(Data) Description X24386 0 A 65.8751 1 A 152.6380 2 A 90.0535 3 A NA 4 B 74.4218 5 B 77.7234 6 B 79.7033 7 B 72.5045 8 C 79.3704 9 C 81.9795 使用dc

浏览 1提问于2018-08-22得票数 1

回答已采纳

1回答

为什么“中位数”比使用统计软件包的“平均数”快2倍？

python、python-3.x、numpy、statistics

这让我吃惊..。为了说明，我使用了这个小代码来计算1M个随机数的平均值和中位数： import numpy as np import statistics as st import time listofrandnum = np.random.rand(1000000,) t = time.time() print('mean is:', st.mean(listofrandnum)) print('time to calc mean:', time.time()-t) print('\n') t = time.time() print

浏览 0提问于2016-06-24得票数 4

回答已采纳

1回答

使用匹配的字符串对从DataFrame中筛选行

python、pandas、dataframe、logical-operators

我需要从包含匹配的字符串对的dataframe中筛选行。例如，如果下面的实例在仅过滤if 1和2的数据时保持为3，则对于“0月份”条目没有相应的“3个月”： df = pd.DataFrame({'ID':[1,2,3,1,2,1], 'Period':['0 Month','0 Month','0 Month','3 Month','3 Month','6 Month']}) OR操作可以很容易地用于对2个字符串进行筛选，如下所示，但如果没有必要的对，则不会删除ID

浏览 9提问于2022-01-28得票数 0

回答已采纳

1回答

如何才能得到所有行都包含某种模式的熊猫群？

python、python-3.x、pandas、dataframe

示例csv文件： myId tags 0 id_1 \N 1 id_1 \N 2 id_1 \N 3 id_1 \N 4 id_2 "[""tag1""]" 5 id_2 "[""tag1""]" 6 id_2 "[""tag0"",""tag1""]" 7 id_3 \N 8 id_3 \N 9 id_3

浏览 5提问于2022-01-01得票数 1

回答已采纳

1回答

仅使用pandas查找月末日期数据的平均值

python、excel、pandas

我有一份公司名称、日期和市盈率的清单。我需要找到给定日期的前10年数据的平均值，以便只考虑月末日期。例如，如果我需要查找2015年12月31日的平均值.....我需要首先找到从2005年12月31日到2015年12月31日的所有前几个月的数据。然后是他们的平均值。所需输出：这是我到目前为止所做的…… df = pd.read_csv('daily_valuation_ratios_cc.csv') df['date'] = pd.to_datetime(df['date']) df = df.set_index('date&#

浏览 5提问于2020-05-12得票数 0

回答已采纳

1回答

列出所有可能的列组合的平均值

python、pandas、dataframe、numpy、mean

我有一个如下所示的数据集： Value Type country mean -1.975767 Weather Brazil -0.540979 Fruits China -2.359127 Fruits China -2.815604 Corona China -0.712323 Weather UK -0.929755 Weather Brazil 我想为类型和国家的所有不同组合计算一个总体平均值。例如：巴西的天气平均值是= (-1.975767 -0.929755)

浏览 1提问于2022-02-15得票数 0

回答已采纳

1回答

用蟒蛇和熊猫计算分组平均数

python、pandas

Lat Lon Year Area Value group_a group_b -31.3484 -60.0629 2019 70 24 a ia -26.8443 -64.5456 2020 492 12 a ia -27.6536 -62.2072 2017 173 111 b md -26.4552 -61.4804 2020 255 76 b ct -35.6044 -63.5238 2019 204 12 a de

浏览 1提问于2022-08-08得票数 0

回答已采纳

1回答

如何将熊猫数据按栏标题分组，并运行摘要统计法？[python]

pandas

我正试图从一个dataframe中创建一个汇总统计表，并且很难理解如何正确地将列分组。我有以下数据： Year Value_1 Value 2 ------------------------------------ 0 2012 43 34 1 2012 45 24 2 2012 35 44 3 2012 32 44 4 2012 35

浏览 1提问于2022-05-25得票数 0

回答已采纳

2回答

基于字符串匹配的数据集条目筛选

pandas、string

我正在处理化学公式(str对象)的数据。示例 formula Na0.2Cl0.4O0.7Rb1 Hg0.04Mg0.2Ag2O4 Rb0.2AgO ... 我想根据指定的元素过滤掉它。例如，我希望生成一个只包含'Na','Cl','Rb'元素的输出，因此所需的输出结果应该是： formula Na0.2Cl0.4O0.7Rb1 我想做的是： for i, formula in enumerate(df['formula']) if ('Na' and 'Cl' and 'R

浏览 1提问于2022-03-11得票数 0

1回答

当列车/测试是真正的i.i.d.时，信息泄漏。

machine-learning、data-mining、statistics、cross-validation、data-leakage

我非常清楚，为了避免信息泄漏，建议对训练数据集上的任何转换(例如标准化或基于中值的估算)进行拟合，并将其应用于测试数据集。然而。我不清楚，如果数据是iid，而训练/测试拆分确实是随机的，那么将这些转换应用于整个数据集的风险是什么？例如，如果原始数据集具有一定的统计特性(例如，均值、中值和std)，那么我将期望随机数据溢出，生成具有相同统计特性的训练和测试数据集。因此，对整个数据集进行标准化，然后再进行分割，可以产生与分割数据集、基于列车数据库的标准化和转换测试数据集相同的结果。对于基于中值的估算，也可以使用相同的参数。我是不是遗漏了什么？

浏览 0提问于2021-02-04得票数 2

回答已采纳

2回答

基于行值的Pandas DF中多个列片的操作

python、pandas、numpy、slice

我正在处理一些非常庞大的数据数组，这些数据是我在Pandas DataFrame中组织的。我的一个例子或多或少是这样的 >>> pd.DataFrame({'vp':aux_vp,'vs':aux_vs,'den':aux_den,'layer':facies_vol}) vp layer 0 5163.788741 0.0 1 5062.234019 0.0 2 4869.894684 0.0 3 9126.54

浏览 5提问于2020-10-29得票数 0

回答已采纳

4回答

时间序列:离群点检测

machine-learning、python、time-series、anomaly-detection、outlier

我有时间序列数据，看上去像下面提到的图表。我熟悉根据标准差和中值消除异常值的方法。这些方法的缺点是它们不考虑相邻的数据点。例如，在下面显示的数据中，我不想删除那些与平均值相差最大或标准差的值。我想移除在红色中圈起来的点。其他极端值在该地区是常见的，不应被检测为孤立点，因为这些数据点附近有相似的数据点。是否有任何方法来移除这些点，或者是否有任何python库可以用来删除这些点。正常的标准偏差和中值滤波器不能很好地解决这些问题，因为它们也消除了没有被圈住的点。 📷

浏览 0提问于2019-06-07得票数 3

2回答

将spark数据帧中的多行合并为一行

apache-spark、dataframe、apache-spark-sql、rdd

我有一个有2列的数据帧:时间戳，值时间戳是从纪元开始的时间，值是浮点值。我想将行合并为按最小值计算的平均值。这意味着我想要将时间戳来自相同的舍入分钟(从纪元开始的60秒间隔)的所有行合并到单个行，其中值列将是所有值的平均值。举个例子，假设我的dataframe是这样的： timestamp value --------- ----- 1441637160 10.0 1441637170 20.0 1441637180 30.0 1441637210 40.0 1441637220 10.0 1441637230

浏览 0提问于2015-09-07得票数 11

回答已采纳

1回答

熊猫为每个ID选择每小时的值

python、pandas、hour

我有一个数据帧，其中我有一些ID，对于每个ID，我有一些值和时间戳(连续5到7天，每5分钟大约有一个值)。我想为每个小时和每个ID选择该小时的平均值、中位数和方差，并将它们存储在不同的列中，如以下结果所示： hour mean var median ID 0 2 4 4 1234 1 4 5 3 1234 ... 23 2 2 3 1234 我的专栏有： ID int64 Value

浏览 14提问于2019-09-07得票数 0

回答已采纳

1回答

动态分组Pandas列

python、pandas

全, 我有一个关于基于名称分组Pandas列的问题。我正在处理气候模型数据，并且我手头有两个索引-一个为每个模型成员提供唯一的名称(例如，以A、B、C等开头)。以及每个模型成员内具有不同模拟的一个(例如，成员'A‘可以包含AA、AB、AC等)。我想对以特定字符串开头的所有列进行分组(例如，我希望根据AA、AB、AC的开头对它们进行分组)。模拟组的长度不相等，因此我不能基于设置的间隔进行分组。对于可以解决这个问题的代码有什么见解吗？

浏览 37提问于2021-10-28得票数 0

1回答

有没有办法一步一步地对统计量进行分组和计算？

python、pandas、dataframe、group-by

我知道我可以单独计算唯一计数、均值、中值、峰度和偏斜度，然后合并成一个数据，但与R data.table相比，这是很多步骤，您可以在一步内计算所有这些数据。有什么办法可以在Python中一步一步地计算出groupby吗？ df <- data[,.(ItemCount= uniqueN(Item), Median_val = median(Value), Avg_val = mean(Value), Skew_val = skewness(Value), Kurt_val = kurt

浏览 1提问于2021-09-15得票数 1

回答已采纳

1回答

测试用例失败--竞争编程中提出的平均中值模式问题

java、algorithm

在一次公司入学考试中，我考到了下面的问题。除4例外，其余病例均顺利通过。有人能注意到什么是可能的情况，可能会失败吗？问题和解决办法如下：均值、中值和模式给定“n”整数，求出它们的平均中值和模式。请求您填写一个函数，该函数接受输入整数 'input1‘ (1<=input1<=1000)和包含’input1‘整数的整数数组input2[]，并返回output1作为平均值output2作为中间值，output1 3<code>E 211</code>作为模式。平均和中位数必须正确到小数点六位。均值:定义为数组中所有数字的平均值的。中位数:定义为

浏览 0提问于2021-02-07得票数 2

回答已采纳

5回答

在Matlab中实现图像平滑的均值滤波

matlab、image-processing、filtering

我需要在Matlab中测试一些基本的图像处理技术。我需要测试和比较两种类型的滤波器:均值滤波器和中值滤波器。为了使用中值滤波对图像进行平滑处理，图像处理工具箱中有一个强大的函数medfilt2。均值滤波有没有类似的函数？或者如何使用filter2函数创建均值过滤器？对我来说，最重要的事情之一是有可能设置滤镜的半径。例如，对于中值滤波器，如果我想要3 x 3半径(掩码)，我只需使用 imSmoothed = medfilt2(img, [3 3]); 我想要为均值过滤器实现类似的东西。

浏览 2提问于2009-11-16得票数 16

回答已采纳

1回答